Парсинг — это автоматизированный сбор и систематизация информации из открытых источников с помощью скриптов. 3 Для него используют специальные программы — парсеры, которые отбирают с сайтов информацию по заданным критериям. 2
Процесс парсинга включает в себя три этапа: 5
- Парсер сканирует исходные данные — HTML-код, базу данных, массив электронных писем по ключевым словам. 5
- Далее программа вычленяет смысловые единицы — пункты меню, ссылки, цены, наименования товаров и т.д.. 5
- Пользователь получает сконвертированный объём данных в нужном формате — например, в виде структурированной таблицы Excel. 5
Парсинг может применяться в различных областях, например:
- В интернет-маркетинге парсинг позволяет собирать данные о товарах и ценах со множества веб-сайтов для анализа и принятия решений о конкурентной стратегии. 1
- В научных исследованиях парсинг используется для обработки и анализа больших объёмов данных или для создания автоматизированных систем синтеза информации. 1
- В области разработки программного обеспечения парсинг может быть полезен в автоматическом тестировании и создании приложений с использованием сторонних API. 1