Алгоритм синтаксического анализа в Pyparsing включает три этапа: texnolog.org xgu.ru
- Определение грамматики исходного текста. texnolog.org xgu.ru Грамматика — это способ описания формального языка, в котором последовательности допустимых символов несут смысловую нагрузку. texnolog.org Лексемы формируются из отдельных групп символов — токенов. texnolog.org
- Применение грамматики к исходному тексту. texnolog.org xgu.ru Обычно для этого используют вызов функции parseString или scanString. texnolog.org xgu.ru
- Анализ полученных результатов в виде списка. texnolog.org xgu.ru
С помощью модуля Pyparsing сначала определяют базовые части грамматики, а затем комбинируют их в более сложные выражения для различных ветвей полного грамматического синтаксиса. netsago.org
Комбинирование возможно с помощью определения связей, таких как: netsago.org
- Какие выражения должны следовать друг за другом в грамматике, например: «за ключевым словом if следует булево выражение, заключённое в скобки». netsago.org
- Какие выражения являются заменами друг друга в определённом случае в грамматике, например: «команда SQL может начинаться со слов SELECT, INSERT, UPDATE или DELETE». netsago.org
- Какие выражения являются необязательными, например: «телефонный номер необязательно начинается с кода города, заключённого в скобки». netsago.org
- Какие выражения являются повторяющимися, например: «открытый тег XML может содержать ноль или более атрибутов». netsago.org
По умолчанию Pyparsing игнорирует все лишние пробелы и переводы строк между элементами разбираемого текста. s.arboreus.com