OCR-технология (оптическое распознавание символов) преобразует изображения, содержащие текст, в машинно-читаемые данные. 4
Алгоритм работы OCR включает несколько этапов: 5
В системах математического распознавания OCR-технология сталкивается со сложной задачей, так как формулы имеют двумерную структуру (дроби, индексы, суммы, вложенные выражения). 23
Для решения этой задачи используются специализированные системы, которые благодаря достижениям глубокого обучения способны преобразовывать изображение формулы в разметку LaTeX/MathML с высокой точностью. 23 Некоторые из таких систем: PaddleOCR, Pix2Tex, MathPix и другие. 23