Возможно, имелись в виду алгоритмы оптического распознавания символов (OCR), которые используются в системах, обрабатывающих отсканированные документы. spravochnick.ru www.itransition.com
Процесс распознавания текста включает несколько этапов: www.itransition.com
- Получение изображения. www.itransition.com Решение использует оптический сканер, который собирает не редактируемый текстовый контент из документов разных типов и превращает его в двоичные данные, читаемые машиной. www.itransition.com
- Предварительная обработка. habr.com www.itransition.com Программа очищает исходное изображение, чтобы текст было легче распознать, а шум был уменьшен или устранён. www.itransition.com
- Распознавание текста. www.itransition.com Система сканирует содержимое изображения, чтобы определить группы пикселей, которые, вероятно, составляют отдельные символы, и назначает их к классу. www.itransition.com
- Пост-обработка. www.itransition.com После обработки система OCR преобразует извлечённые текстовые данные в простой файл символов или, в случае более продвинутых решений, в аннотированный PDF-файл, который сохраняет исходную структуру страницы. www.itransition.com
Для распознавания флажков, возможно, используются ICR-системы (intelligent character recognition), которые предназначены для обработки документов, заполненных печатными символами и цифрами от руки. spravochnick.ru Процесс заключается в сравнении области изображения (каждой галочки) с некоторой «базовой линией», чтобы увидеть, есть ли дополнительные рукописные записи для этой области. stackoverflow.com Если превышен некоторый порог, то флажок установлен. stackoverflow.com