Технология распознавания текста отличается от простого оптического сканирования тем, что она позволяет автоматически анализировать текст с изображений и переводить его в формат, с которым может работать компьютер. 4
Сканирование — технологический процесс, в результате которого создаётся графический образ бумажного документа. 2 Отсканированное изображение не является текстовым, а лишь набором разноцветных точек. 2
Технология распознавания текста (оптическое распознавание символов, OCR) включает в себя несколько этапов: 4
Для улучшения точности распознавания текста и обработки более сложных документов OCR-системы могут использовать дополнительные технологии, такие как искусственный интеллект и глубокое обучение. 4