Разница между оптическим распознаванием и традиционным сканированием документов заключается в процессе и целях работы.
Традиционное сканирование заключается в получении цифровой копии бумажного документа — текста, графики, рисунка, фотографии. 5 Сканер освещает оригинальный документ источником света, отражённые лучи улавливаются фотоприёмником, который трансформирует их интенсивность в напряжение соответствующего значения. 8 Аналоговые сигналы преобразуются в цифровой вид, что позволяет работать с ними на компьютере. 8
Оптическое распознавание символов (OCR) — это преобразование различных типов документов, включая отсканированные изображения, фотографии и PDF-файлы, в редактируемый и копируемый текст. 6 Процесс начинается с захвата изображения документа с помощью сканера или цифровой камеры. 6 Затем алгоритмы ИИ работают с изображением, анализируя структуру и форму документа и символы на нём, определяют границы слов, распознают руко- и машинописные начертания букв, цифр, знаков препинания и многое другое. 6
Таким образом, традиционное сканирование фокусируется на создании цифрового изображения документа, в то время как OCR — на автоматическом преобразовании текстовой информации из различных источников в редактируемый формат.