Распознавание текста и сканирование документов отличаются по своему процессу и результату. 47
Сканирование — это перевод текста с бумажного или подобного носителя в электронную форму в виде картинки, где текст не является последовательностью символов (поэтому его нельзя редактировать — исправить ошибки, заменить слова, изменить шрифт и т. п.). 1
Распознавание — это процесс перевода графического изображения символов (букв) в компьютерные текстовые символы. 4 Для этого с помощью специализированных программ анализируется структура документов, затем текст распознаётся, проверяется и корректируется вручную. 4 В результате получается редактируемая копия оригинала, которую можно работать с текстом привычным образом в текстовом редакторе. 4
Таким образом, основное отличие в том, что сканирование создаёт электронную копию документа в виде картинки, а распознавание преобразует эту картинку в текстовый файл, который можно редактировать и индексировать. 12