Основное отличие сканирования с распознаванием текста от обычного сканирования PDF-файлов заключается в возможностях, которые появляются после обработки.
Обычное сканирование создаёт PDF-файл, в котором содержимое «заблокировано» в виде изображения без базового текстового слоя. 5 Такие файлы нельзя выделить, скопировать или выполнить поиск, а редактирование или разметка текста невозможны без преобразования документа. 5
Сканирование с распознаванием текста (OCR, оптическое распознавание символов) позволяет преобразовать изображения текста в редактируемый формат. 12 После обработки под изображением помещается текстовый слой, что делает документ доступным для поиска и редактирования. 5
Таким образом, OCR-сканирование расширяет возможности работы с PDF-файлами, позволяя извлекать текст, редактировать его и сохранять в привычном формате. 2