Преимущества оптического распознавания текста (OCR) при конвертации PDF:
- Удобство. 1 Копирование информации из отсканированного документа занимает несколько минут, вместо того чтобы перепечатывать страницы вручную. 1
- Возможность внесения изменений. 1 Например, можно исправить ошибки в файле. 1
- Упрощение каталогизации и индексации архива. 5 Оцифрованный контент можно сделать доступным для редактирования или поиска, что упрощает работу с архивами документов. 5
Недостатки OCR при конвертации PDF:
- Зависимость от качества используемого материала. 1 Труднее всего работать со сканами старых книг: в них выцветают страницы, появляются повреждения. 1 Иногда во время сканирования появляются засветы, текст смазывается. 1 При обработке таких объектов могут возникнуть неточности. 1
- Неверный выбор языковых параметров. 4 Если кодировка языка отлична от латиницы (например, японский), то неверный выбор языковых параметров приведёт к невозможности распознавания и преобразования текста с помощью модуля OCR. 4