Принцип работы технологии OCR в ABBYY FineReader заключается в следующем: pdf.abbyy.com
- Импорт файла. anderbot.com При помощи интерфейса TWAIN или WIA API файл импортируется в базу. anderbot.com Считывание работает даже напрямую из памяти компьютера (например, текущий экран компьютера, смартфона). anderbot.com
- Повышение качества изображения. anderbot.com Повышается контрастность и чёткость изображения. anderbot.com
- Анализ структуры документа. pdf.abbyy.com Программа разбивает страницу на элементы: блоки текста, таблицы, изображения и т. д.. pdf.abbyy.com Строки делятся на слова, а затем — на символы. pdf.abbyy.com
- Сравнение символов с набором шаблонных изображений. pdf.abbyy.com Программа выдвигает множество гипотез о том, на что похож обнаруженный символ. 3dnews.ru
- Анализ на основе гипотез. pdf.abbyy.com Программа анализирует разные варианты деления строк на слова, а слов — на символы. pdf.abbyy.com
- Принятие решения. pdf.abbyy.com После обработки огромного количества вероятностных гипотез программа выдаёт распознанный текст. pdf.abbyy.com
Кроме того, ABBYY FineReader предоставляет словарную поддержку для 48 языков. pdf.abbyy.com Это позволяет проводить вторичный анализ элементов текста на уровне слов. pdf.abbyy.com Словарная поддержка обеспечивает более точный анализ и распознавание документов, а также упрощает дальнейшую проверку результатов распознавания. pdf.abbyy.com