Некоторые методы, которые используются для распознавания типов текста:
- Шаблонные методы. 14 Отсканированное изображение переводится в растровое (поточечное), затем производится его сравнение с эталонными шаблонами из базы данных. 1 Критерием выбора шаблона является наименьшее количество точек, отличных от исследуемого изображения. 1 Преимуществом шаблонных методов является высокая точность распознавания дефектных символов. 1 Основным недостатком является зависимость от шрифта, который встречается в изображении. 1
- Структурные методы. 1 Данная группа методов использует информацию не о поточечном написании символа, а о его топологии: взаимном расположении отдельных составных частей символа. 1 К преимуществам структурных методов распознавания можно отнести инвариантность относительно типов и размеров шрифтов. 1 Основной проблемой топологических методов является идентификация знаков, имеющих дефекты (например, разрыв линии или слияние соседних линий), а также невысокое быстродействие. 1
- Признаковые методы. 14 Анализ в них базируется на том, что изображению ставится в соответствие N-мерный вектор признаков. 1 Распознавание заключается в сравнении его с набором эталонных векторов той же размерности. 1 Качество распознавания зависит от типов признаков и их количеств. 1 Основными преимуществами данной группы являются простота реализации, хорошая обобщающая способность, устойчивость к изменениям формы символов, высокое быстродействие. 1
- Нейросетевые алгоритмы. 4 С развитием машинного обучения, а также нейронных сетей, всё чаще для распознавания символов используют алгоритмы, построенные с помощью нейронных сетей глубокого обучения. 4 Входными данными для нейросетевого метода являются изображения строк и слов. 4 Выходными данными — символы, идущие по порядку, формирующие машинный текст. 4 Основным преимуществом использования нейросетевых технологий является хорошая обобщающая способность, возможность использовать контекстный анализ и распознавать символ, основываясь на окружающие его символы. 1