Возможно, имелась в виду система распознавания текста, которая использовалась в сервисе «Яндекс.Диск». 12 Она состояла из двух частей: классификатора картинок и модуля распознавания. 12
Процесс работы: 1
- Классификатор (глубокая нейронная сеть) отбирает из всех картинок те, на которых изображён текст. 1 Он учится отличать их от прочих на огромной базе изображений. 1
- Алгоритм находит на отобранных изображениях линии, предположительно содержащие текст. 1 Различать их помогает ещё одна нейронная сеть. 1
- Алгоритм оставляет только те линии текста, в которых он уверен. 1
- Модуль распознавания разбивает линии текста на отдельные символы. 1 Для каждого символа алгоритм выбирает несколько наиболее вероятных вариантов распознавания среди известных ему. 1
- Языковая модель принимает решение, какой из символов-кандидатов подходит лучше всего. 1 Она опирается на словари и учитывает не только сходство символов с теми, что знает система, но и контекст, то есть соседние символы. 1
Точность распознавания текста зависит от типа изображения, его чёткости, фона, на котором находится текст, и других факторов. 12