Распознавание текста из сканов считается сложной задачей для машинного обучения по нескольким причинам:
- Позиция текста. 2 Он не всегда занимает всё изображение, может находиться в случайном месте, быть повёрнутым и искажённым. 24
- Шум. 4 Блики, отдалённость текста и прочие артефакты добавляют сложности при обнаружении текста и его распознавании. 4
- Разнообразие шрифтов. 2 Среди них есть и редкие шрифты. 2
- Разнообразие алфавитов. 2 Модель, обученная распознавать английский язык, не справится с каким-либо другим алфавитом. 4
- Искажение текста при сканировании. 2 Например, засвет, плохо напечатанный или частично стёртый текст. 2
Кроме того, при повышенной сложности документа (много сносок, объединённых ячеек в таблице, графики и пр.) шансы на ошибку растут. 1