Система автоматического распознавания документов в современных паспортных центрах работает на основе искусственного интеллекта и машинного обучения. 3
Процесс включает несколько этапов: 3
- Классификация документа. 3 Искусственный интеллект удаляет ненужный фон, преобразует изображение в вертикальный формат, выравнивает его и вырезает документ. 3 Затем алгоритм машинного обучения определяет, что перед ним находится: паспорт, водительское удостоверение и т. д.. 3
- Извлечение данных. 3 Алгоритм разделяет изображение документа на отдельные части. 3 Если рассматривать паспорт, то это имя, фамилия, дата и место рождения, серия, номер, место и дата выдачи. 3
- Проверка данных. 3 Нейросеть пытается предсказать, что написано внутри каждого поля: она сравнивается, насколько то или иное слово похоже на то, что уже когда-то видела. 3 Если алгоритм сомневается в результатах, то поле отправляется на проверку человеку. 3
- Верификация данных. 3 Для верификации данных может использоваться информация из общедоступных баз. 3 Например, с помощью сервиса МВД России легко проверить действительность паспорта по его серии и номеру. 3
- Сбор и передача данных. 3 Когда все данные извлечены и проверены, они собираются и передаются в базу данных или бизнес-процесс. 3
Некоторые системы автоматического распознавания документов, например Smart ID Engine, также умеют выявлять поддельные документы. 24 Алгоритмы проверяют оригинальность бланка документа, целостность его элементов защиты, а также находят переклейки, перепечатки и другие признаки механического вмешательства. 2