Система распознавания документов, в том числе паспортов, работает на основе искусственного интеллекта и машинного обучения. 1 Она помогает автоматизировать извлечение данных из документов и преобразовывать их в полезную информацию. 1
Процесс работы: 1
- Классификация документа. 1 Искусственный интеллект удаляет ненужный фон, преобразует изображение в вертикальный формат, выравнивает его и вырезает документ. 1 Затем алгоритм машинного обучения определяет, что перед ним находится: паспорт, водительское удостоверение или фото кота. 1
- Извлечение данных. 1 Алгоритм разделяет изображение документа на отдельные части. 1 Если рассматривать паспорт, то это имя, фамилия, дата и место рождения, серия, номер, место и дата выдачи. 1 После этого нейросеть пытается предсказать, что написано внутри каждого поля: она сравнивает, насколько то или иное слово похоже на то, что уже когда-то видела. 1 Если алгоритм сомневается в результатах, то поле отправляется на проверку человеку. 1
- Проверка данных. 1 Для верификации данных может использоваться информация из общедоступных баз. 1 Например, с помощью сервиса МВД России легко проверить действительность паспорта по его серии и номеру. 1
- Сбор и передача данных. 1 Когда все данные извлечены и проверены, они собираются и передаются в базу данных или бизнес-процесс через API. 1
Например, в сервисе Dbrain клиенту не нужно ничего заполнять вручную — достаточно просто отправить фото документа. 2 Распознанные данные автоматически попадут в систему. 2