Система распознавания документов, в том числе паспортов, работает на основе искусственного интеллекта и машинного обучения. blog.nebopro.ru Она помогает автоматизировать извлечение данных из документов и преобразовывать их в полезную информацию. blog.nebopro.ru
Процесс работы: blog.nebopro.ru
- Классификация документа. blog.nebopro.ru Искусственный интеллект удаляет ненужный фон, преобразует изображение в вертикальный формат, выравнивает его и вырезает документ. blog.nebopro.ru Затем алгоритм машинного обучения определяет, что перед ним находится: паспорт, водительское удостоверение или фото кота. blog.nebopro.ru
- Извлечение данных. blog.nebopro.ru Алгоритм разделяет изображение документа на отдельные части. blog.nebopro.ru Если рассматривать паспорт, то это имя, фамилия, дата и место рождения, серия, номер, место и дата выдачи. blog.nebopro.ru После этого нейросеть пытается предсказать, что написано внутри каждого поля: она сравнивает, насколько то или иное слово похоже на то, что уже когда-то видела. blog.nebopro.ru Если алгоритм сомневается в результатах, то поле отправляется на проверку человеку. blog.nebopro.ru
- Проверка данных. blog.nebopro.ru Для верификации данных может использоваться информация из общедоступных баз. blog.nebopro.ru Например, с помощью сервиса МВД России легко проверить действительность паспорта по его серии и номеру. blog.nebopro.ru
- Сбор и передача данных. blog.nebopro.ru Когда все данные извлечены и проверены, они собираются и передаются в базу данных или бизнес-процесс через API. blog.nebopro.ru
Например, в сервисе Dbrain клиенту не нужно ничего заполнять вручную — достаточно просто отправить фото документа. dbrain.io Распознанные данные автоматически попадут в систему. dbrain.io