Несколько способов выделить корпоративные адреса из базы электронной почты:
- Использовать нейронную сеть. yandex.ru Нужно собрать базу email-адресов из открытого доступа и разметить, где корпоративный адрес, а где физический. yandex.ru Для начала следует попробовать объём до 1000 адресов, если точность не удовлетворяет, то нужно увеличить базу. yandex.ru Затем создать нейронную сеть и обучить её на этой базе. yandex.ru Если точность устраивает, то можно получить код предобработки и обученную модель нейронной сети и загрузить свою базу с адресами. yandex.ru В результате получится база с отметками (например, 0 или 1) о корпоративном статусе адреса. yandex.ru
- Вовлечь сотрудника. yandex.ru Нужно дать часть базы, и сотрудник вручную сделает разметку корпоративных и физических адресов. yandex.ru Нейронщик в удалённом режиме будет работать на компьютере, то есть физически не получит доступ к данным. yandex.ru Если точность устраивает, то написанным кодом можно запустить в обработку остальную часть базы и получить результат. yandex.ru
Также для выделения корпоративных адресов из базы электронной почты можно использовать email-парсеры. uguide.ru Это специальный софт, который в многопоточном режиме анализирует контент сайтов и отдельных их страниц, вычленяя в них адреса электронной почты и занося найденные email в специальную базу для дальнейшей работы. uguide.ru