Несколько способов выделить корпоративные адреса из базы электронной почты:
- Использовать нейронную сеть. 1 Нужно собрать базу email-адресов из открытого доступа и разметить, где корпоративный адрес, а где физический. 1 Для начала следует попробовать объём до 1000 адресов, если точность не удовлетворяет, то нужно увеличить базу. 1 Затем создать нейронную сеть и обучить её на этой базе. 1 Если точность устраивает, то можно получить код предобработки и обученную модель нейронной сети и загрузить свою базу с адресами. 1 В результате получится база с отметками (например, 0 или 1) о корпоративном статусе адреса. 1
- Вовлечь сотрудника. 1 Нужно дать часть базы, и сотрудник вручную сделает разметку корпоративных и физических адресов. 1 Нейронщик в удалённом режиме будет работать на компьютере, то есть физически не получит доступ к данным. 1 Если точность устраивает, то написанным кодом можно запустить в обработку остальную часть базы и получить результат. 1
Также для выделения корпоративных адресов из базы электронной почты можно использовать email-парсеры. 2 Это специальный софт, который в многопоточном режиме анализирует контент сайтов и отдельных их страниц, вычленяя в них адреса электронной почты и занося найденные email в специальную базу для дальнейшей работы. 2