Некоторые особенности систем обнаружения дубликатов пользователей в социальных сетях:
- Сбор и верификация личных данных. neerc.ifmo.ru Это важно для сопоставления виртуальных пользователей с реальными личностями и выявления разных аккаунтов одного и того же человека. neerc.ifmo.ru Для верификации сравнивают анкетные данные с информацией из разных независимых источников, например IP-адресами, геолокацией и временем оставляемых сообщений. neerc.ifmo.ru
- Анализ достоверности фотографий. neerc.ifmo.ru Достоверность фотографии подтверждают путём сравнения её с лицами, представленными на других фотографиях и видеозаписях аккаунта. neerc.ifmo.ru Также осуществляется поиск по фотографиям и видеозаписям, выложенным в аккаунтах друзей. neerc.ifmo.ru
- Попарное сравнение изображений. cyberleninka.ru Для этого применяют не только основные изображения профиля пользователя, но и любые элементы графического контента, публикуемые в его аккаунте. cyberleninka.ru Для сравнения используют метод перцептивного хэша pHash. cyberleninka.ru
- Анализ тематики сообщений. neerc.ifmo.ru Во внимание берут посты, комментарии, лайки и дизлайки, анализируют ссылки на группу в тематических контентах и интересы других пользователей этих групп. neerc.ifmo.ru
Также для обнаружения похожих пользователей могут использоваться показатели сходства на основе хэштегов, упоминаний, URL-адресов и других факторов. journalofbigdata.springeropen.com