Система обнаружения музыкальных композиций во «ВКонтакте» основана на акустических отпечатках. 1 Это представление аудиосигнала в виде набора значений, описывающих его физические свойства. 1
Процесс работает так: 1
- На каждом сервере для загрузки аудио работает движок, который принимает на вход mp3-файл, обрабатывает его и выдаёт акустический отпечаток. 1
- Данные об отпечатках хранятся в виде обратных индексов. 1 Каждый отпечаток разбивается на хэши и сохраняется соответствие «хэш» — «список треков, в отпечатках которых он есть». 1
- В движок поиска приходит запрос с аудиозаписью, и нужно найти похожие на неё треки. 1
- Из хранилища скачивается отпечаток для этого аудио. 1
- В индексе выбираются строчки, содержащие хэши этого отпечатка. 1
- Из соответствующих строк выбираются часто встречающиеся треки, для них скачиваются отпечатки из хранилища. 1
- Эти отпечатки сравниваются с отпечатком исходного файла. 1
- В результате возвращаются самые похожие треки с соответствующими совпавшими фрагментами и условным «коэффициентом сходства» для этих фрагментов. 1
Кроме того, в 2023 году сообщалось, что в сервисе «VK Музыка» есть поиск по сниппетам — ключевым фрагментам треков длиной 35 секунд. 24 Алгоритм рекомендаций подбирает сниппеты на основе музыкальных предпочтений каждого пользователя. 24