Алгоритм обработки мультитрековых аудиофайлов в социальных сетях может включать следующие этапы: vk.com
- Генерация акустического отпечатка. vk.com Движок для генерации отпечатков работает на каждом сервере для загрузки аудио. vk.com Он принимает на вход mp3-файл, обрабатывает его (декодирование, FFT, выделение пиков спектра) и выдаёт акустический отпечаток этого аудио. vk.com
- Индексирование и поиск. vk.com Эту задачу решает отдельный движок индексирования и поиска. vk.com Он хранит данные об отпечатках в виде обратных (инвертированных) индексов. vk.com
- Сравнение отпечатков. vk.com В движок поиска приходит запрос с аудиозаписью, и нужно найти похожие на неё треки. vk.com Из хранилища скачивается отпечаток для этого аудио. vk.com В индексе выбираются строчки, содержащие хэши этого отпечатка. vk.com Из соответствующих строк выбираются часто встречающиеся треки, для них скачиваются отпечатки из хранилища. vk.com Эти отпечатки сравниваются с отпечатком исходного файла. vk.com В результате возвращаются самые похожие треки с соответствующими совпавшими фрагментами и условным «коэффициентом сходства» для этих фрагментов. vk.com
Также для обработки аудиофайлов могут использоваться нейросети, которые позволяют, например, улучшать качество звука, удаляя шумы и восстанавливая потерянные аудиоданные. sky.pro