Система распознавания музыкальных отрывков на смартфонах работает на основе создания цифрового отпечатка композиции и сравнения его с базой данных. 15
Процесс включает несколько шагов: 2
- Расчёт спектрограммы аудиофайла. 2 Это график, который показывает частоту звука в зависимости от времени. 23
- Поиск пиков на спектрограмме. 2 Они отражают самые громкие частоты в аудиозаписи и помогают создать отпечаток. 2
- Хеширование пиков. 2 Пики составляются в пары для создания отпечатка. 2
- Сопоставление. 2 Отпечаток сравнивается с хешами, которые уже находятся в базе данных. 2
Например, в смартфонах Google Pixel для распознавания музыки используется функция «Сейчас исполняется». 1 Она считывает ключевые слова примерно раз в минуту, записывает фрагмент трека продолжительностью около 8 секунд и превращает его в цифровой отпечаток. 1 Затем этот отпечаток сравнивается с локальной базой данных, которая хранится на устройстве. 1
В сервисе Shazam принцип работы такой: 5
- Сервис анализирует звуковой фрагмент через микрофон смартфона. 5
- Выделяет из всех звуков вокруг динамика именно музыкальную часть. 5
- Создаёт из неё специальный отпечаток и сравнивает его с базой. 5
- Выдает результат на экране — обычно это происходит за секунды. 5