Технология распознавания фейковых голосовых сообщений работает на основе измерения акустических и динамических различий между голосовыми сэмплами, созданными человеком, и теми, которые генерируются синтетически компьютерами. 1
Например, учёные из Университета Флориды разработали программу, которая сравнивает возможность воспроизведения звуков человеческой гортанью. 1 Исследователи показали, что дипфейковые аудио нередко включают в себя звуки, которые человеческая гортань в принципе извлечь не может. 1 Программа способна их распознать и сделать вывод о том, является ли аудиозапись фейковой или нет. 1
Также для определения искусственной речи можно проанализировать битрейт сигнала (количество бит, используемых для передачи данных в единицу времени). 4 Распределения битрейта отличаются для настоящей и синтезированной речи. 4
Ещё один метод — использовать классификаторы речи на основе нейросетей. 3 Например, можно зайти на сайт ElevenLabs Speech Classifier, загрузить голосовое сообщение и нажать кнопку «Определить синтезированную речь». 3