Система распознавания шёпота у голосовых помощников развивается благодаря глубокому обучению на аудиоданных из реальной жизни. dzen.ru ИИ тренируется не только на студийных записях, а на миллиардах часов разговоров из мессенджеров, соцсетей и голосовых помощников. dzen.ru Это позволяет распознавать голос в любых условиях. dzen.ru
Некоторые этапы развития системы распознавания шёпота:
- Обучение распознаванию шёпота по звуковому спектру. yandex.ru chudo.tech Шёпот отличается от обычной речи тем, что слова произносятся без использования голосовых связок, поэтому звуковой спектр шёпота и обычной речи различаются. yandex.ru habr.com
- Обучение отличать шёпот от глухого голоса, например, как при простуде. yandex.ru Оказалось, что они похожи по спектру, и поначалу голосовой помощник их часто путал. yandex.ru
- Обучение самого помощника шептать. yandex.ru chudo.tech Для этого записали несколько часов шёпота в исполнении актрисы, которая озвучивала голосового помощника. yandex.ru Эти данные добавили в уже накопленный обучающий корпус и сообщали нейросети, где шёпот, а где обычная речь. yandex.ru В итоге помощник научился между ними переключаться. yandex.ru
В 2025 году Google запустил систему VoiceID 3.0, которая распознаёт голос с точностью выше 99%, даже если собеседник говорит шёпотом или находится в шумном месте. dzen.ru