WaveNet стала революционным шагом в создании реалистичных искусственных голосов по нескольким причинам:
Использование нейросетей. nplus1.ru В традиционных системах синтеза речи использовались готовые аудиозаписи, из которых программа выделяла звуки и компоновала их на основе введённых данных. nplus1.ru Такой подход был ограничен, так как для создания нового голосового ассистента или изменения тона речи требовалось наличие человека, который запишет все возможные звуки для базы данных. nplus1.ru WaveNet же генерирует звуки самостоятельно, используя нейросеть, обученную на записях реальной речи. nplus1.ru en.wikipedia.org
Возможность адаптации. fxis.ai WaveNet способна подстраивать свой вывод в зависимости от используемых данных. fxis.ai Например, если её обучили на записях одного человека, то сгенерированный голос будет похож на него, с учётом уникальных вокальных особенностей. fxis.ai Если же в процессе обучения использовались голоса нескольких людей, то на выходе будет более чёткая речь. fxis.ai
Имитация интонаций и особенностей речи. www.computerra.ru WaveNet способна копировать интонации и особенности речи любого из своих тренеров, такие как причмокивание губами или перевод дыхания. www.computerra.ru
Способность синтезировать речь даже без заданного текста. nplus1.ru WaveNet на основе анализа исходных форм звуковых волн может самостоятельно генерировать подобие человеческой речи. nplus1.ru
В результате WaveNet сократила разрыв между искусственной и натуральной речью почти на 50%. deepmind.google nplus1.ru
Примеры полезных ответов Поиска с Алисой на вопросы из разных сфер. Вопросы сгенерированы нейросетью YandexGPT для актуальных тем, которые определяются на базе обобщённых запросов к Поиску с Алисой.