Преимущества WaveNet перед другими системами распознавания речи заключаются в следующем:
- Более высокое синтетическое качество. 1 Это связано с тем, что WaveNet генерирует речевые образцы в единой унифицированной нейронной сети и не требует ручного конвейера обработки сигналов. 1
- Естественное звучание. 24 Модель включает такие элементы, как причмокивание губами и ритм дыхания, а также важные слои коммуникации, такие как интонация, акценты, эмоции. 2
- Отсутствие готовых библиотек «живой» речи. 3 В отличие от классических систем преобразования текста в речь, WaveNet поточечно генерирует профиль звуковой волны. 3
Кроме того, WaveNet позволяет обрабатывать различные случаи использования, например аудиокниги и озвучивание. 4