Некоторые особенности синтеза речи в голосовых помощниках Яндекса:
Использование технологии глубоких нейронных сетей. yandex.cloud При синтезе речи модель обращает внимание на большое количество деталей исходного голоса. yandex.cloud
Оценка всего текста целиком. yandex.cloud Перед началом синтеза модель оценивает весь текст, а не отдельные предложения. yandex.cloud Благодаря этому синтезированный голос звучит чисто и естественно, без электронных искажений, и воспроизводит уместные интонации, присущие речи живого человека. yandex.cloud
Поддержка нескольких голосов. spark.ru Голоса отличаются тембром, полом и языком говорящего. yandex.cloud Если ни один голос не подходит, SpeechKit может создать уникальный — специально для пользователя. yandex.cloud
Управление произношением. yandex.cloud SpeechKit может синтезировать речь из текста, размеченного по правилам Speech Synthesis Markup Language (SSML) или TTS-разметки. yandex.cloud Эти способы разметки позволяют настроить длительность пауз, произношение отдельных звуков и многое другое. yandex.cloud
Настройка технических характеристик синтезируемой речи. yandex.cloud Можно настраивать скорость синтезируемой речи, что влияет на восприятие информации. yandex.cloud По умолчанию скорость генерируемой речи соответствует средней скорости речи человека. yandex.cloud
Нормализация громкости. yandex.cloud Это может потребоваться, если синтез SpeechKit используется вместе с другими источниками звука. yandex.cloud Например, чтобы громкость голосового ассистента не отличалась от уведомлений телефона. yandex.cloud
Примеры полезных ответов Поиска с Алисой на вопросы из разных сфер. Вопросы сгенерированы нейросетью YandexGPT для актуальных тем, которые определяются на базе обобщённых запросов к Поиску с Алисой.