Вопросы к Поиску с Алисой

Примеры ответов Поиска с Алисой

Главная / Технологии / Как создавались оригинальные голоса для голосовых помощников?

Вопрос для Поиска с Алисой

14 января

#Технологии #ИИ #ГолосовыеПомощники #СозданиеГолоса #Инновации #РазвитиеТехнологий

Как создавались оригинальные голоса для голосовых помощников?

Алиса

На основе источников, возможны неточности

Как это работает?

Для создания оригинальных голосов для голосовых помощников используются различные методы. vc.ru

Например, для проекта Q звуковые инженеры записали голоса 24 человек с разной гендерной самоидентификацией. rb.ru Сначала они хотели наложить эти записи друг на друга и получить нечто среднее, но такой вариант оказался слишком сложным. rb.ru В итоге исследователи нашли голос, соответствующий частоте, считающейся гендерно-нейтральной (от 145 Гц до 175 Гц). rb.ru Затем они доработали его и создали четыре тестовых образца. rb.ru Образцы отличались друг от друга по восприятию. rb.ru Например, жёсткое произношение звука «с» считается характерным для женских голосов, а чёткое разделение гласных воспринимается как элемент мужского голоса. rb.ru Затем исследователи провели опрос среди 4500 человек, в ходе которого они должны были охарактеризовать пол каждого из четырёх образцов голоса. rb.ru В итоге получился Q — голос, который 50% опрошенных назвали гендерно-нейтральным, 26% посчитали мужским и 24% — женским. rb.ru

Для создания голосов виртуальных ассистентов «Салют» работает целая команда. vc.ru Войс-коучи записывают голоса реальных дикторов, разметчики готовят датасеты, дата-сайентисты обучают нейросети и проводят эксперименты, программисты пишут эффективный код, а аналитики находят способы измерять качество. vc.ru

Также для создания голосов можно использовать платформу речевых сервисов, например SaluteSpeech. developers.sber.ru Пользователи загружают текст онлайн, выбирают понравившегося диктора из обширной библиотеки и нажимают кнопку «Синтезировать». developers.sber.ru Обученная нейросеть анализирует текстовую информацию и переводит её в голосовые единицы. developers.sber.ru Затем алгоритм объединяет их в единую звуковую дорожку, которая нормализуется под привычное восприятие — корректируются ударение, интонация, фонетическая тональность, произношение сложных звуков. developers.sber.ru

Примеры полезных ответов Поиска с Алисой на вопросы из разных сфер. Вопросы сгенерированы нейросетью YandexGPT для актуальных тем, которые определяются на базе обобщённых запросов к Поиску с Алисой.

Пожаловаться на контент

Пользовательское соглашение

Связаться с нами

Задать новый вопрос

Как это работает?