Первая нейросеть определяет язык говорящего. www.iphones.ru Если он говорит на поддерживаемом языке, то браузер предложит перевести содержимое на русский. www.iphones.ru
Вторая нейросеть переводит речь в текст. www.iphones.ru В полученной модели создаётся аудиодорожка, из которой нейросеть удаляет лишние звуки и слова-паразиты. www.iphones.ru
Третья нейросеть нормализует текст и расставляет знаки препинания. www.iphones.ru Она получает набор переведённых слов, составляет из него грамотные предложения и занимается пунктуацией, сохранив изначальный смысл. www.iphones.ru
Четвёртая нейросеть определяет количество спикеров, их пол и применяемые местоимения. www.iphones.ru Вычисляется тип голоса (мужской или женский) по частоте звучания: у мужчин — 80–150 Гц, у женщин — 150–250 Гц. www.iphones.ru
Пятая нейросеть занимается переводом текста на русский язык. www.iphones.ru
Шестая нейросеть синтезирует речь и синхронизирует её с роликом. www.iphones.ru Она делает паузы одновременно с говорящим человеком, а также соблюдает его темп речи, иногда ускоряясь или замедляясь. www.iphones.ru
Примеры полезных ответов Поиска с Алисой на вопросы из разных сфер. Вопросы сгенерированы нейросетью YandexGPT для актуальных тем, которые определяются на базе обобщённых запросов к Поиску с Алисой.