Некоторые технологии, которые использовались при создании голосового помощника «Алиса»:
SpeechKit. ru.ruwiki.ru en.wikipedia.org Помогает распознать голосовой запрос, отделяя голос от фоновых шумов. ru.ruwiki.ru Разобраться с акцентами, диалектами, сленгами и англицизмами алгоритмам позволяет накопленная «Яндексом» база из миллиарда произнесённых в разных условиях фраз. ru.ruwiki.ru
Turing. ru.ruwiki.ru ru.wikipedia.org Позволяет наделить запрос смыслом и подобрать правильный ответ. ru.ruwiki.ru Для этого текст запроса дробится на токены — отдельные слова, которые в дальнейшем отдельно анализируются. ru.ruwiki.ru Для максимально точного ответа Алиса учитывает историю взаимодействия с ней, интонацию запроса, предыдущие фразы и геопозицию. ru.ruwiki.ru
Text-to-speech. ru.ruwiki.ru ru.wikipedia.org С её помощью реализуется последний этап — озвучивание ответа. ru.ruwiki.ru Основой служат записанные в студии 260 тысяч слов и фраз, которые затем были «порезаны» на фонемы. ru.ruwiki.ru Из этой аудиобазы нейросеть собирает ответ, после чего интонационные перепады в готовой фразе сглаживаются нейросетью, что приближает речь «Алисы» к человеческой. ru.ruwiki.ru
Примеры полезных ответов Поиска с Алисой на вопросы из разных сфер. Вопросы сгенерированы нейросетью YandexGPT для актуальных тем, которые определяются на базе обобщённых запросов к Поиску с Алисой.