Некоторые технологии, которые используются в голосовом помощнике «Алиса»:
- SpeechKit. 14 Помогает распознать голосовой запрос, отделяя голос от фоновых шумов. 1 Разобраться с акцентами, диалектами, сленгами и англицизмами алгоритмам позволяет накопленная Яндексом база из миллиарда произнесённых в разных условиях фраз. 1
- Turing. 1 Позволяет наделить запрос смыслом и подобрать правильный ответ. 1 Для этого текст запроса дробится на токены — отдельные слова, которые в дальнейшем отдельно анализируются. 1 Для максимально точного ответа Алиса учитывает историю взаимодействия с ней, интонацию запроса, предыдущие фразы и геопозицию. 1
- Text-to-speech. 1 С её помощью реализуется последний этап — озвучивание ответа. 1 Основой служат записанные в студии 260 тысяч слов и фраз, которые затем были «порезаны» на фонемы. 1 Из этой аудиобазы нейросеть собирает ответ, после чего интонационные перепады в готовой фразе сглаживаются нейросетью, что приближает речь «Алисы» к человеческой. 1