Процесс самообучения голосовых помощников работает следующим образом: 5
- Активация. 5 Ассистент постоянно прослушивает окружающие звуки, анализирует наличие ключевой фразы и, если она будет распознана, переходит в активный режим. 5
- Пользователь произносит текст, который может объяснить помощнику, что пользователь хочет сделать. 5
- Система распознавания (Automatic Speech Recognition) превращает текст в N-лучших гипотез того, что сказал пользователь. 5
- Система распознавания естественного языка (Natural Language Understanding) превращает текст в N-лучших вариантов понимания фразы пользователя. 5
- Диалоговый движок интерпретирует и классифицирует эти фразы и определяет, что необходимо сделать на основе полученной информации. 5 Например, обратиться в различные сервисы для получения информации. 5
- После получения необходимых данных система производит процесс возвращения информации пользователю. 5 То есть система генерации естественного языка (Natural Language Generation) генерирует текст для ответа пользователю, далее система генерации голоса (Text-To-Speech) на основе обученных моделей генерирует звуковую информацию, которая и объявляется пользователю в качестве ответной реакции. 5
Также существует генеративный подход, при котором происходит обучение при помощи открытых источников, встроенных алгоритмов и языковых норм, на основе чего и генерируется фраза-ответ. 2