Технология машинного перевода при автоматическом распознавании речи работает в несколько этапов: 1
- Анализ сигнала. 3 Запись отправляется на сервер, где происходит её очищение от помех и шумов. 3 Также сигнал делится на фонемы — небольшие фрагменты длительностью до 25 миллисекунд. 3 Каждый фрагмент прогоняется через акустическую модель, которая идентифицирует произнесённые человеком звуки. 3
- Расшифровка. 3 Выделенные речевые фрагменты сравниваются с произношениями слогов и слов, собранных в библиотеке акустической модели. 3 В системе используется технология машинного обучения для подбора фонетических вариантов произнесённых слов в определённом контексте. 3
- Преобразование голоса в текст. 3 Языковая модель позволяет определить порядок слов и подобрать нераспознанные фрагменты по контексту. 3 Далее эта информация направляется в декодер, в котором объединяются данные из языковой и акустической моделей, после чего преобразуется в тестовый формат. 3
Модуль автоматического перевода преобразует полученную строку. 1 Ранние системы заменяли каждое слово соответствующим словом в другом языке. 1 Более совершенные системы не используют дословный перевод, а принимают во внимание весь контекст фразы, чтобы произвести соответствующий перевод. 1
Созданный перевод передаётся в модуль синтеза речи, который оценивает произношение и интонацию, соответствующую ряду слов из массива речевых данных другого языка. 1 Данные, соответствующие фразе, отбираются, соединяются и выводятся в необходимой потребителю форме на другом языке. 1