Технология машинного перевода при автоматическом распознавании речи работает в несколько этапов: ru.wikipedia.org
- Анализ сигнала. trainingdata.ru Запись отправляется на сервер, где происходит её очищение от помех и шумов. trainingdata.ru Также сигнал делится на фонемы — небольшие фрагменты длительностью до 25 миллисекунд. trainingdata.ru Каждый фрагмент прогоняется через акустическую модель, которая идентифицирует произнесённые человеком звуки. trainingdata.ru
- Расшифровка. trainingdata.ru Выделенные речевые фрагменты сравниваются с произношениями слогов и слов, собранных в библиотеке акустической модели. trainingdata.ru В системе используется технология машинного обучения для подбора фонетических вариантов произнесённых слов в определённом контексте. trainingdata.ru
- Преобразование голоса в текст. trainingdata.ru Языковая модель позволяет определить порядок слов и подобрать нераспознанные фрагменты по контексту. trainingdata.ru Далее эта информация направляется в декодер, в котором объединяются данные из языковой и акустической моделей, после чего преобразуется в тестовый формат. trainingdata.ru
Модуль автоматического перевода преобразует полученную строку. ru.wikipedia.org Ранние системы заменяли каждое слово соответствующим словом в другом языке. ru.wikipedia.org Более совершенные системы не используют дословный перевод, а принимают во внимание весь контекст фразы, чтобы произвести соответствующий перевод. ru.wikipedia.org
Созданный перевод передаётся в модуль синтеза речи, который оценивает произношение и интонацию, соответствующую ряду слов из массива речевых данных другого языка. ru.wikipedia.org Данные, соответствующие фразе, отбираются, соединяются и выводятся в необходимой потребителю форме на другом языке. ru.wikipedia.org