Некоторые методы, которые используются в языковых технологиях для распознавания человеческой речи:
- Акустико-фонетический подход. www.ccas.ru Предполагает последовательное декодирование сигнала, представленного в виде наблюдаемых акустических признаков, с использованием известных взаимосвязей акустических и фонетических символов. www.ccas.ru
- Скрытые Марковские Модели (HMM). www.ccas.ru Задают динамику перехода от одной фонемы в речи к другой и обеспечивают вариативность наблюдаемого сигнала посредством моделирования вероятностного распределения признаков. www.ccas.ru
- Рекуррентная нейросеть (RNN). habr.com Позволяет с высокой точностью понимать слова, а также предсказывать наиболее вероятное слово в рамках контекста, если оно не было распознано. habr.com
- Нейросетевая темпоральная классификация модели (CTC). habr.com Выделяет в записанном аудиопотоке (слове, фразе) отдельные фонемы и расставляет их в том порядке, в котором они были произнесены. habr.com
Как правило, перечисленные методы комбинируются, их сочетание позволяет получить более высокое качество распознавания, чем использование каждой модели отдельно. neerc.ifmo.ru