Некоторые методы машинного обучения для автоматического распознавания повторов в речи:
Коннекционистская временная классификация (CTC). 12 В этом подходе входной аудиофайл разбивают на отдельные речевые сегменты и по ним предсказывают токены. 1 Затем токены объединяют, повторяющиеся сворачивают в один, и результат подают на вывод модели. 1 В CTC дополнительно используют пустой токен, чтобы выяснить, где свернуть повторяющиеся токены. 1 Появление пустого токена помогает отделить повторяющиеся буквы, которые не должны быть свернуты. 1
Метод скрытых моделей Маркова (СММ). 5 Это статистические модели, опирающиеся на скрытые или не наблюдаемые состояния. 5 По мере обработки сигнала СММ создаёт вероятностную сетку, на которой после ищет лучший путь. 5 СММ создаёт граф из связанных фонем, а иногда даже последовательностей слов, который после отображает в гистограмме вероятных результатов. 5