Алгоритм динамической трансформации временной шкалы (DTW) применяется в распознавании речи для сравнения сигналов между собой. 4 Это необходимо, так как даже одинаковые слова у разных людей могут различаться по времени произношения. 4
Принцип работы: алгоритм определяет, похожа ли потенциальная последовательность на предопределённую эталонную последовательность. 1 В качестве результата он выдаёт число, которое характеризует похожесть последовательностей. 4 Чем меньше это число, тем более похожи последовательности. 14
Некоторые области применения DTW в распознавании речи:
- Идентификация говорящего. 2 Для этого определяется минимальная стоимость для всех шаблонов из базы данных. 2 Значение, которому соответствует путь с минимальной длиной, определяет индивидуальный номер диктора, чей голос максимально приближён к образцу исходной речи. 2
- Превращение беззвучной речи в слышимую. 3 В этом случае алгоритм принимает три сигнала: две электромиограммы и слышимую речь. 3 На первом этапе он с помощью DTW находит оптимальное соответствие между двумя сигналами: позволяет взять фрагмент из первой последовательности и найти его во второй. 3 На втором этапе алгоритм, используя полученное соответствие, создаёт из аудиозаписи слышимой речи аудиозапись речи из электромиограммы неслышимой. 3