Метод сравнения текстов на основе алгоритма Левенштейна вычисляет количество правок, необходимых для преобразования одной строки в другую. 1 При редактировании учитываются следующие операции: вставка символа, удаление символа и замена символа. 1
Алгоритм работает так: сначала вычисляется расстояние между первым префиксом первого слова и всеми префиксами второго слова. 3 Затем процесс продолжается и вычисляются расстояния между оставшимися префиксами первого слова и префиксами второго слова. 3
Чем больше количество операций, тем меньше сходство между двумя строками. 1 Например, для слов «test» и «test» расстояние Левенштейна равно 0, так как строки идентичны и не требуют преобразований. 2 А для слов «test» и «team» расстояние Левенштейна равно 2 — нужно сделать две замены, чтобы превратить «test» в «team». 2
Алгоритм Левенштейна может измерять сходство между строками разной длины. 1