Разница между семантическим и лексическим сходством в компьютерной лингвистике заключается в том, что они отражают разные аспекты близости текстов.
Семантическое сходство — это мера, применяемая к набору документов с целью определения сходства их содержания. 3 Сходство между документами основано на их прямых и косвенных связях. 3 Оценка семантической близости текстов является неотъемлемой составляющей многих задач современной компьютерной лингвистики, среди которых создание и функционирование информационно-поисковых систем, вопросно-ответных систем, систем автоматического реферирования, классификации текстов и другие. 5
Лексическое сходство — мера того, до какой степени слова двух данных языков лексически сходны. 10 Лексическое сходство, равное единице (или 100%), означает полное совпадение двух данных языков, тогда как равенство 0 означает полное отсутствие в них общих слов. 10