Разница между статистическими и лингвистическими методами определения языка в современных системах машинного перевода заключается в том, как система определяет наиболее вероятный вариант перевода. 45
Статистический метод предполагает формирование правил на основе параллельных двуязычных корпусов текстов. 5 Из предложения выделяются отдельные грамматические единицы — слова и фразы, перебираются все варианты перевода для каждого фрагмента и взвешивается вероятность каждого из них. 5
Лингвистический метод подразумевает использование набора правил перевода из исходного языка в целевой, написанных лингвистом, и двуязычных словарей — набора лексических элементов обоих языков. 5 В процессе перевода проводится морфологический анализ, объединение отдельных слов в группы и синтаксический анализ предложений. 5
Таким образом, статистический метод опирается на статистику и анализ больших объёмов параллельных текстов, а лингвистический — на лингвистические и грамматические правила, разработанные языковыми экспертами. 15