Статистический машинный перевод отличается от систем, основанных на правилах, подходом к обучению и процессом перевода. 23
Системы, основанные на правилах, включают в себя словари и формальные грамматики, то есть наборы правил морфологического, семантического и синтаксического анализа языка. 2 Правила пишутся лингвистами специально для системы. 3
Статистические системы проходят этап обучения, на котором извлекаются статистические данные о переводе отдельных слов и фраз с исходного языка на язык перевода. 2 В процессе перевода такая система вычисляет наиболее вероятный перевод исходного предложения на основе данных, полученных при обучении. 2
Таким образом, основное различие в том, что для систем, основанных на правилах, правила пишутся специально для системы лингвистами, а для статистических систем правила выделяются самостоятельно из примеров перевода (параллельных текстов). 3