Некоторые ключевые различия между классической и статистической моделями машинного перевода:
Классическая модель (машинный перевод на основе правил) основана на грамматических, синтаксических, морфологических и семантических закономерностях языков перевода и оригинала. cyberleninka.ru Суть подхода — преобразование слов или словосочетаний языка оригинала в их эквивалент на языке перевода. cyberleninka.ru Для разработки правил необходимо привлечение лингвистов. scienceforum.ru
Статистическая модель работает не с готовыми правилами, а формирует их на основе параллельных двуязычных корпусов текстов. scienceforum.ru В основе технологии лежит теорема Байеса: из предложения выделяются отдельные грамматические единицы — слова и фразы, перебираются все варианты перевода для каждого фрагмента и взвешивается вероятность каждого из них. scienceforum.ru Для работы статистической системе нужно много примеров перевода: как минимум полмиллиона предложений (лучше даже несколько миллионов предложений) и их переводов. postnauka.org
Таким образом, классическая модель ориентирована на строгие правила и закономерности, в то время как статистическая модель использует множество примеров перевода и обладает свойством «самообучения». postnauka.org ru.ruwiki.ru