Статистический машинный перевод уступает нейронному в точности по нескольким причинам:
- Нехватка параллельных корпусов. 12 Для корректных переводов статистической системе необходимо как минимум 500 тысяч, в идеале от нескольких миллионов параллельных текстов. 1
- Нестабильность перевода. 1 Несмотря на способность переводить устойчивые выражения, эти самые выражения и термины могут переводиться по-разному исходя из контекста. 1
- Отсутствие глубокого понимания языка и смысла. 5 Статистические системы не всегда могут уловить нюансы и контекст исходного текста. 5
- Трудность учёта сложных языковых конструкций и синтаксических структур. 5 Например, идиомы и жаргонизмы могут быть трудны для машинного переводчика. 3
В то же время нейронный машинный перевод способен понимать нюансы и сложные языковые конструкции, такие как идиомы, выражения и метафоры. 3 Он анализирует «окружение» каждого слова, даже если слова находятся в разных частях предложения, что позволяет правильно определить контекст. 4