Статистический машинный перевод требует большого количества вычислительных мощностей из-за необходимости обрабатывать большие объёмы данных — параллельные корпуса текстов на двух языках. 14
Для корректной работы статистической системе нужно как минимум 500 тысяч, а в идеале — от нескольких миллионов параллельных текстов. 1 На основе этих данных обучаются вероятностные модели перевода, которые учатся предсказывать, какой перевод слова или фразы является наиболее вероятным. 4
Кроме того, при работе статистической системы нужно искать переводы отдельных слов в таблице переводов, комбинировать их в разных сочетаниях и в разном порядке, а затем оценивать вероятностной моделью. 5