Статистический машинный перевод обрабатывает большие объёмы языковых пар текстов с помощью сравнения и анализа межъязыковых соответствий, синтаксических конструкций. moluch.ru
Процесс происходит в два режима: www.academia.edu
- Обучение. www.academia.edu В систему загружается двуязычный корпус текстов, содержащий большое количество текста на исходном языке и его «ручной» перевод на требуемый язык. moluch.ru Система вычисляет вероятности переводных соответствий и строит модель языка перевода. www.academia.edu
- Эксплуатация. www.academia.edu Для фразы из исходного текста ищется фраза переводного текста так, чтобы максимизировать произведение вероятностей. www.academia.edu
Некоторые особенности работы:
- Составление словаря вероятностей перевода. sysblok.ru Просмотрев большой текст, машина составляет словарь вероятностей перевода, то есть какие варианты перевода она чаще всего предполагала, основываясь на обучающей коллекции текстов. sysblok.ru
- Выбор наиболее вероятного перевода. postnauka.org www.academia.edu При выполнении перевода компьютер не оперирует лингвистическими алгоритмами, а вычисляет вероятность применения того или иного слова или выражения. www.academia.edu
- Учёт контекста. sysblok.ru В зависимости от контекста меняются и вероятности перевода конкретного слова тем или иным способом. sysblok.ru
- Фразовый перевод. sysblok.ru Фразовый переводчик старается перевести по несколько слов сразу (по «фразам»), если эти слова встречались или могли встречаться рядом в обучающих данных. sysblok.ru
Чем больше в распоряжении имеется языковых пар и чем точнее они соответствуют друг другу, тем лучше результат статистического машинного перевода. www.academia.edu