Сервис DeepL Translate работает на основе нейронных сетей. 1 Эти сети обучаются на огромном количестве готовых переводов. 1
Некоторые особенности, которые помогают сервису достигать высокого качества перевода:
- Архитектура сетей. 1 В нейронных сетях DeepL есть элементы архитектуры Transformer, но в топологии сетей есть отличия, которые улучшают общее качество перевода. 1
- Обучающие данные. 1 Для сбора специальных обучающих данных используются специальные краулеры, которые автоматически находят переводы в интернете и оценивают их качество. 1
- Методология обучения. 1 Сети показывают различные примеры и многократно сравнивают свои собственные переводы с переводами из набора обучающих данных. 1 Если обнаруживаются расхождения, веса сети корректируются соответствующим образом. 1
- Размер сетей. 1 Для обучения используются нейронные сети с миллиардами параметров, но параметры сетей используются максимально эффективно. 1
Перевод генерируется с помощью суперкомпьютера, вычислительная мощность которого составляет 5,1 петафлопс, работающего в Исландии. 24