Некоторые ключевые особенности архитектуры Ampere в сравнении с архитектурой Turing:
- Тензорные ядра третьего поколения. 17 Ускоряют функции и обучение искусственного интеллекта, например, NVIDIA DLSS для сверхвысокого разрешения вплоть до 8K. 1
- Формат TensorFloat-32 (TF32). 1 Позволяет повысить производительность в задачах глубокого обучения до 10 раз без необходимости изменять код. 1
- Двукратное увеличение производительности с FP32. 1 Мультипроцессор потоковой передачи (SM) в архитектуре Ampere GA10x был разработан для обработки данных с удвоенной скоростью. 1
- Аппаратно-ускоренное декодирование (NVDEC). 1 С его помощью декодирование видео выполняется намного быстрее, благодаря чему видеокарты могут использоваться не только для просмотра видео, но и даже для транскодирования. 1
- Улучшенная энергоэффективность. 5 На уровне чипа разделили питание, выделив для графической части и для подсистемы памяти отдельные линии. 5
Архитектура Turing оснащена специальными процессорами для трассировки лучей — ядрами RT. 2 Они ускоряют расчёты перемещения света и звука в 3D-средах до 10 миллиардов лучей в секунду. 2 Также Turing оснащена новыми тензорными ядрами, которые ускоряют тренировку и инференс глубоких нейронных сетей. 2