Архитектура GCN у AMD эволюционировала следующим образом:
- GCN 1. 5 Основа GPU состояла из четырёх вычислительных блоков (CU). 1 Каждый из них содержал 4 векторных блока SIMD, которые выполняли математические операции с 16 точками данных размером 32 бита, и один скалярный блок, который использовался для логических операций на основе целых чисел. 1
- GCN 2. 5 Проведена оптимизация, добавлено множество новых функций. 5 Например, True Audio. 5 Теоретическая производительность геометрии была почти удвоена за счёт четырёх двигателей геометрии (вместо двух в GCN 1), а также увеличено количество единиц вывода результатов (ROPs). 5
- GCN 3. 5 Помимо достижений предыдущих поколений, добавлена технология Lossless Delta Colour Compression. 5 Она улучшает пропускную способность GPU в среднем на 20%, что позволяет снизить энергопотребление и улучшить шины памяти. 5 Также введены улучшения кэширования и тесселяции. 5
Архитектура Maxwell у NVIDIA эволюционировала следующим образом:
- Первое поколение Maxwell. 4 Объём кэша L2 был увеличен с 256 КБ на Kepler до 2 Мбайт на Maxwell, что уменьшило потребность в большей пропускной способности памяти. 4 Шина памяти была уменьшена со 192 бит на Kepler (GK106) до 128 бит, что уменьшило площадь кристалла, стоимость и энергопотребление. 4
- Второе поколение Maxwell. 6 Значительно повышена производительность, сохранена при этом энергоэффективность первого поколения. 6 Уменьшение количества ядер SMM снизило их размер, благодаря чему на кристалле удалось разместить больше SMM. 6 Также упрощена логика диспетчеризации, что позволило снизить количество избыточных повторных вычислений диспетчеризации и задержку вычислений. 6 На 15% была увеличена частота памяти. 6