Разница между архитектурой и моделью нейронной сети заключается в том, что архитектура описывает общее устройство сети, а модель — конкретную обучённую сеть. 1
Архитектура задаёт общий принцип построения сети. 1 Она включает такие параметры, как количество слоёв, их типы, последовательность и связи между ними. 13 Архитектура похожа на чертёж: она определяет, как сеть будет обрабатывать входные данные и выдавать выходные результаты. 3
Модель содержит конкретные значения параметров, полученных после обучения на каком-то наборе данных. 1 Если архитектура — это шаблон, то модель — это получившийся экземпляр, обладающий уникальными параметрами. 1
Например, если скачать популярную модель GPT или ResNet, то получится уже обучённая сеть с определёнными весами (числами), которые в процессе обучения «настроились» для решения конкретных задач. 1