Некоторые особенности архитектуры модели Kandinsky для генерации изображений:
Использование диффузионной модели. kokoc.com courses.sberuniversity.ru Нейросеть сначала добавляет шумы на изображения, на которых была обучена, а затем восстанавливает их с помощью процесса обратной диффузии, создавая новое уникальное изображение. kokoc.com
Использование модифицированной архитектуры Latent Diffusion. ru.wikipedia.org Она предполагает генерацию латентных векторов изображений и работу с ними. ru.wikipedia.org
Использование двух текстовых энкодеров. ai.sber.ru В Kandinsky 2.0 это mT5 Small и XMLR-clip. ai.sber.ru
Оптимизированная архитектура U-Net. yatalks.yandex.ru В Kandinsky 3.0 используется прокачанная версия U-Net, у которой расположение блоков отличается от того, что применялось в первой версии. yatalks.yandex.ru
Примеры полезных ответов Поиска с Алисой на вопросы из разных сфер. Вопросы сгенерированы нейросетью YandexGPT для актуальных тем, которые определяются на базе обобщённых запросов к Поиску с Алисой.