Алгоритмы генерации изображений ruDALL-E и «Кандинского» имеют некоторые отличия.
ruDALL-E создаёт изображения по текстовому описанию в три этапа: {6-host} {8-host}
- Одна нейросеть берёт текст на вход и генерирует необходимое число картинок. {6-host}
- Другая нейросеть определяет, какие из них самые удачные и больше всего соответствуют заданным пользователем характеристикам. {6-host}
- Затем третья нейросеть увеличивает картинки в размере, при этом качество при этом не страдает. {6-host}
«Кандинский», в свою очередь, может: skillbox.ru
- генерировать изображение с нуля по текстовому запросу на 101 языке и создавать картинки в разных стилях — от фотореализма до рисованных иллюстраций; skillbox.ru
- редактировать картинки: на загруженном или сгенерированном изображении можно отметить неподходящие области и написать, чем их заменить, — «Кандинский» перерисует фрагменты в отмеченном поле; skillbox.ru
- соединять два изображения в одно; skillbox.ru
- достраивать изображение: когда «Кандинский» сгенерировал картинку, он может дорисовать что-нибудь сверху, снизу, справа и слева. skillbox.ru
Таким образом, основное отличие заключается в том, что ruDALL-E фокусируется на генерации большого количества изображений по заданному описанию, а «Кандинский» предоставляет возможности редактирования и доработки сгенерированных картинок.