Генерация картинок с текстом работает на основе нейросетей, которые позволяют вписать заданный текст в изображение таким образом, чтобы это выглядело естественно. 1 При этом алгоритм использует игру теней, особенности естественных ландшафтов или позы людей или животных. 1
Например, в сервисе Glif для этого задействованы модели ChatGPT, Stable Diffusion и Kandinsky. 1 Одна нейросеть генерирует изображение, а вторая вставляет в него нужную надпись. 1
Также существует сервис «Шедеврум» от «Яндекса», где генерация происходит методом каскадной диффузии: сначала генерируются 4 варианта изображения, после выбора подходящего и публикации пользователем, изображение поэтапно улучшается и приобретает большую детализацию и окончательно прорисовывается. 2
Ещё один сервис для генерации картинок с текстом — Ideogram. 3 При вводе запроса текст надписи, которую нужно увидеть на картинке, лучше всего вводить внутри кавычек — так нейросеть лучше поймёт, какой текст должен быть на рисунке. 3