Original size 1140x1600

ARTificial: до-обучение генеративной нейросети

40
Finalist of the competition

Концепция

В свободное от учёбы время я пишу картины. Заниматься живописью осмысленно я начал в 2016 году и с того момента, пройдя через множество экспериментов, пришёл к относительно консистентному стилю.

Выбрав 16 своих работ, созданных с 2022–25 годах, я решил до-обучить нейросеть для генерации изображений в моём стиле.

big
Original size 2200x2200

Исходные изображения для обучения

Основные цели, которые я преследовал:

  • Проверка того, насколько мой стиль может быть узнаваемым: если нейросеть сможет выделить характерные элементы и создать на их основе нечто, похожее на мои картины, значит, мой стиль можно назвать довольно стабильным визуально
  • С нейросетью можно более свободно и менее затратно экспериментировать: пробовать внедрять в работу нетипичные элементы и смотреть, насколько хорошо они могут вписаться в ту или иную концепцию. Можно также проверять, в какой степени изменения в подходе будут влиять на стиль и его узнаваемость
  • Генерация изображений, которые могут стать визуально-стилистической частью новых работ (смысловая часть может также быть частично проработана в рамках уточнений промпта)

Процесс обучения

Original size 2652x708

Загрузка BLIP

Original size 2652x280

Создание пар изображение—подпись

Original size 2656x386

Создание подписей с префиксом

Original size 2654x282

Очистка кэша для освобождения памяти

Original size 2650x858

Параметры для обучения DreamBooth

Original size 2652x534

Подключение к Stable Diffusion XL

Original size 2656x212

Пример промпта

Результаты

Я старался использовать минимальные дополнения к промпту, задающему стиль. Это было сделано для того, чтобы сохранить больший элемент случайности в генерациях.

post

Промпт: abstract painting in MIKDYAD style black background red and yellow splashes with figurative surreal elements semiotics

Первая генерация: не зная, какого рода изображение я получу, я кратко описал в промпте главные стилистические черты, которые отличают мои работы визуально.

1. Чёрный фон — black background (как правило я использую чёрный фон) 2. Пятна выплеснутой краски, соседствующие с искажёнными фигуративными элементами — splashes with figurative surreal elements 3. В конце промпта добавлено слово «семиотика» — semiotics (для акцента на знаках, являющихся важной частью моих работ)

post

Промпт: abstract painting in MIKDYAD style blue background apollo lettering ancient rome

Здесь я вспомнил о художнике Сае Твомбли и попробовал без прямого указания его имени добавить ассоциацию с его работами в рамках моего стиля. Для этого в промпте я указал тематическую привязку к Древнему Риму, культура которого интересовала художника, и упоминание леттеринга, который Сай Твомбли часто использовал в своих работах — apollo lettering ancient rome. На мой взгляд, изображение, получившееся в результате, удачно передаёт задуманное.

Original size 960x1200

Сай Твомбли. Без названия, 1971

post

Промпт: abstract painting in MIKDYAD style black background moscow nightlife

Для этой генерации я попробовал ввести краткую свободную ассоциацию — moscow nightlife. Это не конкретный образ какого-либо объекта, и мне было интересно, как нейросеть «увидит» жизнь ночной Москвы через призму моего стиля. Итоговый результат меня несколько удивил — я ожидал более яркой работы, однако характерные элементы, которые могли бы проассоциироваться с подобным запросом, присутствуют. В их числе, например: пятно, напоминающее луну; красный цвет, часто связываемый с образом Москвы; «беспокойные» каракули, напоминающие оживлённое движение.

post

Промпт: abstract painting in MIKDYAD style pink floyd bright cosmic elements semiotics

При создании своих картин я часто ищу вдохновение в музыке. Так, возможно — я не уверен, что запрос был проинтерпретирован верно — выглядит абстракция, связанная с группой Pink Floyd.

post

Промпт: abstract painting in MIKDYAD style bright colorful background red rusty elements semiotics

Ради эксперимента я попробовал изменить параметр цвета фона, поменяв его с чёрного на красный. Результат довольно сильно схож с одной из 16 работ, использованных при до-обучении нейросети.

Original size 2400x2399

Михаил Дядченко. Firebird, 2024–25

post

Промпт: abstract painting in MIKDYAD style black background pink splash with figurative flowery elements semiotics

При попытке ограничить палитру одним цветом — розовым — я получил довольно интересный результат, однако он походил на незаконченную работу, поэтому для следующей генерации я откорректировал промпт.

post

Промпт: abstract painting in MIKDYAD style flowery black background redpink splash with figurative elements semiotics

Промпт почти повторяет предыдущий, однако я изменил порядок слов и добавил в запрос слово redpink. Так я пытался ввести в розовый цвет некие градации и, не выходя за рамки палитры, придать картине глубину. Этот результат оказался действительно более интересным.

post

Промпт: abstract painting in MIKDYAD style pink flowery bright fireworks elements lettering

Здесь я попробовал ввести в промпт конкретную сущность — фейерверки — для внедрения в изображение. Нейросеть добавила элемент с сохранением его узнаваемости — образ считывается. При этом изображение фейерверков вписалось в стиль картины и гармонично сочетается с окружающими пятнами и фактурами.

post

Промпт: abstract painting in MIKDYAD style flowery background brightest green and pink splash with figurative elements semiotics

Добавлением в промпт слова brightest я хотел добиться увеличения насыщенности (яркости) цвета. Благодаря этой доработке, а также из-за усиливающего ассоциацию с летней природой слова flowery, вышел действительно яркий, солнечный результат.

post

Промпт: abstract painting in MIKDYAD style deep brightest indigo and pink splash with figurative elements semiotics

Для последнего изображения серии я применил контраст deep/brightest. Я хотел добиться глубины и многослойности изображения при сохранении яркой цветовой палитры. Результат, на мой взгляд, получился довольно убедительным.

Вывод

Результаты получились довольно интересными — их действительно можно использовать для работы. Благодаря получившимся изображениям также подтвердилась (как мне кажется) гипотеза о том, что стиль моих работ может быть узнаваем: нейросеть смогла его деконструировать для последующих генераций, которые смогли образовать цельную серию.

Код проекта

Описание применения генеративной модели

Проект создан с использованием ИИ в рамках курса, программа которого ориентирована на решение задач средствами искусственного интеллекта.

Были применены:

  • Для генерации изображений — Stable Diffusion XL с DreamBooth и LoRA
  • Для генерации подписей к изображениям датасета — BLIP
  • Для улучшения качества изображений — Topaz Gigapixel AI
We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...
Show more