Концепция проекта
Проект посвящён исследованию того, как генеративная нейросеть Stable Diffusion может перенести уникальный орнаментальный стиль Густава Климта (золотой период) в жанр современного портрета.
Климт — один из самых ярких представителей венского модерна, чьи работы отличаются золотыми фонами, изогнутыми линиями, орнаментальными узорами и сложной символикой.
Цель проекта — обучить модель Stable Diffusion XL понимать и воспроизводить эти характерные черты, создавая новые портреты, в которых стиль художника органично сочетается с современными образами, чертами лица, одеждой и окружением.
«Поцелуй», 1907–1908 гг. / «Юдифь и Олоферн», 1901 г. Густав Климт
«Ожидание», 1905–1909 гг. / «Портрет женщины», 1916–1917 гг. / «Портрет Адели Блох-Бауэр I», 1909 г. Густав Климт
Для обучения нейросети был собран датасет из 30 репродукций картин Густава Климта, относящихся к его золотому периоду. Все изображения были приведены к квадратному формату 512×512 пикселей и обработаны вручную для сохранения ключевых элементов стиля: золотые фоны, орнаментальные узоры, плавные линии, портретные композиции.
Подготовка изображений
Процесс обучения
Обучение проводилось в Google Colab с использованием ноутбука SDXL DreamBooth LoRA. Была выбрана базовая модель Stable Diffusion XL с улучшенным VAE (madebyollin/sdxl-vae-fp16-fix).
Часть кода
Датасет был загружен локально в папку klimt. Для каждого изображения в файле metadata.jsonl указан единый промпт, который модель ассоциирует со стилем: «photo collage in KLIMT style»
Загрузка датасета
Код обучения
После первоначальной попытки обучения с автоматически сгенерированными описаниями (BLIP) качество стиля оказалось низким. Было выполнено дообучение с исправленным metadata.jsonl, что позволило модели правильно усвоить ключевые признаки. Общее время обучения на GPU T4 составило около 1 часа.
Итоговые изображения
После обучения модель была применена для генерации портретов. Промпты строились по шаблону: «photo collage in KLIMT style, [описание]».
Для достижения разнообразия использовались различные seed, guidance scale (от 7 до 8.5) и количество шагов (30–40).
Портрет крупным планом в стиле работ Густава Климта
Женский портрет в стиле работ Густава Климта
Женские портреты в стиле работ Густава Климта
Женский портрет в стиле работ Густава Климта
Примеры промптов:
— «photo collage in KLIMT style, close-up of a woman’s face with gold leaf details, abstract floral patterns, high detail, sharp» — «photo collage in KLIMT style, profile portrait of a man with a beard, blue and silver tones, geometric ornaments, moody lighting» — «photo collage in KLIMT style, a couple embracing, golden swirls, red and gold palette, romantic atmosphere, soft focus» — «photo collage in KLIMT style, full body portrait of a dancer in motion, flowing gold ribbons, dynamic composition, bright colors»
Женские портреты в стиле работ Густава Климта
Портрет женщины в стиле работ Густава Климта
Портрет мужчины в стиле работ Густава Климта
Портрет кошек Портрет в стиле работ Густава Климта
В итоговой серии изображений удалось передать несколько ключевых элементов, характерных для творчества Климта:
— Золотые фоны и орнаменты — в большинстве генераций присутствуют золотистые пятна, декоративные узоры, напоминающие климтовские круги, спирали и мозаичную текстуру.
— Плавные линии и ар-нуво — контуры лиц, одежды и декоративных элементов часто имеют изогнутую, «растительную» пластику.
— Портретная композиция — модель сохранила центрированный формат, характерный для многих работ Климта, а также крупный план лица, что соответствует оригинальному стилю.
— Цветовая гамма — в сгенерированных изображениях доминируют золотые, тёплые тона, иногда с добавлением синих, зелёных или красных акцентов, что перекликается с палитрой золотого периода.
Вывод
Обучение генеративной модели на репродукциях картин Густава Климта показало, что нейросеть способна перенимать ключевые особенности его стиля (золотые фоны, орнаменты, плавные линии) и переносить их на новые портретные сюжеты. При этом качество результата напрямую зависит от разнообразия датасета и точности промптов.
Для дальнейшего улучшения можно расширить датасет изображениями с различными ракурсами, добавить примеры современных портретов и использовать дополнительные методы управления генерацией (ControlNet).
Таким образом, первоначальная идея проекта — продемонстрировать возможность переноса уникального орнаментального стиля Климта в современные портретные образы — может считаться реализованной. Полученная серия изображений подтверждает гибкость генеративных моделей и их потенциал для стилизации и творческого переосмысления классического искусства.
Генеративные нейросети
Stable Diffusion XL — базовая модель для генерации изображений и дообучения (DreamBooth + LoRA).
ChatGPT (OpenAI) — использовался для формулировки промптов, уточнения описаний и устранения ошибок в коде.
DeepSeek — применялся для объяснения технических деталей, корректировки параметров обучения и анализа результатов.




