Исходный размер 1041x1500

ГЕНЕРАЦИЯ ИЗОБРАЖЕНИЙ В СТИЛЕ УКИЁ-Э С ПОМОЩЬЮ DREAMBOOTH + LORA

Проект принимает участие в конкурсе

описание идеи всего проекта

Концепция проекта

Проект посвящен созданию нейросетевой модели, способной генерировать изображения в стиле Укиё-э (японская гравюра на дереве) с использованием технологий DreamBooth и LoRA для тонкой настройки Stable Diffusion XL (SDXL).

post

Актуальность

Укиё-э — уникальное направление японского искусства, получившее мировое признание благодаря работам таких мастеров, как Кацусика Хокусай («Большая волна в Канагаве») и Утагава Хиросигэ («53 станции Токайдо»).

Цель проекта

Обучить нейросеть генерировать изображения в стиле Укиё-э на основе 46 исходных изображений, используя метод DreamBooth с LoRA для экономии ресурсов и сохранения качества.

исходные изображения для обучения

post

Характеристика датасета Количество изображений: 46 Источник: Собраны из открытых источников

Содержание: Традиционные японские гравюры, включающие: Природные пейзажи (гора Фудзи, волны, сакура) Портреты (гейши, самураи, актеры кабуки) Мифологические существа (драконы, кицунэ) Архитектурные элементы (храмы, пагоды)

post

Содержание: Традиционные японские гравюры, включающие: Природные пейзажи (гора Фудзи, волны, сакура) Портреты (гейши, самураи, актеры кабуки) Мифологические существа (драконы, кицунэ) Архитектурные элементы (храмы, пагоды)

Исходные изображения: 46 изображений в формате JPG Разрешение: 1024×1024, 1:1

результирующая серия изображений

Сгенерированная серия (12+ изображений) Серия включает следующие темы:

1 Гора Фудзи и волны ukiyoe style, Mount Fuji with cherry blossoms and waves, Hokusai inspired 2 Гейша в саду ukiyoe style, geisha in colorful kimono walking in garden with umbrella 3 Самурай на закате ukiyoe style, samurai warrior at sunset with mountains and clouds 4 Японский дракон ukiyoe style, Japanese dragon flying over ocean waves, dramatic sky 5 Храм с сакурой ukiyoe style, traditional Japanese temple with pagoda and cherry blossoms 6 Карпы кои ukiyoe style, koi fish swimming in pond with water lilies 7 Осенний пейзаж ukiyoe style, autumn landscape with red maple leaves and bridge 8 Зимняя гора ukiyoe style, snow-covered mountain with pine trees 9 Бамбуковый лес ukiyoe style, bamboo forest with sunlight filtering through 10 Актер кабуки ukiyoe style, kabuki actor in elaborate costume 11 Лис-кицунэ ukiyoe style, fox spirit kitsune in magical forest 12 Журавли ukiyoe style, crane birds flying over mountains

развернутый комментарий к серии

Визуальный анализ и стилевые характеристики

post

Удалось передать следующие элементы стиля Укиё-э: Элемент стиля: Как проявился в сгенерированных изображениях Плоскостность: Отсутствие глубокой перспективы, фигуры расположены на нескольких планах Декоративность: Насыщенные цвета, орнаментальные узоры на кимоно и архитектуре Линейный контур: Четкие черные контуры, характерные для ксилографии Волны и вода: Стилизованные волны, узнаваемые по работам Хокусая Цветовая гамма: Преобладание синего, зеленого, красного и золотого Композиция: Асимметричные композиции, диагональные линии

Разнообразие композиций: Изображения 1, 2, 3: крупный план (фигуры, волны) Изображения 4, 5: средний план (храмы, драконы) Изображения 6, 7, 8: дальний план (пейзажи)

Цветовые вариации: Весенние тона: розовый, салатовый (изобр. 1, 5) Осенние тона: красный, оранжевый (изобр. 7) Зимние тона: белый, синий (изобр. 8)

Динамика: Статичные сцены: храмы, пейзажи Динамичные сцены: дракон, волны, летящие журавли

соответствие первоначальной идее

Что удалось

post

Узнаваемый стиль Укиё-э (волны, контуры, цветовая гамма) Разнообразие тем (природа, люди, мифология) Высокое качество генерации

ноутбук с кодом и описание процесса обучения

Архитектура проекта Проект структурирован в 18 основных этапов:

  1. Установка библиотек
  2. Проверка GPU
  3. Создание папки для датасета
  4. Загрузка изображений
  5. Предпросмотр изображений
  6. Загрузка BLIP для подписей
  7. Создание промптов в стиле Укиё-э
  8. Генерация подписей через BLIP
  9. Создание JSONL файла
  10. Загрузка JSONL на GitHub
  11. Очистка памяти
  12. Загрузка скрипта обучения
  13. Параметры обучения
  14. Запуск обучения (500 шагов, ~50 минут)
  15. Сохранение модели на Google Drive
  16. Сохранение информации о модели
  17. Генерация 12+ изображений
  18. Отображение результатов

Этапы обучения Этап 1: Подготовка данных Загружено 46 изображений BLIP сгенерировал подписи Добавлен префикс «ukiyoe style, traditional Japanese woodblock print, " Создан JSONL файл metadata.jsonl

Этап 2: Загрузка модели SDXL base model (6.94 GB) VAE для экономии памяти LoRA адаптер

Этап 3: Обучение bash accelerate launch train_dreambooth_lora_sdxl.py
--pretrained_model_name_or_path="stabilityai/stable-diffusion-xl-base-1.0»
--dataset_name="ukiyoe_style»
--output_dir="ukiyoe_style_lora»
--resolution=1024
--train_batch_size=1
--gradient_accumulation_steps=4
--max_train_steps=500
--use_8bit_adam
--mixed_precision="fp16»

Результаты обучения: Шаг 250: loss = 0.231 Шаг 500: loss = 0.193 Время: ~50 минут на T4 GPU

Роль GenAI в проекте: BLIP — создал 46 текстовых описаний, которые использовались для обучения модели SDXL + LoRA — основная генеративная модель, обученная на датасете ChatGPT — помог структурировать документацию и описать результаты GitHub Copilot — ускорил написание кода, предложил оптимизации

результаты и выводы

Достигнутые результаты

Результат Количество обученных изображений 46 Количество сгенерированных изображений 12 Время обучения ~50 минут Размер LoRA модели ~50 MB Качество генерации 1024×1024

Что получилось Модель научилась генерировать узнаваемый стиль Укиё-э Сохранены характерные элементы: волны, контуры, цветовая гамма Разнообразные темы: природа, портреты, мифология Высокое качество детализации

post

Вывод Я реализовала задачу обучения модели Stable Diffusion XL на стиль Укиё-э с использованием DreamBooth и LoRA. Полученная модель способна генерировать высококачественные изображения в традиционном японском стиле по текстовым промптам. Созданная серия из 12 изображений демонстрирует разнообразие тем и высокое качество передачи стилистических особенностей японской гравюры.

ГЕНЕРАЦИЯ ИЗОБРАЖЕНИЙ В СТИЛЕ УКИЁ-Э С ПОМОЩЬЮ DREAMBOOTH + LORA
Проект создан 21.03.2026
Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную...
Показать больше