Исходный размер 1140x1600

Katsushika Hokusai.Обучение генеративной нейросети.

Рубрикатор

[1] Описание проекта [2] Исходные работы для обучения [3] Результирующая серия изображений [4] Комментарий [5] Ноутбук с кодом для обучения [6] Вывод

[1] Описание проекта

Основой и вдохновением для создания данного проекта послужили работы выдающегося художника 1760–1849 годов Кацусика Хокусая. Главной целью же является обучение генеративной модели Stable Diffusion с LoRA-тюнингом для достижения генерации изображений, которые, в свою очередь, были бы идентичны и соответствовали работам автора. Идея заключается в следующем: нейросеть, с учетом особенностей цветовой палитры, стилистических приемов, расположением природы, людей и животных, должна передать не только точность деталей, но и настроение, в которое нас погружает художник.

Для реализации вышесказанной цели был собран датасет из работ Кацусика Хокусая, включающий в себя различные сюжеты…

[2] Исходные работы для обучения

0

Кацусика Хокусай, Япония, 1760-1849

[3] Результирующая серия изображений

Prompt: «Cherry blossom petals falling like pink snow on an old wooden bridge in a Kyoto garden / A peaceful Zen rock garden with raked patterns, morning dew on the stones».

Prompt: «A merchant street in Edo period Japan with vendors selling traditional goods / A Shinto priest performing a ritual at the Itsukushima Shrine during high tide».

Prompt: «A solitary figure walking through the red torii gates of Fushimi Inari shrine at sunset / Karate master in a red gi with black belt executing a powerful kick, dynamic red and black energy».

Prompt: «A samurai practicing kenjutsu with his katana in a snow-covered courtyard / A warrior’s ghost haunting an ancient battlefield where wildflowers now grow».

Prompt: «A detailed ukiyo-e style depiction of Mount Fuji viewed from a fishing village with traditional boats / A lone ronin walking down a deserted road through rice fields, distant mountains».

Prompt: «Samurai in an intense duel during a heavy rainstorm, water splashing with every movement/A lone samurai standing on a rocky coast, katana in hand, facing the crashing waves of a turbulent sea».

Prompt: «Serene geisha playing the shamisen under a blooming sakura tree, her kimono detailed with intricate patterns/Geisha with red kimono and black obi holding a fan, dramatic red and black».

Prompt: «Samurai in crimson armor with black lacquer details drawing his katana, intense red and black lighting/Traditional Japanese fan painted with stark red and black patterns».

0

Prompt: «A traditional Japanese festival with fireworks over a river, people in yukata / A traditional wooden inn by a river, paper lanterns glowing warmly against the night / A neon-lit Tokyo street at night blending with ancient temple gates, futuristic and traditional».

Prompt: «The solemn ritual of seppuku in a dimly lit traditional room, shadow figures observing in silence / A traditional tea ceremony in a sparse tatami room, focus on the graceful hand movements».

0

Prompt: «A mysterious fox spirit disguised as a beautiful woman in a misty bamboo forest at dusk / Capybara / A majestic dragon coiled around a pagoda during a thunderstorm, lightning illuminating the scene».

Prompt: «A mythical kitsune playing with glowing orbs in an ancient forest, bioluminescent plants/A peaceful scene of carp koi swimming in a pond surrounded by maple trees».

[4] Комментарий

Итоговая серия работ наглядно демонстрирует, как алгоритм усвоил и переосмыслил ключевые принципы искусства Кацусика Хокусая…

[1] Нейросеть блестяще уловила динамику и монументальность природы. Передача глубины пространства строится на тонкой игре оттенков и резких контрастах, что характерно для гравюр укиё-э. [2] Четкое следование принципам — смещенные горизонты, диагонали, задающие движение, и всегда доминирующий, сакральный образ горы, объединяющий многие сцены. [3] Алгоритм научился расставлять акценты, наполняя работы значимыми элементами: будь то лодки рыбаков, или фигурки путников и самураев. [4] Многие изображения обладают характерной для старинной гравюры зернистостью и ступенчатым переходом цветов.

Главное достижение, на мой взгляд, заключается в том, что нейросеть не просто копирует, а усваивает саму суть стиля: его эпический размах, динамику линий и философское восприятие природы, перенося эти принципы на любые сюжеты.

Процесс: [1] подключение видеокарты, для этого используем Google Collab; [2] подготовка датасета, исходных изображений (.jpg); [3] генерация текстовых описаний (промптов) для каждого фрагмента (image-to-text); [4] настройка и запуск процесса обучения (тюнинг модели); [5] генерация итоговой серии.

[6] Вывод

Подводя итог всему вышесказанному, можно сделать вывод: цель проекта удалась. Нейросеть успешно обучилась генерировать не только природу, архитектуру, людей и животных, но и передавать идею, ту самую атмосферу и настроение в работах. Не менее важно: стиль художника был учтен!

Katsushika Hokusai.Обучение генеративной нейросети.
Проект создан 10.11.2025
Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную...
Показать больше