Исходный размер 2118x3032

Обучение Stable Diffusion под графический стиль японских спичечных этикеток

Проект принимает участие в конкурсе

Концепция

Бесспорно, Япония всемирно известна и своими гравюрами укиё-э, значительно повлиявшими на творчество европейских постимпрессионистов, и древним искусством кинцуги, подчеркивающим красоту дефектов, а также графикой суми-э, традицией каллиграфии, оригами, и многим другим. Тем не менее, в этом проекте мне захотелось уделить внимание более тихой и трогательной форме японской художественной мысли, а именно — графическому стилю такой утилитарной и повседневной вещи, как коробка спичек.

big
Исходный размер 1024x661

Стиль японских спичечных коробок эпохи Мэйдзи (1868 — 1912) и Сёва (1926 — 1989) отличается уникальной палитрой, зернистостью печати и сочетанием восточной эстетики с западной типографикой. На этих коробках часто изображаются драконы и тигры, а бытовые сюжеты имеют флёр магического реализма из-за яркой палитры и динамики.

Меня сильно подкупила стилистика этих коробочек, где минимализм и максимализм словно сочетались в едином художественном языке.

Вдохновившись непосредственностью этой эстетики, мне захотелось создать что-то вроде оммажа этой эпохе в виде серии иллюстраций, посвященных винтажным упаковкам азиатских спичек.

Процесс обучения

Подготовив датасет, я загрузила его на Kaggle. Выбирая изображения, я старалась составить список наиболее колоритных картинок, по возможности несильно искаженных в качестве. Тем не менее, модель должна была «схватывать» характерную зернистость потертых временем ретро-картинок, чтобы результат был приближен к референсу.

Затем с использованием модели LoRA были направлены все референсы и промпты для анализа и обработки данных.

Исходный размер 1360x578

Изначально обучение планировалось в Google Colab, однако из-за ограничения бесплатного доступа к GPU работа была перенесена в Kaggle Notebooks, где доступно до 30 часов GPU в неделю.

Исходный размер 1596x302

Далее применялись промпты разной комплексности. В процессе работы я поняла, что за base_token удобнее было бы взять не «japanese vintage matchbox object in jmstyle», а «object in jmstyle» во избежание путаницы. Однако результатами генераций я осталась довольна.

Результаты обучения

Исходный размер 1024x1024

С запросами сгенерировать конкретный образ, к примеру, дракона или тигра, модель справляется успешно. Удачно выходит изобразить и миниатюру на коробочке, и фрагмент иллюстрации.

У модели удачно получается генерировать спичечные коробки в заданной стилистике. Изображение пейзажей тоже дается ей легко. Палитра исходников и свойственный им минимализм здесь соблюдены. Тем не менее, эти генерации кажутся более современными, в них меньше зернистости, налета «ретро».

Исходный размер 1024x1024

Здесь я попробовала сгенерировать пейзаж в стиле винтажной открытки, чтобы не уходить далеко от изначального стиля.

Мои любимые текстурные генерации — эти получившиеся абстракции. На мой взгляд, это было бы чудесной открыткой или иллюстрацией. К тому же, генерации все еще соблюдают заданную моделью цветовую палитру.

Временами модель выдавала фрагменты картинок, а не полный их план. Скорее всего, это связано с тем, что не все изображения в датасете были формата 1:1. Несмотря на это, мне нравится такая фрагментация, ведь она придает картинкам реалистичности — очень многие изображения с оформлением японских спичек были сняты именно так. Поэтому я считаю, что эксперимент вышел успешным.

Инструменты, использованные для реализации проекта:

Pinterest — сбор фотографий для датасета

Stable Diffusion — обучение генеративной нейросети под свой стиль

Kaggle Notebook — выполнение кода и генераций

Google Gemini — помощь в написании кода и промптов

Обучение Stable Diffusion под графический стиль японских спичечных этикеток
Проект создан 24.03.2026
Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную...
Показать больше