Исходный размер 733x1024

Обучение Stable Diffusion / «Котовселенная»

Проект принимает участие в конкурсе

ИДЕЯ

Создание серии сюрреалистичных и стилизованных изображений моего кота Сайрекса. Идея заключается в том, чтобы поместить его в необычные, фантазийные миры или ситуации, сохраняя при этом его уникальные черты. Цель — научить нейросеть узнавать конкретного питомца: его окрас, форму глаз, положение пятен.

Проект исследует грань между документальной точностью фотографии и безграничной фантазией генеративных моделей.

Все изображения сделаны мной, так как в качестве датасета я использовала личный архив фотографий моего кота. Объём датасета: 30 изображений.

Я отбирала фотографии с разными ракурсами и позами, чтобы модель выучила объёмную форму кота.

Все изображения также были обрезаны до квадрата (1:1) и приведены к разрешению 1024×1024 пикселя. Фотографии используют идентичные имена для использования в обучении.

Примеры изображений из датасета

Примеры изображений из датасета

Примеры изображений из датасета

ОБУЧЕНИЕ

Вся работа строилась на коде преподавателя, поэтому порядок действий был полностью сохранён:

  1. Подготовка и загрузка необходимых библиотек;
  2. Импорт датасета, авторазметка;
  3. Обучение нейросети;
  4. Сохранение обученной модели и создание итоговых изображений.
Исходный размер 1352x854

РЕЗУЛЬТАТ

Для организации серии итоговых изображений я выбрала принцип от простого к сложному. В начале использованы краткие промпты, в ходе создания следующих генераций они усложняются.

prompts: cat syrex on the moon / cat syrex in the pool

Сначала я использовала максимально простые промпты для проверки работы обученной модели, задача была поместить Сайрекса в разное окружение.

Исходный размер 1024x1024

prompt: cat syrex in a library surrounded by books

prompts: cat syrex walking on water / with a butterfly

Модель выдавала неплохие результаты с представлением Сайрекса в роли разных профессий, потому я продолжила идти в этом направлении.

Исходный размер 1024x1024

prompt: cat syrex as a businessman in an office

prompt: cat syrex as a ballerina / a gardener

Исходный размер 1024x1024

prompt: cat syrex as a beekeeper, protective suit, surrounded by bees

prompts: cat syrex as a geisha, traditional kimono, cherry blossoms / as a detective with a trench coat and magnifying glass

prompt: cat syrex as a sushi chef, making rolls, Japanese restaurant / as a firefighter, holding a hose, dramatic fire background

Далее я решила перейти к более фентезийным промптам: сгенерировать средневековые образы.

Исходный размер 1024x1024

prompt: cat syrex on a throne, wearing a tiny crown, royal

prompts: cat syrex as a wizard, triangle hat, magic around / as a pirate on a ship

Исходный размер 1024x1024

prompt: cat syrex as a knight in an armor

prompts: cat syrex as a samurai with armor and katana, Japanese ink painting style / as an Egyptian pharaoh, golden collar, pyramids background, ancient

После я перешла к необычному окружению и поместила Сайрекса в разные фентезийные локации.

Исходный размер 1024x1024

prompt: cat syrex in a cyberpunk city, neon buildings

prompts: cat syrex in a magic forest, big mushrooms, color leaves / in a space surrounded by planets and stars

Исходный размер 1024x1024

prompt: cat syrex inside a snow globe, winter wonderland, miniature

Финальной идеей я выбрала разные художественные стили для изображения Сайрекса.

prompts: cat syrex made of stained glass, colorful, cathedral window style / in the style of Van Gogh, swirling starry night background, oil painting

Исходный размер 1024x1024

prompt: cat syrex as a graffiti, spray can, colorful mural, urban

Подводя результаты скажу, что обученая нейросеть неплохо справилась с изображением конкретного кота, но местами всё же выдавала неточные результаты.

Обучение Stable Diffusion / «Котовселенная»
Проект создан 22.03.2026
Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную...
Показать больше