Исходный размер 512x640

Мурка-путешественница. Обучение генеративной нейросети Stable Diffusion

Концепция проекта

«Мурка-путешественница» — это проект о воображаемом побеге домашней кошки за пределы привычного пространства. В реальности Мурка никогда не выходит из дома, поэтому генеративная модель становится инструментом, позволяющим представить альтернативные сценарии её жизни — прогулки, путешествия и ситуации, которые невозможны физически.

Идея и мотивация

Идея проекта возникла из личного наблюдения: Мурка полностью изолирована от внешнего мира. Используя Stable Diffusion и дообучение модели, я попыталась создать серию фотореалистичных изображений, в которых кошка оказывается в различных пространствах — от повседневных до фантазийных, сохраняя при этом узнаваемую внешность и анатомию.

Датасет

Для обучения модели был собран кастомный датасет фотографий моей кошки Мурки из личного архива. Датасет включал 64 изображения в высоком разрешении (3000×3000), приведённые к квадратному формату (1:1) и масштабированные до 640×640 для обучения.

При отборе изображений сознательно использовались разнообразные ракурсы, позы и условия освещения, что позволило модели лучше зафиксировать идентичность персонажа и корректно воспроизводить его в различных сценах и положениях тела.

Особое внимание уделялось анатомии, пропорциям и узнаваемым деталям морды.

0

Парочка фотографий из моего датасета

Про генерацию и контроль результата

Основной задачей генерации было сохранение анатомической корректности и узнаваемости кошки при смене контекста. Для этого использовались негативные промпты и ручная настройка параметров генерации, позволяющие избежать деформаций и случайных искажений.

Результаты

В результате была создана серия изображений, в которых Мурка «путешествует» по различным пространствам, оставаясь узнаваемой и реалистичной. Проект не стремится к документальности, а работает с образом и воображаемым сценарием.

0

Сгенерировано обученной моделью + промпт

0

Сгенерировано обученной моделью + промпт

0

Сгенерировано обученной моделью + промпт

Мурка на крыше

Сгенерировано обученной моделью

Исходный размер 1153x330

Промпт

Исходный размер 640x640

Сгенерировано обученной моделью

Мурка среди цветочков

Сгенерировано обученной моделью

0

Промпт

Сгенерировано обученной моделью

Мурка на корабле

Сгенерировано обученной моделью

0

Промпт

Мурка в Египте

Сгенерировано обученной моделью

0

Промпт

Исходный размер 640x640

Сгенерировано обученной моделью

Мурка на яхте

Сгенерировано обученной моделью

0

Промпт

Исходный размер 640x640

Сгенерировано обученной моделью

Мурка в Азии

Сгенерировано обученной моделью

Исходный размер 1106x390

Промпт

Исходный размер 640x640

Сгенерировано обученной моделью

Мурка среди детских игрушек

Сгенерировано обученной моделью

0

Промпт

Сгенерировано обученной моделью

Мурка на фоне Новогодних декораций

Сгенерировано обученной моделью

0

Промпт

Сгенерировано обученной моделью

Мурка в космосе

Сгенерировано обученной моделью

0

Промпт

Исходный размер 640x640

Сгенерировано обученной моделью

Мурка на фоне взрыва

левая 04_______________________________________________________________________правая 01 Сгенерировано обученной моделью

0

Промпт

левая 04_______________________________________________________________________правая 01 Сгенерировано обученной моделью

Мурка на пляже

02 Сгенерировано обученной моделью

0

Промпт

левая 03_______________________________________________________________________правая 04 Сгенерировано обученной моделью

Дополнительная серия

Дополнительная серия изображений была создана на основе тех же обученных весов и промптов и расширяет основную концепцию проекта.

0

Сгенерировано обученной моделью

Описание применения генеративной модели

В проекте использовались инструменты генеративного искусственного интеллекта.

Модель Stable Diffusion XL применялась для обучения и генерации изображений персонажа на основе кастомного датасета.

Дополнительно использовался ChatGPT как вспомогательный инструмент для консультаций по структуре пайплайна, формированию промптов и описанию проекта. ChatGPT не использовался для генерации визуальных материалов.

Обучение модели проводилось в Google Colab с использованием готового пайплайна DreamBooth + LoRA для Stable Diffusion XL. Ноутбук фиксирует экспериментальный процесс подбора параметров, датасета и промптов. Из-за ограничений среды Colab (ограничения по памяти и времени сессии) ноутбук не является воспроизводимым «one-click» решением, а отражает исследовательский характер работы.

Спасибо за внимание!

Мурка-путешественница. Обучение генеративной нейросети Stable Diffusion
Проект создан 11.02.2026
Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную...
Показать больше