Исходный размер 1140x1600

Обучение нейромодели на каблуках

Проект принимает участие в конкурсе

Референсы

big
Исходный размер 1054x1054

Для обучения генеративной модели я решила взять женскую обувь, а точнее различные каблуки. Я занимаюсь дизайном и мне были интересно как нейромодель будет генерировать новые варианты обуви.

Для датасета я взяла изображения различных видов женской обуви. Все они приведены к размеру 1:1.

Сгенерированные изображения

При генерации одной пары каблуков генеративная модель справляется со значительным успехом.

При увеличении количества пар обуви, модель начинает вести себя нестабильно и путаться.

Исходный размер 2048x2048
Исходный размер 2048x2048

При этом важно отметить, что все изображения генеративная модель собрала в единой стилистике и цветовой гамме. В целом при одиночной генерации модель прекрасно справляется и невероятно четко генерирует пару каблуков.

Описание процесса обучения

post

В ходе обучения нейросети Stable Diffusion XL я использовала среду Гугл коллаб с серверным ускорителем Python 3 на базе GPU, чтобы ускорить процесс обучения и генераций.

В результате генеративная модель создала серию изображений по заданному промту. Нейромодель начала вести себя некорректно при увеличение детализации изображений и генерации стали нестабильными, сильно проседало качество, что в целом очевидно, так как ей не хватало исходных данных.

Описание применения генеративных моделей

Исходный размер 703x152

Chat GPT использовался для написания промтов к финальной части генераций.

Обучение нейромодели на каблуках
Проект создан 24.03.2026
Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную...
Показать больше