Текстуры моего дома. Обучение нейросети. на Creative city

Идея проекта

Проект посвящён обучению нейросети распознаванию и генерации визуальных текстур, найденных в повседневной домашней среде. В отличие от классических датасетов, включающих природные или городские поверхности, данный проект фокусируется на микромире квартиры — тех деталях, которые обычно остаются незамеченными.

Современный человек окружён огромным количеством визуальной информации, однако редко обращает внимание на фактуру привычных вещей. Дерево стола, ткань дивана, поверхность хлеба или запотевшее стекло в ванной — всё это обладает сложной структурой, напоминающей природные или абстрактные формы.

Проект предлагает рассмотреть дом как самостоятельную визуальную экосистему. Каждая поверхность здесь может быть интерпретирована как уникальный паттерн: трещины на дереве — как рельеф местности, ткань — как поле, капли воды — как атмосферные явления.

Цель проекта — собрать набор изображений текстур (датасет), снятых в домашних условиях, и обучить модель Stable Diffusion XL воспроизводить и трансформировать эти текстуры в абстрактные визуальные композиции. В результате нейросеть сможет генерировать новые изображения, основанные на материальности повседневной среды, но выходящие за пределы её прямого восприятия.

Исходники

В основу датасета для обучения нейросетевой модели легли личные фотографии текстур в моей квартире.

Были подобраны разнообразные образцы: древесина, краска на стенах, плитка в ванной, подушки и фарфоровые фигурки, металлические абажуры и медные лампы,

Ссылка на датасет

Исходный размер 2748x1102

Часть датасета для обучения

Исходный размер 2410x1380

Перевод изображений формата HEIC в формат, который будет читаемый для Python (jpg)

Каждое изображение было приведено к единому формату 1:1 и использовано для обучения LoRA-надстройки модели SDXL

Исходный размер 2086x1194

Код для подключения датасета и создания json файла

Процесс обучения

После настройки окружения и установки необходимых зависимостей была загружена базовая модель Stable Diffusion XL. Параметры обучения были сконфигурированы таким образом, чтобы по завершении ноутбук автоматически сохранял веса LoRA, а также промежуточные чекпоинты каждые 300 шагов — это позволяет в любой момент возобновить обучение с нужной точки, продолжить с последнего чекпоинта или откатиться к предыдущему.

Исходный размер 2312x890

Финальный вид обучения LoRA

Итоговые серии панно

Исходный размер 1882x500

Код для генерации изображений

Исходный размер 1498x1280

На этом этапе были сгенерированы первые изображения

В первом промте мне хотелось сделать единые по материалу панно (древесина/железо/ткань). Что у нейросети хорошо получилось

Промт: abstract collage, patchwork of wood, ultra detailed, 8k

Исходный размер 3390x1024

Далее я написала промт, который бы активно совмещал мои объекты на едином панно и это именно те результаты, к которым я стремилась в данном работе.

Promt: abstract collage in HOMETXTR style, patchwork of, ceramics, glass, iron or fabric textures, mixed media art, rich warm colors, ultra detailed, 8k

Исходный размер 620x500

Исходный размер 2304x1856

Итоговая серия состоит из генераций, выполненных в стиле моих текстурных работ, однако не воспроизводящих их напрямую. В серии прослеживаются характерные материальные сочетания — дерево, стекло, ткань — переработанные моделью в новые композиции.

Примечательно, что в ряде изображений нейросеть воспроизвела фактуры и цветовые решения, близкие к оригинальному датасету, что свидетельствует об успешном усвоении визуального стиля.

Главным в этой серии становится не точность воспроизведения, а сохранение узнаваемой интонации исходных текстур: фактурности, слоистости, приглушённой палитры и ощущения материальности.

Вывод

Обучение генеративной модели на текстурах домашнего пространства показало, что даже ограниченный и локальный датасет способен дать выразительные и разнообразные результаты. Нейросеть успешно улавливает повторяющиеся паттерны, структуру материалов и особенности освещения, превращая их в абстрактные визуальные формы.

Проект демонстрирует, что художественная ценность может быть обнаружена в самых обыденных объектах, если изменить способ наблюдения за ними. Домашняя среда перестаёт быть фоном и становится источником визуального исследования.

Однако для повышения качества генерации и разнообразия результатов требуется:

расширение датасета (больше материалов, ракурсов и освещения), добавление контрастных текстур (гладкие vs шероховатые, сухие vs влажные), использование дополнительных инструментов (например, ControlNet или LoRA для более точного контроля структуры),

Ссылка на коллаб

В рамках проекта использовались две модели. Основной стала Stable Diffusion XL с дообучением через DreamBooth LoRA — на её основе проводилось обучение на моём датасете текстур и последующая генерация итоговой серии. В качестве вспомогательного инструмента использовался ChatGPT — для помощи с написанием и отладкой Python-кода.