Исходный размер 1920x2707

Брутализм: обучение ИИ модели

Проект принимает участие в конкурсе

Мой проект посвящен обучению нейросети воспроизведению архитектурного стиля брутализма в абстрактых формах.

Брутализм это направление (стиль) в архитектуре периода 1950—1970-х годов, первоначально появившееся в архитектуре Великобритании. Одна из ветвей послевоенного архитектурного модернизма.

Цель проекта — научить модель Stable Diffusion v1.5 от Runway ML архитектурному стилю брутализм и дать ей возможность воспроизводить его в других, более абстрактных формах.

Источники данных

Все фотографии для обучения я взял с открытого ресурса pexels.com, на котором все можно скачать бесплатно и где нет лицензии. Я отобрал различные здания в стиле брутализма в качестве датасета для обучения модели.

Исходный размер 2147x473

Весь датасет, всего 19 изображений

Все изображения я привел к единому формату — 1:1, 512×512 px.

Исходный размер 564x908

Код для приведения картинок к единому разрешению

Исходный размер 595x249

Импорт библиотек и очистка кэша

Исходный размер 1004x109

Датасет для обучения

Исходный размер 1095x427

Загрузка модели Stable Diffusion 1-5

Исходный размер 660x268

Настройка LoRA

Обучение модели

Это fine-tuning Stable Diffusion на конкретном стиле (брутализм) с использованием текстовых эмбеддингов и диффузионного процесса.

Таргетированное обучение — модель дообучается на одном промпте «a building in brutalism style» для генерации зданий в стиле брутализма.

Настройка — обучается только UNet (генератор), текстовый энкодер и VAE заморожены в режиме .eval ().

Диффузионный процесс — используется классический диффузионный пайплайн с добавлением шума и предсказанием шума через MSE loss.

Модель обучается на датасете фотографий и дообучается на основе промпта.

Исходный размер 722x513

Финальная подготовка датасета для обучения

Исходный размер 640x1051

Обучение

Исходный размер 702x277

Сохранение весов

Генерация изображений

Исходный размер 572x530

Генерация ч.1

Исходный размер 1097x720

Генерация ч.2

Исходный размер 1920x1080

a brutalist mask, concrete face covering, geometric patterns, tribal industrial

Маска успешно переняла ключевые черты брутализма: бетонная текстура, геометрические угловатые формы, минималистичный дизайн и индустриальная эстетика. Модель корректно перенесла архитектурный стиль на предмет, сохранив узнаваемость маски при полной стилизации под абстрактность, грубый бетон с чёткими линиями и фактурной поверхностью.

Исходный размер 1920x1080

a brutalist camera, concrete body, geometric lens design, industrial aesthetic

Камеры получились в чистом бруталистском стиле: массивный бетонный корпус с грубой текстурой, геометрический объектив в виде усечённой пирамиды и минималистичный дизайн без лишних деталей. Модель относительно успешно сохранила функциональную форму фотоаппарата, но получилось также и много искажений.

Исходный размер 512x512

a brutalism style rose flower, concrete petals, stone texture, geometric forms

Роза превращена в бетонную скульптуру: лепестки стали геометрическими сегментами из грубого камня, сохранив лишь намёк на органическую форму. Модель заменила природную нежность цветка на индустриальную жёсткость — получился архитектурный объект, где от розы осталась только силуэтная узнаваемость в угловатых бетонных плоскостях.

Исходный размер 1920x1080

a brutalist chess set, concrete chess pieces, geometric angular forms, raw stone texture, minimalist design, industrial aesthetic

Шахматные фигуры стали монолитными бетонными объектами: угловатые абстракции. Модель максимально упростила формы до геометрических примитивов, сохранив лишь намёк на оригинальные силуэты, и покрыла всё грубой каменной текстурой в духе индустриального минимализма.

Исходный размер 1920x1080

a brutalist fountain, concrete water feature, geometric angular design

Фонтан превращён в геометрическую бетонную композицию. Модель приблизительно сохранила функциональность водного объекта, но сделала его абсолютно бруталистским — монолитные плоскости, острые углы и «неотделанный» бетон вместо декоративных элементов.

Исходный размер 1920x1080

a brutalist coffee table, raw concrete slab, geometric angular legs, minimalist design

Стол получился предельно абстрактным — это не функциональный предмет мебели, а скорее бетонная инсталляция. Модель создала не стол, а композицию из геометрических форм: массивный параллелепипед стоит на трёх угловатых блоках, все поверхности покрыты грубой фактурой «сырого» бетона. От реального кофейного стола осталась лишь концепция «поверхность на опорах», реализованная как архитектурный минимализм.

Исходный размер 1920x1080

a brutalism style horse, concrete body, angular geometric forms

Лошадь превратилась в абстрактную бетонную скульптуру, композицию из геометрических блоков, где лишь угадывается силуэт. Получился не конь, а архитектурный объект в духе кубистической деформации, покрытый грубой бетонной фактурой.

Исходный размер 1920x1080

a brutalist abstract art piece, raw concrete body, geometric angular details

Это чистая абстракция, композиция из угловатых бетонных форм без намёка на какой-либо узнаваемый объект. Модель создала архитектурную скульптуру: грубые параллелепипеды и призмы сложены в динамичную структуру с глубокими тенями и фактурной поверхностью «необработанного» бетона. Получился бруталистский арт-объект, где геометрия и материал становятся единственным содержанием.

Выводы

Обучение Stable Diffusion на архитектуре брутализма показало, что нейросеть успешно перенимает ключевые стилистические черты — грубые бетонные текстуры, геометрические формы и индустриальную эстетику, а также переносит их на несвойственные объекты. Это демонстрирует гибкость диффузионных моделей в адаптации архитектурного стиля к различным предметам.

Однако результаты выявили ограничения: модель склонна к абстракции и деформации форм, особенно при работе с органическими объектами. Для улучшения качества требуется расширение датасета, включение большего разнообразия ракурсов и деталей, а также использование дополнительных техник контроля композиции. Также требуется более продвинутая ИИ модель.

Тем не менее, проект подтвердил потенциал генеративных моделей в творческом переосмыслении архитектурных стилей и создании гибридных объектов на стыке дизайна и искусства.

ГенИИ — Stable Diffusion v1-5 Доп. Технологии — LoRA, Diffusers, PEFT

Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную...
Показать больше