Концепция проекта
Мой проект исследует границы генеративной модели через контролируемую деформацию объекта, обучая LoRA на датасете из 10 макро-фотографий цветов. Серия из 5 изображений демонстрирует постепенное удаление от реалистичной реконструкции к полной абстракции: от идеально точного воспроизведения анатомии цветка через появление странных мутаций и гибридизацию с другими формами к активной деформации структуры и финальной абстракции в стиле Кандинского. Ключевая идея — визуализировать, как нейросеть, усвоив «норму» из обучающего датасета, начинает её трансформировать под влиянием семантических промптов, постепенно разрушая биологическую достоверность. Результатом становится исследование того, где заканчивается реконструкция и начинается креативность генеративной модели.
Исходные изображения для обучения
Источники и права использования:
-10 макро-фотографий цветов с сайта стоковых фотографий Pexels -Все изображения имеют лицензию Pexels License, разрешающую свободное использование, модификацию и адаптацию для коммерческих и некоммерческих целей без указания авторства -Изображения переформатированы в формат 1:1 с высоким разрешением для обеспечения качества обучения -Фотографии представляют различные виды цветов в естественном освещении с акцентом на текстуру лепестков и детализацию
Результирующая серия изображений
На основе промптов получена серия из 5 изображений:
«Realistic reconstruction» — Макро-фотография цветка с идеальной анатомией, естественным освещением и высокой детализацией, имитирующая профессиональную съемку
«Beginning of distortion» — Цветок с необычными мутациями: лишние лепестки, странные формы и мягкое сюрреалистическое свечение, сохраняющий узнаваемую структуру
«Hybridization» — Гибридный цветок, объединяющий элементы орхидеи, кактуса и морской звезды с биолюминесцентным свечением и фрактальными узорами
«Deformation» — Деформированный цветок с эффектом плавления и глитч-арта, погружающийся в зловещую долину между реальностью и абстракцией
«Abstraction» — Абстрактная композиция в стиле Кандинского и Поллока, где цветок теряет узнаваемую форму, превращаясь в экспрессивное цветовое пятно
Развернутый комментарий результатов
Анализ соответствия концепции:
Проект успешно демонстрирует постепенную трансформацию формы цветка от реалистичной реконструкции к полной абстракции. Модель усвоила ключевые визуальные характеристики обучающего датасета и плавно деформирует их под влиянием семантических промптов.
Переданные элементы стиля:
Текстурная идентичность — Фактура лепестков, цветовая гамма и макро-детализация исходных изображений сохраняются на всех этапах генерации Композиционная стабильность — Единый формат крупного плана обеспечивает чистоту эксперимента и фокус на трансформации формы Постепенность деформации — Модель демонстрирует контролируемый переход от биологической достоверности к художественной абстракции Цветовая преемственность — Насыщенность и оттенки, характерные для исходного датасета, прослеживаются даже на этапе абстракции
Визуальный анализ изображений:
Изображение 1 («Realistic reconstruction»): — Максимальная биологическая достоверность формы цветка — Естественное освещение и глубина резкости, характерные для исходных фотографий — Идеальная симметрия лепестков и точная текстура
Изображение 2 («Beginning of distortion»): — Сохранение общей структуры цветка при легком нарушении пропорций — Мягкое свечение и сюрреалистическая атмосфера
Изображение 3 («Hybridization»): — Успешное смешение признаков разных растений (орхидея, кактус) — Появление нехарактерных структурных элементов — Сохранение макро-эстетики при отказе от биологической чистоты
Изображение 4 («Deformation»): — Активное разрушение симметрии и логики строения цветка — Эффект плавления и деформации при сохранении текстурных характеристик — Переход в область сюрреализма
Изображение 5 («Abstraction»): — Полная утрата узнаваемости формы цветка — Сохранение лишь цветовых отсылок к исходному объекту — Экспрессивная абстрактная композиция, фиксирующая границу возможностей модели
Техническая реализация
Процесс обучения
Архитектура и параметры: — Базовая модель: Stable Diffusion 1.5 — Метод адаптации: DreamBooth с LoRA — Размер датасета: 10 изображений — Количество эпох: 30 — Разрешение: 512×512 пикселей
Описание процесса Обучение проводилось на датасете из 10 макро-фотографий цветов в формате 1:1. Для оптимизации использовались gradient checkpointing, 8-битная оптимизация (8-bit Adam) и mixed-precision (fp16), что позволило эффективно обучать модель на GPU T4. Уникальный токен «sks flower» обеспечил точную привязку стиля и объекта.
Описание применения генеративной модели
Использованные модели ИИ:
Stable Diffusion XL 1.0 — Ссылка: https://huggingface.co/stabilityai/stable-diffusion-xl-base-1.0 — (Базовая архитектура для генерации изображений)
Dreambooth + LoRA методик — (Эффективная персонализация базовой модели под специфический стиль)




