Исходный размер 1140x1600

Обучение нейросети

Проект принимает участие в конкурсе

ИДЕЯ ПРОЕКТА

Для работы на данным проектом я вязла иллюстрации Нестеровой Анастасии к анимации «Яков Брюс». В итоговой работе мне было важно отразить элементы ее авторского почерка, такие как монохромность, шумная картинка, отсутствие лайна, мрачная атмосфера.

Для обучения был использован датасет из авторских изображений в мрачной монохромной эстетике, собранный в папке проекта и приведенный к единому квадратному формату 512×512. В визуальном языке работ повторяются зернистая фактура, высокий контраст, приглушенная палитра, графичность и тревожная атмосферность сцен — именно эти признаки стали основой стилевого обучения. ⋆ Проект реализован в Google Colab на базе Stable Diffusion v1.5 с дообучением в формате LoRA. Была настроена среда с нужными библиотеками (diffusers, transformers, peft, accelerate), подключен Google Drive, после чего изображения автоматически проверялись и приводились к единому техническому стандарту (RGB, квадрат, 512×512). Это позволило обучать модель на визуально однородном материале. ⋆ В качестве стилевого якоря в обучение был добавлен единый текстовый маркер: «in style of Nesterova». ⋆ Обучение выполнялось на GPU NVIDIA T4 в режиме mixed precision, где дообучались attention-слои UNet через LoRA-адаптеры. После обучения веса подключались к базовой модели, и начинался этап генерации. На этапе подбора prompt акцент делался на ключевых признаках исходного художественного языка: монохром, зерно, графичность, темная атмосфера, сюрреалистические интерьерные сцены. ⋆ В результате получена система генерации, которая не копирует исходные изображения, а воспроизводит их общую визуальную логику и переносит стиль в новые композиции.

ИСХОДНИКИ

Иллюстрации к анимации «Яков Брюс»

Иллюстрации к анимации «Яков Брюс»

Иллюстрации к анимации «Яков Брюс»

ПРОЦЕСС

big
Исходный размер 942x414

Технические детали

Исходный размер 785x867

Загружен датасет из 31 работы

Исходный размер 1068x807

Автоматически созданы промты к исходным изображениям

Исходный размер 1280x934

Процесс обучения модели на 20 эпохах

Исходный размер 1280x802

Генерация изображений по подобраному промту передающему стилистику изображений

РЕЗУЛЬТАТ

НОУТБУК С КОДОМ

Обучение нейросети
Проект создан 24.03.2026
Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную...
Показать больше