Исходный размер 1140x1600

Репрезентация художественного стиля средневековья в генеративных моделях

Проект принимает участие в конкурсе

Идея проекта

Идея проекта заключается в обучении генеративной нейросети воспроизведению визуального языка средневековой живописи. В данном случае речь идёт не о поверхностной стилизации или наложении эффекта «под старину», а о попытке глубокого освоения художественных принципов эпохи. Средневековое искусство отличается особой системой изображения, в которой важную роль играют композиция, символика, цвет и условность форм. В рамках проекта ставится задача проверить, способна ли современная генеративная модель не просто копировать отдельные визуальные элементы, но и воспроизводить саму логику построения изображения, характерную для средневековой культуры, а также применять её к новым сюжетам.

Примеры исходных изображений

В качестве обучающего материала использовались изображения средневековой живописи, включающие религиозные сцены, иконопись, миниатюры из рукописей, фрески, а также изображения святых, правителей и бытовых эпизодов.

Исходный размер 1734x1150

Визуальный язык таких произведений отличается декоративностью, орнаментальностью и иерархическим построением композиции, где значимость персонажей передаётся через масштаб и расположение. Подобранный датасет позволяет сформировать у модели целостное представление о стиле и ключевых принципах средневекового искусства.

Процесс обучения

Для создания модели был применён метод Fine-tuning нейросети Stable Diffusion XL (SDXL) 1.0.

Использовалась технология Low-Rank Adaptation, которая позволяет «обучить» модель новому стилю, не меняя её базовых знаний. Процесс занял 500 шагов обучения, что обеспечило баланс между узнаваемостью стиля и гибкостью генерации.

Основой послужил датасет, включающий 198 изображений средневекового искусства.

Исходный размер 2258x692

Загрузка датасета для обучения

Исходный размер 821x545

Настройка параметров

Исходный размер 2035x586

Входные данные для обучения нейросети

Для того чтобы нейросеть могла правильно интерпретировать содержание изображений и связывать визуальные особенности с текстовым запросом, использовалась модель BLIP, которая автоматически составляла текстовые описания для каждого изображения и добавляла к ним ключевой токен-идентификатор — photo in MEDIEVAL style.

Итоговые изображения

Исходный размер 1024x1024

Комментарий к результатам

Итоговая серия изображений демонстрирует, что модель успешно усвоила ключевые характеристики средневекового визуального языка. В сгенерированных работах прослеживается плоскостная композиция, отсутствие глубокой перспективы и стремление к фронтальному изображению фигур.

Цветовая палитра включает насыщенные оттенки красного, синего и золотого, что характерно для средневековой живописи. Фигуры выглядят стилизованно, а композиция часто строится иерархически, с выделением главных персонажей через масштаб и центральное расположение.

Сгенерированные изображения отличаются друг от друга по композиции, степени детализации, цветовым решениям и сюжетам, однако при этом сохраняют стилистическую целостность.

Репрезентация художественного стиля средневековья в генеративных моделях
Проект создан 24.03.2026
Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную...
Показать больше