Идея проекта
Идея проекта заключается в обучении генеративной нейросети воспроизведению визуального языка средневековой живописи. В данном случае речь идёт не о поверхностной стилизации или наложении эффекта «под старину», а о попытке глубокого освоения художественных принципов эпохи. Средневековое искусство отличается особой системой изображения, в которой важную роль играют композиция, символика, цвет и условность форм. В рамках проекта ставится задача проверить, способна ли современная генеративная модель не просто копировать отдельные визуальные элементы, но и воспроизводить саму логику построения изображения, характерную для средневековой культуры, а также применять её к новым сюжетам.
Примеры исходных изображений
В качестве обучающего материала использовались изображения средневековой живописи, включающие религиозные сцены, иконопись, миниатюры из рукописей, фрески, а также изображения святых, правителей и бытовых эпизодов.
Визуальный язык таких произведений отличается декоративностью, орнаментальностью и иерархическим построением композиции, где значимость персонажей передаётся через масштаб и расположение. Подобранный датасет позволяет сформировать у модели целостное представление о стиле и ключевых принципах средневекового искусства.
Процесс обучения
Для создания модели был применён метод Fine-tuning нейросети Stable Diffusion XL (SDXL) 1.0.
Использовалась технология Low-Rank Adaptation, которая позволяет «обучить» модель новому стилю, не меняя её базовых знаний. Процесс занял 500 шагов обучения, что обеспечило баланс между узнаваемостью стиля и гибкостью генерации.
Основой послужил датасет, включающий 198 изображений средневекового искусства.
Загрузка датасета для обучения
Настройка параметров
Входные данные для обучения нейросети
Для того чтобы нейросеть могла правильно интерпретировать содержание изображений и связывать визуальные особенности с текстовым запросом, использовалась модель BLIP, которая автоматически составляла текстовые описания для каждого изображения и добавляла к ним ключевой токен-идентификатор — photo in MEDIEVAL style.
Итоговые изображения
Комментарий к результатам
Итоговая серия изображений демонстрирует, что модель успешно усвоила ключевые характеристики средневекового визуального языка. В сгенерированных работах прослеживается плоскостная композиция, отсутствие глубокой перспективы и стремление к фронтальному изображению фигур.
Цветовая палитра включает насыщенные оттенки красного, синего и золотого, что характерно для средневековой живописи. Фигуры выглядят стилизованно, а композиция часто строится иерархически, с выделением главных персонажей через масштаб и центральное расположение.
Сгенерированные изображения отличаются друг от друга по композиции, степени детализации, цветовым решениям и сюжетам, однако при этом сохраняют стилистическую целостность.




