Исходный размер 893x1263

Pixel Realms

Это исследование памяти жанра фэнтези, застывшей в форме пикселей. Я обучил генеративную нейросеть Stable Diffusion рисовать в стилистике классических пиксельных RPG, чтобы проверить, может ли искусственный интеллект не просто копировать форму, а воспроизводить атмосферу и чувство приключения, которое рождает этот визуальный язык.

Для обучения я собрал датасет из двадцати квадратных изображений (1:1), выполненных в фэнтези-пиксель-арте. Главным критерием отбора, было наличие в изображении фэнтэзи вайба. Не просто бездушная картинка на белом фоне, а насыщенная чувствами приключений работа.

big
Исходный размер 2281x842

Дата Сет

Сгенерированные изображения

big
Исходный размер 1024x1024
Исходный размер 1024x1024
Исходный размер 1024x1024
Исходный размер 1024x1024
Исходный размер 1024x1024
Исходный размер 1024x1024
Исходный размер 1024x1024
Исходный размер 1024x1024
Исходный размер 1024x1024
Исходный размер 1024x1024
Исходный размер 1024x1024
Исходный размер 1024x1024

После обучения модель начала создавать новые миры — не копируя оригиналы, а продолжая их. Она рисует пейзажи, где свет пробивается сквозь сосны, где вдалеке виднеются руины крепости, а на скале стоит фигура в плаще. Все сцены сохраняют фактуру пикселей, характерную контрастную палитру и меланхоличное настроение оригинальных артов.

Получившаяся серия — это воспоминания нейросети. Будто она тоже когда-то играла в старые фэнтези-игры и теперь пытается пересказать увиденное по памяти. Эти изображения не принадлежат ни реальности, ни вымыслу — они существуют на границе между искусством и кодом.

Заключение

Pixel Realms — это не просто серия изображений. Это диалог с машиной о памяти и воображении. Когда нейросеть учится рисовать в пиксельном стиле, она не только воспроизводит визуальные закономерности — она воссоздаёт эмоцию эпохи, когда несколько цветных квадратов могли рассказать историю целого мира.

Так фэнтези возвращается — не через ремейк, а через новую форму памяти. И в этом пиксельном шуме рождается что-то удивительно живое.

Принцип работы кода

Исходный размер 2415x350
Исходный размер 2415x350

Устанавливаем внешние библиотеки

Исходный размер 2417x826

Подгружаем изображения

Исходный размер 2412x658

загрузка и предпросмотр датасета

Исходный размер 2420x699

автоматическая подпись изображений моделью BLIP

Исходный размер 2415x741

Настраиваем и входим в hugging face

Исходный размер 2419x446

запуск обучения модели LoRA на датасете пиксель-арта

Исходный размер 2420x1040

сохранение и загрузка обученной модели в Hugging Face Hub

Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную...
Показать больше