Исходный размер 2480x3500

Алгоритмы Пикселя

Проект принимает участие в конкурсе

Концепция

Этот проект — исследование того, как современные нейросети понимают классическую игровую графику. Я решил создать инструмент, который генерирует чистый пиксель-арт, сохраняя дух старых консольных хитов вроде Super Mario, The Legend of Zelda, а также современных инди-игр вроде Hyper Light Drifter.

Скриншот из The Legend of Zelda / Скриншот из Super Mario Bros

Исходный размер 1920x1080

Скриншот из Hyper Light Drifter

В качестве эксперимента я решил обучить одну нейросеть (Stable Diffusion XL) на работах других генеративных моделей. Датасет из 30 качественных изображений я подготовил самостоятельно, используя инструменты Nano Banana и Vizcom. Это позволило мне быстро собрать базу с нужной мне стилистикой и цветовой палитрой, которую затем я закрепил в финальной модели.

Исходный размер 3500x2000

Исходных изображений было около 30, все они были сгенерированы мной с помощью Nano Banana и Vizcom

Для меня это стал эксперимент по «обучению нейросети на нейросети». Я сам нагенерил около 30 исходных картинок в Nano Banana и Vizcom, чтобы собрать базу в одном стиле и цвете. Это помогло мне создать свою собственную модель (LoRA). Теперь мне не нужно расписывать длинные промпты и технические настройки — нейронка сама понимает, что я хочу получить именно такой пиксель-арт.

Мои генерации

В основе стиля лежит четкая пиксельная сетка и ограниченная палитра, имитирующая графику 16-32 бит. Главная фишка токен PIXELART_STYLE. Все промты подписаны под изображениями.

Исходный размер 1024x1024

Промт: профессиональный пиксель-арт в стиле PIXELART_STYLE, уютная лоу-фай комната с окном

Промт: пиксельный персонажи стоят в мистическом лесу, освещён фиолетовым светом, пиксель-арт, атмосферный фон / Промт: пиксельная пещера с сияющими кристаллами, магические отблески на стенах

Результаты превзошли ожидания, модель научилась имитировать даже сложные техники, такие как дизеринг (оптическое смешение цветов пикселями).

Промт: герой в стиле PIXEL ART_STYLE, держащий сияющий артефакт, окружённый растениями / Промт: фиолетовый пейзаж в стиле PIXEL ART_STYLE с высокими скалами

Исходный размер 1024x1024

Промт: профессиональный пиксель-арт в стиле PIXELART_STYLE, футуристическая киберпанк улица, неоновые вывески на японском, дождевые лужи, стиль аркады 32-бит

Промт: группа пиксельных растений, детализированный фон / Промт: одинокое пиксельное дерево с яркой кроной и детализированным стволом

Исходный размер 1024x1024

Промт: Храм в стиле ретро-пиксельной графики в густом лесу, солнечные лучи пробиваются сквозь деревья, волшебная атмосфера, деревенский стиль пик-арта, яркие и насыщенные цвета, детализированный фон

Лично мне больше всего нравится, как получаются пейзажи и локации. У нейросети хорошо вышло передать глубину и атмосферу, особенно в фиолетовых и неоновых тонах.

Промт: пиксель-арт в стиле PIXELART_STYLE, маленький робот-кот с светящимися глазами, простой фон / Промт: графика в стиле PIXELART_STYLE: одинокий рыцарь в серебряных доспехах

Промт: пиксель-арт в стиле PIXELART_STYLE, древний каменный меч, застрявший в замшелой скале / Промт: графика в стиле PIXELART_STYLE: бутылочка с волшебным зельем, 16-битная эстетика

Картинки вышли разнообразными по цвету. Хотя я не всегда детально прописывал окружение, модель сама «вытягивала» из датасета нужные градиенты. Да, иногда проскакивают странные артефакты, но для ретро-стиля это выглядит даже аутентично, как баги в старых играх.

0

Фрагменты кода

Описание применения генеративной модели

Проект реализован на базе SDXL с использованием метода DreamBooth LoRA. Выбор технологии обеспечил точную передачу эстетики «pixel relic artifact» без деградации базовой модели. Обучение в течение двух часов позволило глубоко проработать детали стиля, сохранив гибкость генерации.

Техническая часть опирается на библиотеку Diffusers с применением 8-bit Adam и градиентного чекпоинтинга для оптимизации VRAM. Датасет подготовлен в Nano Banana и Vizcom, прошел фильтрацию и тегирование моделью BLIP, а структура проекта сформирована в Gemini. Для сохранения первозданной четкости графики я отказался от апскейлеров. Модель выдает детализированный результат напрямую через триггер-фразу.

Алгоритмы Пикселя
Проект создан 20.03.2026
Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную...
Показать больше