Идея
Искусственный интеллект отлично справляется с двумя вещами: он может нарисовать анатомически правильного кота, и он может сгенерировать сложный, симметричный геометрический фрактал. Но что произойдет, если потребовать от алгоритма слить эти две сущности воедино так, чтобы живое существо состояло из вибрирующей абстракции, не теряя при этом своей узнаваемости?
Данный исследовательский проект посвящен оцифровке стиля Луиса Уэйна — английского художника викторианской и эдвардианской эпох, прославившегося своими рисунками антропоморфных котов. Искусство Уэйна прошло невероятную и трагичную эволюцию. Если в начале карьеры он рисовал милых котиков, играющих в гольф и пьющих чай, то по мере развития у художника шизофрении его стиль радикально изменился. Коты начали распадаться на калейдоскопические, психоделические узоры, излучающие электрическую, тревожную энергию.
Обучение генеративной модели на поздних работах Уэйна — это сложнейший стресс-тест на баланс между формой и хаосом. Нейросеть крайне неохотно нарушает границы объектов. Если алгоритм рисует фрактал, он теряет анатомию кота (превращая картинку в бессмысленный ковер). Если он держит анатомию, то фракталы просто становятся фоновыми обоями.
Заставить ИИ «вплести» геометрию прямо в шерсть и морду животного, имитируя визуальные галлюцинации и сохраняя при этом огромные, пронзительные глаза персонажа — это задача, требующая ювелирного файнтюнинга.
Ниже представлены некоторые работы Луиса Уэйна, вошедшие в базу данных для обучения искусственного интеллекта.
Источник: Луис Уэйн
Луис Уэйн, Пой, птичка, пой! , 1930-е
Луис Уэйн, Мать и дитя, 1920-е
Луис Уэйн, Сицилийский кот калейдоскоп, 1930-е
Техническая реализация (Google Colab и LoRA)
В рамках проекта обучение проводилось в облачной среде Google Colab с использованием метода LoRA (Low-Rank Adaptation). Этот подход позволяет дообучить тяжелую базовую модель (например, Stable Diffusion), обновляя лишь небольшую часть алгоритмов, что делает процесс быстрым и эффективным. Чтобы сделать процесс наглядным, весь технический этап разбит на четыре ключевых шага:
Проверка оборудования (Видеокарта)
Генерация и обучение нейросетей требуют мощных видеокарт (GPU). На этом шаге мы инициализируем сервер и проверяем, какой именно вычислительный ресурс выдал нам облачный сервис Google для работы.
Подключение датасета и установка программ
Мы подключаем облачный диск, на котором лежат бережно отобранные нами картины художника (датасет), и скачиваем необходимые библиотеки машинного обучения (такие как diffusers и accelerate). Это дает нашему коду «инструменты» для работы с изображениями.
Запуск обучения (Тренировка стиля)
Это кульминация технического процесса. Здесь мы передаем нейросети команду: «Возьми базовую модель, проанализируй картины в нашей папке и найди в них общие стилевые черты». Процесс идет шаг за шагом, пока нейросеть не выучит уникальный почерк художника, связав его со специальным кодовым словом.
Промпты и выученные слова
Итак, нам осталось сформулировать запрос в ячейке промпта. Для этого мы используем выученные слова-триггеры, которые задавали на прошлом этапе. Модель будет реагировать на них.
Работы Луиса Уэйна отличаются ярким, узнаваемым стилем, который характеризуется несколькими ключевыми особенностями, на которые мы указываем модели: • Антропоморфизм: коты ходят на двух лапах, носят одежду, обладают яркой человеческой мимикой и эмоциями. • Гипертрофированные, пугающе большие глаза, смотрящие прямо на зрителя. • Калейдоскопическая, фрактальная деконструкция формы в поздних работах: шерсть превращается в геометрические орнаменты. • Кислотная, неоновая цветовая палитра: использование ярких розовых, электрических синих, желтых и зеленых оттенков. • Вибрирующая энергия: отсутствие статики, картина кажется пульсирующей из-за обилия мелких паттернов.
Результат
«An abstract composition where the hidden shape of a cat is formed purely by overlapping mandalas and floral geometry, photo in Louis style, vibrant pink and blue palette.»
«A group of cats in suits sitting around a green felt table playing poker, smoking cigars, photo in Louis style, human-like poses, lively atmosphere.»
«A row of fluffy cats standing on a stage singing from sheet music, mouths wide open, photo in Louis style, humorous, highly detailed fur, big eyes.»
«A cat floating in a cosmic void, its body breaking apart into thousands of tiny glowing triangles and stars, photo in Louis style, visionary art.»
«A strict cat teacher wearing glasses pointing at a chalkboard, while little kitten students sit at desks, photo in Louis style, charming edwardian aesthetic.»
«An anthropomorphic cat passionately playing a grand piano, musical notes turning into colorful abstract patterns in the air, photo in Louis style, dynamic.»
«Two anthropomorphic cats in Victorian dresses sitting at a table drinking tea from elegant cups, photo in Louis style, vintage illustration, big expressive eyes, whimsical.»
«A cat looking into a mirror, but the reflection is a terrifying, highly fragmented fractal version of itself, photo in Louis style, psychological depth, intense.»
«A close-up portrait of a cat’s face disintegrating into vibrant, symmetrical geometric patterns, photo in Louis style, psychedelic art, kaleidoscopic eyes, electric colors.»
«A cat walking through a bizarre, deeply patterned forest where the trees look like pulsating geometric shapes, photo in Louis style, surrealism, high contrast.»
«A cheerful cat in a plaid cap swinging a golf club on a green lawn, photo in Louis style, vintage comic illustration, exaggerated action.»
Выводы
Как мне кажется, нейросети удалось приблизиться к уникальному стилю Луиса Уэйна и передать его. В изображениях можно уловить тревожную, пульсирующую атмосферу, невероятную неоновую палитру и те самые фирменные, пугающе огромные кошачьи глаза. И все же нельзя не отметить, что сгенерированные нейросетью изображения далеки от идеала. Главная проблема алгоритма — это неспособность к «контролируемому безумию». Нейросеть часто идет по легкому пути: она генерирует совершенно обычного, реалистичного кота, а всю фрактальную психоделику просто отправляет на задний фон в виде узорчатых обоев. Уэйн же вплетал эти узоры прямо в плоть своих персонажей. Во-вторых, при попытке заставить ИИ нарисовать полностью фрактального кота, алгоритм часто теряет границы морды, из-за чего кот просто исчезает в месиве ярких пикселей. Машине не хватает того тонкого человеческого чувства баланса, которое позволяло больному разуму художника удерживать форму на самом краю распада. Все эти вещи могут быть замечены даже непрофессиональным взглядом человека, не имеющего искусствоведческого образования.
Эксперимент с оцифровкой фрактальных миров Луиса Уэйна — это блестящая демонстрация того, как технологии сталкиваются с человеческой психологией (и психиатрией). Современные модели (Stable Diffusion 3.5, FLUX.1) превосходно осваивают визуальные маркеры: они могут безошибочно выдать нужные кислотные цвета, симметрию и огромные глаза. Однако ИИ генерирует эти паттерны на основе холодной математической логики. Для Уэйна же эти вибрирующие контуры были реальностью, вызванной изменением восприятия из-за болезни. Машинная галлюцинация — это сбой в вычислениях, а человеческая галлюцинация — это трагичный, но глубоко эмоциональный опыт. Этот эксперимент доказывает: нейросети — великолепный инструмент для создания калейдоскопических текстур и сюрреалистичных концептов, но неповторимый «нерв» и искреннее безумие оригинала всегда останутся за гранью алгоритмов.
Применение генеративной модели
Для генерации промптов художника был использован Claude 4.5 Sonnet.




