Концепция
Проект посвящен обучению нейросети генерировать изображения в стиле фотохудожника Андре Кертеша, одного из величайших мастеров мировой фотографии XX века. Кертеш, используя зеркала и различные оптические искажения, создавал текучие, сюриалистичные, изменённые формы, которые вбирали в себя тот факт, что реальность субъективна. Я заметила, что при генерации изображений с помощью ИИ мы часто сталкиваемся с теми же искажениями: дополнительные пальцы, сливающиеся руки и ноги, размытые или неполные объекты. Эти визуальные ошибки отражают сам процесс восприятия реальности — что-то знакомое, но и в то же время чуждое. Я решила использовать эти особенности ИИ для воссоздания видения Кертеша, обучив нейросеть генерировать работы, которые приближены к его стилю.
Изображения для обучения модели
Работы Кертеша можно разделить на несколько ключевых тем: портреты, интерьерные сцены, натюрморты из повседневности. В процессе я опиралась на данные жанры для генерации изображений, которые отражают его уникальную способность передавать мир через рассеянный, искажённый взгляд, приобретая сюрреалистичный и даже ужасающий характер.
Итоговые сгенерированные работы
Сравнивая оригинальные работы Кертеша с сгенерированными, видно, что особенно удачно удалось воссоздать искажения фигур через зеркала, а также повседневные натюрморты и портреты. Именно в этих фрагментах наиболее ярко раскрываются ключевые черты стиля Кертеша: размытость формы, нереальность происходящего, расплывчатость образов, игра света и тени, контрастность, зернистость, а также устрашающая эстетика, свойственная его творчеству. В изображениях ярко проявляются сильные искажения пропорций и эффект калейдоскопа, что создает особое ощущение мира Кертеша, где реальность теряет свою строгую логику и поддается преобразованиям.
Особенно красиво выглядят изображения стеклянных предметов. Иногда можно заметить несоответствие масштаба объектов, или вдруг появляются дополнительные элементы — например, ноги, которые вовсе не должны быть частью композиции. Такие искажения реальности, несмотря на свою необычность, идеально вписываются в сюрреалистичный дух художника и соответствуют концепции.
Портреты
Люди в среде
Повседневность и объекты
Процесс обучения
Для создания изображений в стиле Андре Кертеша был использован подход дообучения модели Stable Diffusion v1.5 с применением метода LoRA. Обучение проводилось в Google Colab с использованием GPU-ускорения. Процесс включал отбор 19 наиболее репрезентативных работ для датасета, отражающих стиль и жанры Кертеша, настройку тренировочного пайплайна с применением LoRA к слоям UNet и текстового энкодера, а также сохранение обученных весов. Обучение длилось 500 шагов, с промежуточной проверкой на 250-м шаге. Результатом стала модель kertesz_style_LoRA, с помощью которой была сгенерирована итоговая серия изображений.
В проекте также использовался ChatGPT — на этапе написания и проверки кода, а также для генерации и доработки части сюжетов текстовых промптов.




