Примеры исходных изображений

Один из ближайших моих членов семьи, который прошел со мной все детство, был кот Барсик. Со 2 августа 2018 его, к сожалению, с нами нет. Однако, будучи котом, он не успел покататься на скейтборде или полетать на самолете.

Визуализации этих неисполнимых достижений посвящена серия изображений.

Исходный размер 1207x137

Фрагмент кода с промптом к изображению 1

Исходный размер 1024x1024

1. Барсик космонавт

Исходный размер 1193x137

Фрагмент кода с промптом к изображению 2

Исходный размер 1024x1024

2. Барсик восходит на Эверест

Исходный размер 1201x147

Фрагмент кода с промптом к изображению 3

Исходный размер 1024x1024

3. Барсик смотрит на поле у трактора

Исходный размер 1203x140

Фрагмент кода с промптом к изображению 4

Исходный размер 1024x1024

4. Барсик на столе в офисе

Исходный размер 1193x141

Фрагмент кода с промптом к изображению 5

Исходный размер 1024x1024

5. Барсик на море

Исходный размер 1216x142

Фрагмент кода с промптом к изображению 6

Исходный размер 1024x1024

6. Барсик в самолете

Исходный размер 1207x143

Фрагмент кода с промптом к изображению 7

Исходный размер 1024x1024

7. Барсик чинит спорткар

Исходный размер 1201x147

Фрагмент кода с промптом к изображению 8

Исходный размер 1024x1024

8. Барсик отдыхает на красной дорожке

Исходный размер 1197x142

Фрагмент кода с промптом к изображению 9

Исходный размер 1024x1024

9. Барсик на ветке дерева

Исходный размер 1197x147

Фрагмент кода с промптом к изображению 10

Исходный размер 1024x1024

10. Барсик на скейтборде

Благодаря тому, что нейросеть обучалась на живых фотографиях Барсика, итоговые изображения также получились живыми, будто снятыми в ходе реального движения.

Таким образом, с помощью обученной ии получился вымышленный фотодневник кота.

Принцип работы кода

Для дообучения и генерации изображений использована Stable Diffusion.

Для обучения нейросети я взяла 50 фотографий Барсика, загрузила их в разрешении 512×512 как датасет, а также подключила его к блокноту.

0

Фрагмент кода

Далее были проверены GPU и установлены зависимости, а также подключен датасет подгруженных фотографий Барсика.

Также были созданы описания изображений, которые впоследствии используются для обучения ии.

0

Затем модель обучается с инструментом LoRa.

0

Фрагмент кода

Затем модель подгружается на huggingfacehub, где доступна для использования и генерации новых изображений

0
Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную...
Показать больше