Original size 521x780

Анализ статистики самых популярных книг для обмена

PROTECT STATUS: not protected
The project is taking part in the competition

Вводная часть

big
Original size 1312x398

Книга — это хороший подарок и просто вещь которую приятно получить. Используя данные «Book swapping community» представленные Kaggle, можно увидеть статистику произведений, которыми чаще всего обмениваются люди.

big
Original size 832x352

Датасет с платформы Kaggle. В нём представлена разнообразная информация от автора до года экранизации. Мой выбор пал на эти данные потому, что мне интересны книги, что это интересная и одновременно приятная тема для анализа, и кроме того, мне стало любопытно, какой литературой чаще обмениваются люди.

big
Original size 943x249

Для визуализации я использовала круговую, столбчатую и рассеянную диаграммы, а также тепловую карту.

Ход работы

Сначала я загрузила нужные библиотеки, а потом импортировала датасет из Гугл диска для дальнейшей работы с ним в Pandas.

Original size 492x140

Дальше нужно было определить и выделить необходимые данные или их диапазон, записав значения в переменные.

0

Потом задавались основные параметры для таблицы: её размеры, положение элементов внутри, расположение, размер и характер текста и других дополнительных данных вроде линий, количественных значений и подписей.

0

При выборе палитры я вдохновлялась атмосферой чтения: бледными жёлтыми страницами старых книг и тёмными вечерами, когда тени становятся фиолетовыми или бордовыми от желтоватого света лампы. Для фона я выбрала тусклый бордовый цвет: 61484d. Текст и линии в основном белого цвета. А для основных элементов использовался персиковый: fcc8a9.

Original size 670x157

Полученные графики

0

Круговая диаграмма. Самые популярные страны для обмена самыми популярными книгами.

Круговая диаграмма наглядно показывает разницу между странами, в которых часто обмениваются книгами из списка. Как видно, это наиболее распространено в США и Англии, что может быть связано с распространённостью английского языка.

0

Тепловая карта. Распределение жанров по трём возрастным категориям.

Тепловая карта показывает топ-7 жанров книг для обмена и их популярность среди трёх возрастных категорий: детей, подростков и взрослых. Как видно, среди подростков наиболее популярно фэнтези, также как и у взрослой аудитории, наряду с научной фантастикой. Самый большой контраст можно увидеть в детской литературе: взрослые и подростки ей не интересуются, что, в принципе, довольно предсказуемо.

0

Диаграмма рассеяния. Соотношение страниц и рейтинга детских книг.

Можно углубиться в более подробное изучение статистики детской литературы. График рассеяния позволяет увидеть одновременно количество страниц и рейтинг книг для теской аудитории. Можно обратить внимание, что размер книг редко превышает 400 страниц, а рейтинг в основном находится в районе 4-4.25.

0

Столбчатая диаграмма. Топ тегов в книгах для детей.

Столбчатая диаграмма показывает топ-10 тегов в детской литературе. Можно увидеть, что наиболее популярной среди детей является классика.

Описание применения генеративной модели

Для создания изображений, в том числе и обложки, я использовала нейросеть Ideogram.Ai 3.0 Пример промпта: Create a realistic image in a cinematic style, as if it were a frame from a movie, with a hand offering a book for two other hands. The book is closed. Camera captures the scene from above. The lighting is pleasant and warm, with burgundy shadows. The scene takes place in a room, background is blurry.

В качестве консультанта по некоторым затруднительным вопросам, вроде как сделать пунктирную линию, или диаграмму-пончик с текстом в середине, или как поменять местами индексы в тепловой карте, я обращалась к чату DeepSeek. Сначала я присылала в чат свой код, затем задавала по нему вопрос. Промпты: Как в этом коде развернуть метки age_category из вертикального положения в горизонтальное. Напиши код, который будет выводить в центре круговой диаграммы значение суммы всех книг. Объедини страны с процентным значением меньше 2.0 в Other countries. Поменяй местами строки «Children» и «Young Adult».

We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...
Show more