Вводная часть
- Я выбрал датасет Video Games с платформы CORGIS. Этот датасет содержит информацию о видеоиграх, включая их названия, платформы, год выпуска, жанры, издателей, оценки критиков и продажи. Датасет включает данные о более чем 12 000 видеоигр, выпущенных с 1980 по 2020 год.
- Видеоигры — это огромная индустрия, которая влияет на культуру, технологии и экономику. Мне было интересно изучить, как менялись предпочтения игроков, какие жанры и платформы стали популярными, и как оценки критиков влияют на продажи.
- Столбчатая диаграмма: Для отображения топ-10 жанров видеоигр. Это позволяет легко сравнить количество игр в каждом жанре. Линейный график: Для визуализации динамики выпуска игр по годам. Это помогает увидеть тренды и изменения. Круговая диаграмма: Для отображения распределения игр по платформам. Это наглядно показывает доли каждой платформы. Тепловая карта: Для анализа корреляции между показателями (например, оценками критиков и продажами).
Этапы работы
1. Обработка данных

Загрузка данных

Очистка данных

Преобразование столбца с датами

Стилизация

График 1: Топ-10 жанров видеоигр
График 2: Динамика выпуска игр по годам
График 3: Распределение игр по платформам
График 4: Корреляция между показателями
2. Стилизация графиков
Для стилизации использовала библиотеку Seaborn
3. Итоговые графики
— График 1: Топ-10 жанров видеоигр Столбчатая диаграмма, показывающая количество игр в каждом жанре. Самые популярные жанры — экшн, спорт и шутеры. — График 2: Динамика выпуска игр по годам Линейный график, показывающий количество выпущенных игр по годам. Пик выпуска игр пришелся на 2008 год, после чего начался спад. — График 3: Распределение игр по платформам Круговая диаграмма, показывающая доли игр для каждой платформы. PlayStation и Xbox лидируют по количеству выпущенных игр. — График 4: Корреляция между показателями Тепловая карта, показывающая корреляцию между оценками критиков, продажами и ценой подержанных игр. Оценки критиков слабо коррелируют с продажами.
4. Источники вдохновения
— The Economist: Минималистичный стиль графиков с акцентом на читаемость. — Seaborn Gallery: Примеры стилизованных графиков. — ColorBrewer: Цветовые палитры для визуализации данны
5. Описание применения генеративной модели
Вопросы нейросете, которые помогали при написании кода: — Как удалить дубликаты строк в DataFrame с помощью Pandas? — Как заполнить пропущенные значения в столбце средним значением с помощью Pandas? — Как преобразовать столбец с годами в формат datetime в Pandas? — Как создать столбчатую диаграмму для топ-10 значений в столбце с помощью Seaborn? — Как построить линейный график для динамики значений по годам с помощью Seaborn? — Как создать тепловую карту для корреляции между столбцами с помощью Seaborn? — Как изменить цветовую палитру для графиков в Seaborn? — Как изменить шрифт и его размер на графиках Matplotlib? — Как посчитать корреляцию между столбцами в DataFrame с помощью Pandas? — Как отфильтровать DataFrame по условию с помощью Pandas?
GPT-4 o mini https://trychatgpt.ru
Итоговые графики
Топ-10 жанров видеоигр Столбчатая диаграмма
Динамика выпуска игр по годам Линейный график
Распределение игр по платформам Круговая диаграмма
Корреляция между показателями Тепловая карта



