Original size 2480x3500

Исследовательский анализ данных о продажах видеоигр

PROTECT STATUS: not protected
The project is taking part in the competition

01 ВВОДНАЯ ЧАСТЬ

Описание темы

Для анализа был выбран датасет Video Game Sales, содержащий информацию о продажах более чем 16 500 видеоигр по всему миру. Данные включают такие параметры, как год релиза, платформа, жанр и объёмы продаж в различных регионах (Северная Америка, Европа, Япония и остальной мир). Датасет находится в открытом доступе и широко используется в аналитических и учебных проектах, что делает его удобным и надёжным источником для исследования.

Обоснование выбора

Интерес к данным обусловлен тем, что индустрия видеоигр является одной из самых быстрорастущих и экономически значимых креативных индустрий. Она сочетает в себе технологии, культуру, дизайн и маркетинг, а также отражает изменения в потребительских предпочтениях и развитии платформ.

Анализ таких данных позволяет проследить эволюцию рынка, выявить доминирующие платформы, жанры и регионы, а также понять, какие факторы влияли на коммерческий успех игр в разные периоды времени.

Ценность датасета заключается в его масштабе и структуре. Он позволяет анализировать рынок сразу в нескольких измерениях: во времени, по платформам, жанрам и географии продаж. Это делает его особенно подходящим для демонстрации возможностей аналитической визуализации с использованием Python.

Виды графиков

Для анализа данных были использованы разные типы графиков, каждый из которых решает конкретную аналитическую задачу.

1. Линейный график (динамика количества релизов по годам) Этот тип визуализации был выбран для отображения изменений во времени. Линейный график позволяет наглядно показать рост индустрии видеоигр, период пика активности и последующий спад количества релизов. Он хорошо подходит для выявления долгосрочных трендов и ключевых этапов развития рынка.

2. Горизонтальная столбчатая диаграмма (лидеры рынка консолей) Столбчатая диаграмма используется для сравнения категориальных данных, в данном случае платформ по количеству выпущенных игр. Горизонтальная ориентация облегчает чтение длинных названий платформ и делает различия между ними более наглядными, позволяя быстро определить лидеров рынка.

3.Тепловая карта (жанры vs платформы) Тепловая карта была выбрана для анализа взаимосвязи между жанрами и платформами. Такой формат позволяет одновременно отображать большие объемы данных и быстро находить области высокой и низкой концентрации продаж. Цветовая шкала делает сравнение интуитивным и подчёркивает ключевые паттерны потребления.

4. Кольцевая диаграмма (география продаж) Круговая диаграмма используется для отображения долей регионов в общем объёме продаж. Она хорошо подходит для задач, где важно показать структуру целого и относительный вклад каждой части. Кольцевая форма дополнительно улучшает читаемость и визуальный баланс композиции.

Для работы была использована гарнитура Dejavu Sans.

Original size 1152x604

Изначальная цветовая палитра

В процессе работы первичная цветовая палитра была изменена на более темную: mako_palette = sns.color_palette («mako», n_colors=len (top_platforms))

Original size 1328x697

Измененная цветовая палитра

02 ЭТАПЫ РАБОТЫ

Настройка стиля

Original size 2304x1882

Рисование иконок (pixel art engine)

Original size 2304x1882

Загрузка данных и первичный осмотр

Original size 2304x1906
Original size 2304x420

Пример анализируемых данных

03 ИТОГОВЫЕ ГРАФИКИ

(1) Эволюция игровой индустрии (количество релизов по годам)

Original size 2304x1262

Линейный график «Эпоха гейминга: количество релизов»

Original size 2304x1206

Линейный график показывает динамику количества выпускаемых игр по годам и отражает постепенное развитие индустрии.

(2) Война платформ: топ-10 консолей по числу игр

Original size 2304x1652

Горизонтальная столбчатая диаграмма «Лидеры рынка консолей»

Original size 2304x1652

Горизонтальная столбчатая диаграмма сравнивает платформы по количеству выпущенных игр.

(3) Жанровые предпочтения (heatmap)

Original size 2304x1842

Тепловая карта «Жанровые предпочтения (жанры vs платформы)»

Original size 2304x1286

Тепловая карта отображает распределение продаж между жанрами и платформами. Цветовая интенсивность позволяет быстро определить, какие жанры были наиболее успешны на конкретных платформах и выявить ключевые коммерческие связки.

(4) Глобальный рынок (где покупают игры?)

Original size 2304x1898

Кольцевая диаграмма «География продаж»

Original size 2304x2098

Кольцевая диаграмма показывает доли регионов в общем объеме продаж видеоигр.

04 ОПИСАНИЕ ПРИМЕНЕНИЯ ГЕНЕРАТИВНОЙ МОДЕЛИ

В ходе работы над проектом использовалась языковая модель Gemini 3.0 Pro Preview в роли технического консультанта и ассистента по визуализации.

Сценарии использования:

1. Разработка визуального стиля (Visual Coding) Написание и отладка кода на Python (библиотеки Matplotlib, Seaborn) для реализации кастомной цветовой палитры «Vaporwave/Dark UI» и настройки векторного рендеринга (SVG).

2. Процедурная генерация графики Создание алгоритма «Pixel Art Engine», который генерирует тематические иконки (геймпад, кубок, огонь) непосредственно из числовых матриц (NumPy), исключая необходимость использования внешних графических файлов.

3. Структурирование анализа Помощь в выборе оптимальных типов диаграмм (Heatmap, Area Chart) для наглядного представления многомерных данных игровой индустрии.

Ресурсы

Kaggle — источник открытого датасета и платформа для работы с данными.

Документация по использованным библиотекам

Pandas — обработка, анализ и агрегация табличных данных.

NumPy — численные вычисления и работа с массивами.

Matplotlib — построение и кастомизация графиков.

Seaborn — создание статистических и комплексных визуализаций.

We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...
Show more