
01 ВВОДНАЯ ЧАСТЬ
Описание темы
Для анализа был выбран датасет Video Game Sales, содержащий информацию о продажах более чем 16 500 видеоигр по всему миру. Данные включают такие параметры, как год релиза, платформа, жанр и объёмы продаж в различных регионах (Северная Америка, Европа, Япония и остальной мир). Датасет находится в открытом доступе и широко используется в аналитических и учебных проектах, что делает его удобным и надёжным источником для исследования.
Обоснование выбора
Интерес к данным обусловлен тем, что индустрия видеоигр является одной из самых быстрорастущих и экономически значимых креативных индустрий. Она сочетает в себе технологии, культуру, дизайн и маркетинг, а также отражает изменения в потребительских предпочтениях и развитии платформ.
Анализ таких данных позволяет проследить эволюцию рынка, выявить доминирующие платформы, жанры и регионы, а также понять, какие факторы влияли на коммерческий успех игр в разные периоды времени.
Ценность датасета заключается в его масштабе и структуре. Он позволяет анализировать рынок сразу в нескольких измерениях: во времени, по платформам, жанрам и географии продаж. Это делает его особенно подходящим для демонстрации возможностей аналитической визуализации с использованием Python.
Виды графиков
Для анализа данных были использованы разные типы графиков, каждый из которых решает конкретную аналитическую задачу.
1. Линейный график (динамика количества релизов по годам) Этот тип визуализации был выбран для отображения изменений во времени. Линейный график позволяет наглядно показать рост индустрии видеоигр, период пика активности и последующий спад количества релизов. Он хорошо подходит для выявления долгосрочных трендов и ключевых этапов развития рынка.
2. Горизонтальная столбчатая диаграмма (лидеры рынка консолей) Столбчатая диаграмма используется для сравнения категориальных данных, в данном случае платформ по количеству выпущенных игр. Горизонтальная ориентация облегчает чтение длинных названий платформ и делает различия между ними более наглядными, позволяя быстро определить лидеров рынка.
3.Тепловая карта (жанры vs платформы) Тепловая карта была выбрана для анализа взаимосвязи между жанрами и платформами. Такой формат позволяет одновременно отображать большие объемы данных и быстро находить области высокой и низкой концентрации продаж. Цветовая шкала делает сравнение интуитивным и подчёркивает ключевые паттерны потребления.
4. Кольцевая диаграмма (география продаж) Круговая диаграмма используется для отображения долей регионов в общем объёме продаж. Она хорошо подходит для задач, где важно показать структуру целого и относительный вклад каждой части. Кольцевая форма дополнительно улучшает читаемость и визуальный баланс композиции.
Для работы была использована гарнитура Dejavu Sans.
Изначальная цветовая палитра
В процессе работы первичная цветовая палитра была изменена на более темную: mako_palette = sns.color_palette («mako», n_colors=len (top_platforms))
Измененная цветовая палитра
02 ЭТАПЫ РАБОТЫ
Настройка стиля
Рисование иконок (pixel art engine)
Загрузка данных и первичный осмотр
Пример анализируемых данных
03 ИТОГОВЫЕ ГРАФИКИ
(1) Эволюция игровой индустрии (количество релизов по годам)
Линейный график «Эпоха гейминга: количество релизов»
Линейный график показывает динамику количества выпускаемых игр по годам и отражает постепенное развитие индустрии.
(2) Война платформ: топ-10 консолей по числу игр
Горизонтальная столбчатая диаграмма «Лидеры рынка консолей»
Горизонтальная столбчатая диаграмма сравнивает платформы по количеству выпущенных игр.
(3) Жанровые предпочтения (heatmap)
Тепловая карта «Жанровые предпочтения (жанры vs платформы)»
Тепловая карта отображает распределение продаж между жанрами и платформами. Цветовая интенсивность позволяет быстро определить, какие жанры были наиболее успешны на конкретных платформах и выявить ключевые коммерческие связки.
(4) Глобальный рынок (где покупают игры?)
Кольцевая диаграмма «География продаж»
Кольцевая диаграмма показывает доли регионов в общем объеме продаж видеоигр.
04 ОПИСАНИЕ ПРИМЕНЕНИЯ ГЕНЕРАТИВНОЙ МОДЕЛИ
В ходе работы над проектом использовалась языковая модель Gemini 3.0 Pro Preview в роли технического консультанта и ассистента по визуализации.
Сценарии использования:
1. Разработка визуального стиля (Visual Coding) Написание и отладка кода на Python (библиотеки Matplotlib, Seaborn) для реализации кастомной цветовой палитры «Vaporwave/Dark UI» и настройки векторного рендеринга (SVG).
2. Процедурная генерация графики Создание алгоритма «Pixel Art Engine», который генерирует тематические иконки (геймпад, кубок, огонь) непосредственно из числовых матриц (NumPy), исключая необходимость использования внешних графических файлов.
3. Структурирование анализа Помощь в выборе оптимальных типов диаграмм (Heatmap, Area Chart) для наглядного представления многомерных данных игровой индустрии.
Ресурсы
Kaggle — источник открытого датасета и платформа для работы с данными.
Документация по использованным библиотекам
Pandas — обработка, анализ и агрегация табличных данных.
NumPy — численные вычисления и работа с массивами.
Matplotlib — построение и кастомизация графиков.
Seaborn — создание статистических и комплексных визуализаций.