Исходный размер 735x1099

Исследование коммерческого успеха фильмов Disney

PROTECT STATUS: not protected

Введение

Для финального проекта по курсу «Программирование для креативных индустрий‎» я решила проанализировать кассовые сборы фильмов Disney в разные года. Я выбрала именно этот датасет, поскольку он сочетает в себе культурную ценность и количественную выразительность. Фильмы Disney являются важной частью массовой культуры, а их коммерческий успех позволяет проследить, как менялись предпочтения аудитории и масштабы киноиндустрии с течением времени.

big
Исходный размер 1198x468

Сцена из мультфильма «Леди и бродяга», режиссёры Клайд Джероними, Уилфред Джексон и Гамильтон Ласк, 1955 год.

В рамках данного проекта я работала с платформой Kaggle, на которой и был найден датасет. В наборе данных собрана информация о полном кассовом сборе фильмов студии Disney, включая дату релиза, жанр, название фильма и суммарные сборы. Эти данные представлены в формате CSV, что делает их удобными для анализа с помощью Python и библиотеки Pandas.

Целью проекта стало не просто построение графиков, а осмысленный анализ данных и визуальное объяснение полученных закономерностей.

big
Исходный размер 1199x889

Сцена из мультфильма «101 далматинец», режиссёры Клайд Джероними, Хэмилтон Ласк и Вольфганг Райтерман, 1961 год.

Визуализация

Графические приемы

Для стилизации визуализаций я задала собственную цветовую палитру и подключила кастомные шрифты напрямую в коде. Источником вдохновения для стилистики стала сказочная и волшебная атмосфера парка развлечений Disneyland.

Исходный размер 1968x412

При работе над композицией я уделяла внимание отступам, иерархии текста и балансу между данными и визуальным воздухом, чтобы графики были не только информативными, но и эстетически цельными.

Исходный размер 1482x1022

Этапы работы

С помощью Pandas я преобразовала строковые значения денежных показателей, убрав символы валюты и разделители, после чего перевела их в числовой формат.

import pandas as pd import matplotlib.pyplot as plt import matplotlib.font_manager as fm import numpy as np

df = pd.read_csv («disney_movies_total_gross (1).csv»)

Даты релиза были приведены к формату datetime, что позволило извлечь год и использовать его для анализа динамики во времени. В процессе анализа я активно использовала группировку данных, агрегирование с помощью сумм и средних значений, а также сортировку для выявления лидеров и аутсайдеров.

0

Графики

Для сравнения жанров по среднему доходу был выбран lollipop chart, так как он сочетает точность и визуальную легкость.

0

Также в проекте присутствует круговая диаграмма, которая позволяет наглядно оценить доли жанров в общей структуре кассовых сборов.

0

Для анализа временной динамики я использовала залитый линейный график, который помогает воспринимать рост кассовых сборов как процесс накопления и усиления масштаба.

0

И горизонтальный столбчатый график был использован для демонстрации самых кассовых фильмов.

0

Вывод

В проекте используются базовые, но важные статистические методы, такие как расчет суммарных значений, средних арифметических и сравнительный анализ. Эти методы позволили выявить, какие жанры в среднем приносят наибольший доход, как менялся общий кассовый успех студии со временем и какие фильмы стали абсолютными лидерами по сборам. Таким образом, проект демонстрирует изучающий и объясняющий подход к визуализации данных, где каждая диаграмма отвечает на конкретный вопрос и логически дополняет общий рассказ.

Использованные инструменты и генеративные модели

  1. Чат GPT — исправление ошибок в кодах, анализ графиков
  2. Google Collab — работа с датасетом, создание графиков
Исследование коммерческого успеха фильмов Disney
Проект создан 05.02.2026
Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную...
Показать больше