Исходный размер 1240x1750

Анализ мультфильмов Pixar

PROTECT STATUS: not protected

Описание

Pixar — это легендарная анимационная студия, которая изменила мировое кино своими мультфильмами. Начиная с «Истории игрушек» в 1995 году, она выпускает проекты, которые нравятся и детям, и взрослым, собирают миллиарды долларов и получают высокие оценки от зрителей и критиков.

Поскольку я выросла на этих мультиках и данная студия остается моей любимой, я решила проанализировать датасет, который посвящен мультфильмам «Pixar». В нём содержится информация об оценках зрителей и критиков, времени выпуска мультфильмов, сколько стоило производство.

Датасет взят с сайта

Выбирая цвета, я опиралась на эстетику мультиков Pixar. Так как они предназначены для детей, за основу я взяла: оранжевый, зеленый и голубой, а нейтральным цветом был серый и его оттенки.

Исходный размер 1290x1576

Подборка цветов с сайта Adob color

Цвета подобрал сайт

Для визуализации данных я выбрала точечную диаграмму (для выявления корреляции между двумя переменными), круговую (наглядно показывает процентное соотношение), гистограмму (легко распознаваема зрителями и подходит для моих данных), горизонтальную столбчатую диаграмму (удобно сравнить большое количество категорий), линейную (для отображения изменений во времени).

Этапы работы

Сначала я импортировала библиотеки, которые понадобятся для работы и запустила чтение cvs-файла в мультфильмами. Также я сделала словарь русских названий, так как мой датасет был на английском языке.

Исходный размер 1225x615

Этап работы

Далее я обработала данные для горизонтальной столбчатой диаграммы для визуализации рейтинга фильмов по IMDb. Отсортировала фильмы по оценкам (от высоких к низким) и добавила цветовое кодирование. Так, фильмы с рейтингом >8.0 были отмечены зелёным цветом, ≤8 — оранжевым.

Исходный размер 1115x1482

Создания словаря

Для создания круговой диаграммы я отобрала пять фильмов с самыми высокими мировыми сборами, а потом отформатировала текст, чтобы название фильмов было написано курсивом, а проценты жирным шрифтом. Справа от диаграммы я разместила пояснительную легенду, где для каждого фильма указала не только его название, но и точную сумму сборов.

Исходный размер 1640x764

Создание кода для круговой диаграммы

Для точечной диаграммы я взяла два столбца из датасета. По оси X: бюджет каждого фильма. По оси Y: мировые кассовые сборы.

Исходный размер 1640x702

Создание кода для точечной диаграммы

При создании гистограммы я взяла топ-10 фильмов Pixar по оценке зрителей на IMDb. Для каждого из 10 фильмов мне нужны были две оценки: оценка зрителей и оценка критиков. Чтобы их можно было сравнивать на одном графике, я перевела IMDb оценки в проценты.

Исходный размер 1537x531

Создание кода для гистограммы

Для создания линейной диаграммы, показывающей тренд кассовых сборов Pixar по годам, я группировала данные по времени. Для каждого года рассчитала средние кассовые сборы. Так как суммы сборов были большими я перевела их из сотен в миллионы для удобного чтения.

Исходный размер 1640x304

Этап создания линейной диаграммы

Визуализация данных

Для добавления цветного фона на код использован сайт

0

Горизонтальная столбчатая диаграмма

Горизонтальная столбчатая диаграмма рейтингов IMDb демонстрирует, что лишь четверть фильмов Pixar (7 из 28) преодолевают порог в 8.0 баллов, при этом лидерами стали «ВАЛЛ-И» (8.4) и «Тайна Коко» (8.4), что свидетельствует о высоком уровне зрительского признания. Наиболее успешными оказались оригинальные концепции и эмоционально насыщенные сюжеты, в то время как сиквелы и спин-оффы в среднем получают более скромные оценки, подтверждая тенденцию снижения качества при продолжении франшиз.

0

Гистограмма

К моему удивлению, критики оценивают фильмы Pixar в среднем на 10-15% выше, чем зрители. Самые высокие расхождения наблюдаются у «ВАЛЛ-И» (критики 95% vs зрители 84%) и «Истории игрушек» (100% vs 83%). У сиквелов разница минимальна у «Истории игрушек 3» и «В поисках Немо». Три фильма имеют почти идеальное совпадение мнений: «Тайна Коко», «Рататуй» и «Корпорация монстров», что указывает на их бесспорное качество.

Исходный размер 1610x960

Точечная диаграмма

Код для точечной диаграммы

По данному графику можно сделать вывод, что больший бюджет не гарантирует больших сборов. Самый кассовый фильм «Головоломка 2» имел средний бюджет, а самый дорогой проект не стал самым успешным. Успех Pixar зависит от качества и актуальности сюжета больше, чем от финансовых вложений.

Круговая диаграмма

Код для круговой диаграммы

Все топ-5 самых кассовых фильмов Pixar — это сиквелы, выпущенные после 2010 года, что показывает стратегический переход студии к проверенным франшизам. «Головоломка 2» лидирует с заметным отрывом, собрав больше, чем следующие за ней фильмы. При этом сборы внутри топ-5 распределены относительно равномерно (от 17% до 28%), что свидетельствует об устойчивом успехе.

0

Линейная диаграмма и код для неё

Средние кассовые сборы Pixar демонстрируют рост с выраженными пиками в 2004, 2010, 2018 и рекордным максимумом в 2024 году, что свидетельствует о циклическом успехе студии. Несмотря на отдельные спады (особенно в 2020–2021 годах из-за пандемии), общий тренд остаётся положительным: сборы последних лет стабильно превышают показатели раннего периода, подтверждая способность компании адаптироваться к меняющимся рыночным условиям.

Статистические методы

В процессе анализа данных о фильмах Pixar я последовательно применяла различные статистические методы. Начала с описательной статистики, чтобы получить общее представление о данных. Это позволило понять масштабы исследуемых показателей.

Параллельно проводила сравнение групп, выделяя фильмы с оценками выше и ниже порога в 8.0 баллов, а также анализировала различия между оценками критиков и зрителей.

С помощью корреляционного анализа установлено, что связь между бюджетом и сборами является слабой, что свидетельствует о наличии более значимых факторов успеха, таких как оригинальность концепции и эмоциональная глубина сюжета.

Все эти статистические методы не применялись изолированно, а органично сочетались в каждой визуализации: описательная статистика формировала контекст, корреляционный анализ выявлял взаимосвязи, сравнение групп выделяло закономерности, а анализ временных рядов показывал эволюцию показателей.

Описание применения генеративной модели

Для своей работы я использовала Chat-GPT. Он помог мне составить код для круговой диаграммы и точечной. Также помогал мне исправить ошибки в моем коде.

Для генерации иллюстраций я использовала нейросеть Recraft.

Нейросеть

Исходный размер 2048x1024

Иллюстрация созданная при помощи Recraft

Для иллюстраций

Анализ мультфильмов Pixar
Проект создан 16.01.2026
Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную...
Показать больше