
Данный проект посвящён анализу фильмов Studio Ghibli с точки зрения их производственных, жанровых и авторских характеристик. Цель исследования — выявить ключевые закономерности в развитии студии во времени: как менялись бюджеты и сборы, жанровая структура, продолжительность фильмов и активность режиссёров.
Проект строится на анализе исходных данных открытого датасета с платформы Kaggle и демонстрирует, как количественные показатели отражают эволюцию художественного и производственного подхода Studio Ghibli.
Я выбрала тему Studio Ghibli, так как фильмы этой студии являются одними из моих любимых с детства и сыграли важную роль в формировании моего отношения к анимации. Они являются значимым культурным феноменом, повлиявшим на развитие авторской анимации.
Анализ датасета позволяет по-новому взглянуть на знакомые фильмы и проследить изменения, сочетая эмоциональную ценность с аналитическим подходом.
Для анализа и визуализации данных использовались библиотеки Pandas, NumPy, Matplotlib и Seaborn. Они позволили обработать датасет, сгруппировать данные по годам, десятилетиям, жанрам и режиссёрам, а также создать как обзорные, так и объясняющие визуализации.
Структура данных: Name — название фильма Year — год выхода Director — режиссёр Screenplay — сценарист Budget — бюджет Revenue — сборы Genre — жанры Duration — длительность
При оформлении графиков я придерживалась цветовой палитры, которую определила с помощью Adobe Color с референсами в виде самых популярных мультфильмов Ghibli.
Цветовая система проекта:
#9BB7D4 Приглушённый холодный голубой оттенок. Используется для отображения основных количественных данных на графиках (линии, столбцы, тепловые карты). Цвет ассоциируется со спокойствием и созерцательностью и отсылает к визуальному языку фильмов Studio Ghibli — неагрессивному и атмосферному.
#2F2F2F Мягкий тёмно-серый цвет. Применяется для подписей осей, заголовков, рамок и контуров выделений. Обеспечивает достаточный контраст на светлом фоне, не создавая жёсткого визуального напряжения, в отличие от чисто чёрного цвета.
#E3E3E3 Светло-серый оттенок. Используется для второстепенных элементов, фоновых значений и приглушённых категорий. Помогает визуально отделять главное от вторичного, не перегружая композицию.
#DADADA Нейтральный светло-серый цвет. Применяется для вспомогательной сетки графиков. Сетка помогает считывать значения и ориентироваться в данных, оставаясь визуально ненавязчивой.
#C97C5D Тёплый приглушённый терракотовый оттенок. Используется для выделения ключевых точек, пиков активности и доминирующих элементов в объясняющих визуализациях. Цвет добавляет эмоциональный акцент, не нарушая общей спокойной палитры проекта.
Используемый шрифт: DejaVu Sans
Используемые виды графиков: 1. Линейный график 2. Boxplot 3. Столбчатая диаграмма 4. Тепловая карта
Подготовка данных:
Анализ проводился в среде Google Colab с использованием библиотеки Pandas. Данные были загружены в формате CSV и считаны с помощью функции pd.read_csv ().
Я проверила: размеры таблицы, пропуски, типы данных в колонках. И «почистила» данные, чтобы они стали числовыми и пригодными для аналитики: Year → в целое число Budget, Revenue → в числа (очистка от символов, приведение к float) Duration → в минуты (например, извлечение чисел и перевод в общий формат)
На следующем этапе анализ был сосредоточен на временных и категориальных характеристиках фильмов, таких как: год выпуска, режиссёр, жанры, длительность фильмов.
Для анализа динамики во времени был создан дополнительный признак — десятилетие выпуска фильма, что позволило агрегировать данные и выявить долгосрочные тенденции:
df[«Decade»] = (df[«Year»] // 10) * 10 df[«Decade»] = df[«Decade»].astype (str) + «s»
Первой задачей визуального анализа стало изучение изменения средних бюджетов и сборов фильмов Studio Ghibli во времени. Для этого были агрегированы данные по годам выпуска и рассчитаны средние значения.
Был построен линейный график, позволяющий: оценить общую динамику бюджетов, выявить резкие скачки сборов, определить возможные аномалии в данных.
Этот график носил изучающий характер и использовался для первичного понимания финансовых трендов.
На основе изучающего анализа был построен объясняющий линейный график с более аккуратным визуальным оформлением: единая цветовая логика, подписи осей, легенда, сглаженная визуальная иерархия.
Целью графика стало наглядное сравнение бюджетов и сборов во времени и фиксация ключевых периодов роста и спадов.
Boxplot: длительность фильмов по десятилетиям
Для анализа изменений формата фильмов во времени была изучена длительность фильмов по десятилетиям. Сначала данные были сгруппированы по десятилетиям: df.groupby («Decade»)[«Duration»].describe ()
Затем был построен boxplot, позволяющий: увидеть медиану длительности, оценить разброс значений, выявить возможные выбросы.
Этот график использовался для поиска различий между эпохами.
На следующем этапе boxplot был оформлен как объясняющий: каждый десятилетний период получил собственный цвет, были убраны лишние элементы, усилен акцент на сравнении медианных значений.
График наглядно демонстрирует, как менялась средняя длительность фильмов Studio Ghibli с течением времени.
Для анализа жанровой эволюции студии были подсчитаны количества фильмов каждого жанра в рамках десятилетий.
Составная столбчатая диаграмма позволила: увидеть доминирующие жанры в разные периоды, отследить появление новых жанров, сравнить насыщенность десятилетий.
В объясняющей версии графика: была выстроена чёткая цветовая система для жанров, добавлена легенда, усилена читаемость столбцов.
Этот график иллюстрирует жанровую стратегию Studio Ghibli и её изменения во времени.
Тепловая карта активности режиссёров по годам
Для анализа творческой активности режиссёров была построена тепловая карта, отражающая количество фильмов, выпущенных каждым режиссёром в конкретные годы.
График позволил: выявить периоды максимальной активности, увидеть пересечения творческих периодов режиссёров, обнаружить редкие или единичные участия.
В объясняющей версии тепловой карты: была убрана дополнительная аннотация, сохранена минималистичная цветовая шкала, усилен фокус на ритме производства.
График наглядно демонстрирует, что производство фильмов Studio Ghibli распределено неравномерно и во многом связано с отдельными творческими фигурами.
Во всех графиках был соблюдён единый принцип: изучающий график — поиск закономерностей и проверка гипотез; объясняющий график — структурированное и визуально чистое представление выводов.
Такой подход позволяет не только анализировать данные, но и превращать их в понятный визуальный рассказ, что особенно важно для проектов на стыке дизайна и аналитики.
В результате проделанной работы анализ оказался целостным и содержательным. Использование различных типов визуализаций позволило глубже понять особенности фильмов Studio Ghibli, выявить динамику бюджетов и сборов, изменения в длительности фильмов, жанровую структуру по десятилетиям и ритм творческой активности режиссёров. Полученные результаты наглядно показали эволюцию студии во времени, устойчивость её художественного подхода и ключевую роль отдельных авторов. Проведённый анализ дал ценные инсайты и подтвердил эффективность выбранных методов визуализации и аналитического подхода.
ChatGPT использовался для помощи в реализации сентимент-анализа, а также составления кода и редакции готового текста.