
Концепция
Фильмы о Barbie — одна из самых популярных и узнаваемых кинематографических вселенных, образ которой сопровождает многих с детства. Как зрителю и дизайнеру, мне всегда был интересен визуальный и социальный образ Barbie, поэтому в этом проекте я решила проанализировать одну из своих любимых кино-вселенных через данные.
Используя открытый датасет и инструменты программирования, я исследую распределение персонажей и актёров по полу, наиболее распространённые типы персонажей, визуальные характеристики героев (цвет волос и глаз), а также участие актёров озвучки. Анализ позволяет посмотреть на знакомый образ Barbie не интуитивно, а через количественные и визуальные закономерности.
Данные для анализа
Для анализа использован публичный датасет The Barbie Cinematographic Universe (Barbieverse), размещённый на платформе Kaggle. Датасет содержит структурированную информацию о персонажах и актёрах, участвующих в фильмах вселенной Barbie.
В данных представлены следующие параметры: - имя персонажа; - пол персонажа и актёра; - тип персонажа (раса / сущность); - цвет волос; - цвет глаз; - актёр озвучки; - количество персонажей, озвученных одним актёром; - дополнительные категориальные признаки (в том числе значения «не указано»).
Формат данных — табличный, что позволяет проводить фильтрацию, группировку и агрегацию данных для последующего анализа и визуализации.
Исследовательский вопрос:
Какие визуальные и гендерные паттерны характерны для персонажей кинематографической вселенной Barbie и можно ли через анализ данных выявить устойчивые особенности репрезентации внутри популярной медиафраншизы?
Для визуализации результатов анализа были использованы несколько типов графиков, каждый из которых решает свою аналитическую задачу и позволяет наглядно интерпретировать данные.
Круговая диаграмма применяется для анализа долевых распределений. С её помощью визуализируется распределение пола актёров и персонажей, что позволяет быстро оценить соотношение категорий и выявить доминирующие группы.
Столбчатая диаграмма используется для сравнения категориальных данных. Она применена для отображения топ-10 наиболее распространённых рас персонажей, распределения цветов волос, а также топ-15 актёров озвучки по количеству персонажей. Такой формат позволяет легко сравнивать значения между категориями и выявлять лидеров.
Столбчато-точечная диаграмма применяется для анализа взаимосвязей между несколькими признаками. В проекте она используется для изучения связи между цветом глаз и цветом волос персонажей. Размер и положение элементов позволяют одновременно учитывать несколько параметров и выявлять устойчивые паттерны.
Использование разных типов визуализаций позволяет рассмотреть данные с нескольких точек зрения и сделать выводы не только количественно, но и визуально.
В визуализации и общем оформлении проекта использовалась цветовая палитра, вдохновлённая кинематографической вселенной Barbie. В качестве основного акцентного цвета был выбран фирменный розовый оттенок Barbie — #E0218A, который напрямую ассоциируется с визуальной айдентикой бренда.
Типографика проекта также отсылает к визуальному языку франшизы: для заголовков был использован шрифт Barbie, стилистически близкий к шрифту логотипа, применявшегося в одном из ранних вариантов фирменного знака.
Анализ и визуализация данных
Импорт библиотек и загрузка данных
На этом этапе устанавливаем и импортируем необходимые библиотеки (Pandas, Matplotlib, Seaborn) для работы с данными и построения визуализаций. Настраиваем стиль графиков и палитру цветов в тематике Барби для наглядного и привлекательного отображения информации.
Загрузка и первичный просмотр данных
На этом этапе мы загружаем данные из CSV-файла в датафрейм Pandas. Проверяем первые строки таблицы, размер датасета и названия столбцов, а также получаем общую информацию о типах данных и пропущенных значениях. Это позволяет убедиться, что данные корректно считаны и готовы к дальнейшему анализу.
Установка фирменного шрифта Barbie
На этом этапе мы загружаем и устанавливаем шрифт Barbie для графиков. После добавления шрифта в систему, он применяется к визуализациям, что делает графики стилистически согласованными с концепцией проекта.
Очистка и перевод данных на русский язык
На этом этапе создаём рабочую копию данных и приводим названия колонок к русскому языку для удобства анализа. Переводим ключевые характеристики персонажей — пол, расу, цвет волос, глаз и кожи — на русский язык и группируем похожие значения. Это позволяет стандартизировать данные и подготовить их к визуализации и дальнейшему анализу.
Распределение персонажей по полу
На этом этапе анализируем распределение персонажей по полу. После стандартизации значений создаём круговую диаграмму в стиле Barbie, показывающую количество и процентное соотношение мужских и женских персонажей. Такая визуализация помогает наглядно оценить баланс полов среди персонажей.
Визуализация топ-10 самых распространённых рас персонажей
На этом этапе анализируем расовое разнообразие персонажей. Создаём горизонтальную столбчатую диаграмму, показывающую десять наиболее часто встречающихся рас. Визуализация позволяет наглядно оценить, какие расы представлены чаще всего, а также их количественное и процентное соотношение среди персонажей.
Распределение цветов волос персонажей
На этом этапе анализируем цвета волос персонажей. Создаём столбчатую диаграмму с индивидуальными цветами для каждого типа волос, показывающую количество персонажей в каждой категории. Визуализация помогает наглядно оценить популярность разных цветов волос среди персонажей и выявить преобладающие оттенки.
Топ-15 актёров озвучки по количеству персонажей
На этом этапе анализируем, какие актёры озвучивали наибольшее количество персонажей. Строим столбчатую диаграмму, показывающую топ-15 актёров, с указанием количества персонажей, которые они озвучили. Визуализация позволяет наглядно оценить нагрузку актёров и их вклад в проект.
Гендерное распределение по расам
На этом этапе анализируем распределение персонажей по полу внутри наиболее распространённых рас. Строим группированную столбчатую диаграмму, которая показывает количество мужских и женских персонажей в каждой из восьми топ-рас. Визуализация позволяет выявить закономерности и дисбаланс гендерного распределения среди разных рас.
Взаимосвязь цвета глаз и цвета волос у персонажей
На этом этапе анализируем сочетания цвета глаз и цвета волос персонажей. Создаём точечную диаграмму, где размер точек отражает количество персонажей с конкретной комбинацией. Визуализация позволяет выявить наиболее распространённые сочетания и изучить закономерности внешнего облика персонажей.
Вывод
Проведённый анализ и визуализация данных по персонажам вселенной Барби позволяют сделать обобщающий вывод о том, что франшиза выстроена на сочетании устойчивых дизайнерских шаблонов и контролируемого расширения разнообразия. Визуальные паттерны (распределения, сравнительные диаграммы, корреляции признаков) наглядно показывают, что ядро вселенной по-прежнему формируется вокруг антропоморфных женских образов с каноническими чертами внешности, обеспечивающих узнаваемость бренда и его коммерческую стабильность.
В то же время графики ясно демонстрируют постепенное усложнение структуры персонажей: появление фантастических существ, вариативность внешности и расширение ролевых моделей. Эти изменения не носят хаотичный характер, а выглядят как стратегически выверенное добавление новых элементов поверх базовой модели. Визуализации подтверждают, что разнообразие вводится дозированно, не разрушая центральный визуальный и идеологический образ Барби.
Корреляционные и категориальные диаграммы указывают на наличие стандартизации в дизайне персонажей, что, вероятно, связано с производственными и маркетинговыми причинами. Одновременно они выявляют зоны потенциального роста — те аспекты, где вариативность пока ограничена и может быть расширена без потери целостности франшизы.
Таким образом, итог анализа заключается в том, что вселенная Барби представляет собой управляемую систему образов, в которой визуальная и сюжетная эволюция происходит постепенно и осознанно. Полученные результаты подтверждают ценность количественного анализа и визуализации данных как инструмента для выявления скрытых закономерностей в медиафраншизах и могут служить основой для дальнейших сравнительных и динамических исследований.
Заключение
Анализ персонажей из вселенной Барби, основанный на предоставленных визуализациях, раскрывает ключевые тенденции в дизайне и представлении героев в этой франшизе. В целом, данные указывают на доминирование человеческих персонажей (более 530 из общего количества), что подчеркивает фокус на реалистичных, relatable образах, ориентированных на детскую аудиторию. Гендерное распределение демонстрирует значительный перевес в сторону женских персонажей (57.8% или 512 из общего числа), что отражает исходную концепцию Барби как иконы женственности и empowerment для девочек, хотя мужские персонажи также занимают существенную долю (39.6% или 350), обеспечивая баланс в повествованиях. Неуказанный гендер (2.6% или 22) может указывать на небинарные или абстрактные сущности, добавляющие разнообразия.
Расовое и видовое разнообразие персонажей показывает преобладание «человека» как базовой расы, но с заметным включением фантастических элементов, таких как русалки (43), собаки (33) и феи (24), что усиливает магический и приключенческий аспект историй Барби. Топ-10 рас подтверждает это, с «человеком» на первом месте, за которым следуют мифические и животные типы, что может быть стратегией для привлечения интереса детей к разнообразным мирам. В распределении цветов волос лидирует блонд (255 персонажей), за ним брюнет (224) и шатен (184), что соответствует классическому образу Барби как блондинки, но также демонстрирует попытки диверсификации внешности. Менее распространенные цвета, такие как серый (93) или оранжевый (31), добавляют уникальности редким персонажам.
Гендерное распределение по расам подчеркивает, что женские персонажи доминируют в большинстве категорий, особенно среди людей (311 женских vs 211 мужских), русалок (42 женских) и фей, в то время как мужские чаще встречаются в ролях, связанных с животными или мифическими существами. Это может отражать гендерные стереотипы в детских медиа, где женщины ассоциируются с красотой и магией, а мужчины — с приключениями или юмором. Взаимосвязь цветов глаз и волос, визуализированная в бабл-чарте, показывает сильные корреляции, например, голубые глаза с блонд волосами (185) или карие глаза с брюнет (135), что указывает на стандартизированные эстетические шаблоны в дизайне, возможно, для упрощения производства кукол и анимации.
В озвучке топ-15 актеров возглавляют Kelly Sheridan (40 ролей) и Kathleen Barr (39), что свидетельствует о зависимости франшизы от опытных голосовых актеров, специализирующихся на детском контенте. Это подчеркивает профессионализм в производстве, где повторяющиеся голоса создают узнаваемость бренда. Общий объем данных (около 884 персонажей, судя по суммам) предполагает обширную вселенную Барби, эволюционирующую от простых кукол к сложным нарративам в фильмах и сериалах.
В заключение, анализ раскрывает, как Барби балансирует между традиционными идеалами красоты и растущим разнообразием, способствуя инклюзивности, но сохраняя корневые элементы бренда. Это может влиять на культурное восприятие гендера и внешности среди детей, подчеркивая необходимость дальнейшего расширения представленности для отражения реального мира. Дальнейшие исследования могли бы включать временной анализ эволюции персонажей или сравнение с другими франшизами, такими как Disney или My Little Pony, чтобы оценить прогресс в разнообразии.