
Monster High — это не просто франшиза о подростках-монстрах, а целая культурная вселенная, сформировавшая эстетику целого поколения. В отличие от традиционных кукол, Monster High предложила новый нарратив: быть другим — это не недостаток, а сила. Эта философия «быть собой, быть уникальным, быть монстром» стала для многих, включая меня, важным посланием о принятии и самоидентификации.

В рамках данного проекта я рассматриваю Monster High не просто как коммерческую франшизу, а как сложную систему персонажей, поддающуюся количественному анализу. В фокусе исследования — демографическая структура школы монстров, факторы популярности персонажей и взаимосвязь между характеристиками монстров и их «успешностью» во вселенной.
В качестве источника данных был использован структурированный датасет, содержащий информацию о 75 персонажах Monster High. Он включает ключевые параметры: тип монстра, возраст, гендер, наличие куклы, статус (главный/второстепенный) и рейтинг в фанатской Tier-листе, что делает возможным как общий анализ состава школы, так и изучение отдельных паттернов успеха.
Цель проекта — проанализировать, как распределяются персонажи по типам монстров, выявить факторы, влияющие на их популярность (наличие куклы, рейтинг), а также исследовать гендерные и возрастные особенности вселенной. Отдельное внимание уделяется гибридным монстрам как индикаторам разнообразия франшизы.
Таким образом, проект представляет собой попытку применить инструменты data science к поп-культурному феномену, чтобы получить новое, аналитическое понимание того, что делает персонажа Monster High успешным — не только в рамках повествования, но и в коммерческом, и фанатском восприятии.
Визуализация данных
При оформлении графиков я опиралась на визуальный язык вселенной Monster High. В качестве основы была выбрана фирменная цветовая палитра франшизы — насыщенный розовый (

Для представления данных я использовала пять типов графиков, каждый из которых отвечает на конкретный исследовательский вопрос.
Столбчатая диаграмма «Топ‑5 типов монстров» позволяет сравнить распространённость разных видов существ в школе и выделить самые популярные категории.
Парные круговые диаграммы «Демография Monster High» наглядно показывают соотношение персонажей по полу и по статусу (главные / второстепенные), раскрывая гендерный и нарративный баланс вселенной.
Столбчатая диаграмма «Средний возраст по типам монстров» демонстрирует, как возрастные характеристики связаны с мифологической природой каждого типа — от древних мумий и вампиров до подростков‑оборотней.
Тепловая карта «Средний рейтинг по типам монстров» выявляет корреляцию между типом монстра и его фанатской оценкой, выделяя наиболее и наименее популярные категории.
Сдвоенная столбчатая диаграмма «Анализ рейтингов и наличия кукол» раскрывает взаимосвязь между фанатским рейтингом (Tier List) и коммерческим успехом персонажа (выпуск куклы), показывая, как популярность влияет на продуктовую стратегию франшизы.
Таким образом, выбранные типы визуализаций позволяют последовательно исследовать структуру вселенной Monster High — от демографического состава и возрастных особенностей до факторов популярности и бизнес‑логики выпуска товаров.
Этапы анализа 1) загрузка данных

Для анализа данных использовала библиотеку pandas: загрузила CSV-файл с информацией о 75 персонажах Monster High и провела первичную проверку. Датасет оказался хорошо структурированным — 9 столбцов с ключевыми характеристиками (тип монстра, возраст, статус, наличие куклы, рейтинг и другие) без пропущенных значений. Для удобства вычислений преобразовала данные: буквенные рейтинги (S–E) перевела в числовую шкалу, а булевые поля — в логический тип.
На основе подготовленных данных создала пять стилизованных визуализаций с помощью matplotlib и seaborn. Графики выполнены в фирменной палитре Monster High — тёмный фон с неоново-розовыми, голубыми и фиолетовыми акцентами. Каждая диаграмма отвечает на отдельный исследовательский вопрос, от демографического состава школы до анализа факторов популярности персонажей и их коммерческого успеха.
Очистка и подготовка данных

На следующем этапе была выполнена подготовка данных. Для анализа отобраны только персонажи с выпущенными куклами (Doll = True), так как они представляют основной коммерческий и нарративный интерес франшизы. Это позволило сосредоточиться на 71 персонаже, формирующем ядро вселенной Monster High.
Для более глубокого анализа в таблицу были добавлены новые метрики: числовая оценка рейтинга (от 1 для E до 6 для S) и возрастная категория (древние монстры > 100 лет vs подростки-монстры). Это позволило перейти от простого описания к анализу взаимосвязей. После подготовки стало заметно, что 100% главных персонажей имеют куклы, а самые высокие рейтинги сконцентрированы у мифологически мощных типов монстров.
Расчёт статистики по персонажам

После подготовки данных была сформирована агрегированная статистика по каждому типу монстра. Для этого данные были сгруппированы по категориям существ, а затем рассчитаны ключевые показатели: количество персонажей, средний возраст, средний рейтинг и процент персонажей с куклами.
Полученная статистика позволила выявить иерархию типов монстров по их представленности и успешности во вселенной. Анализ показал, что призраки (Ghost) являются самой многочисленной категорией, в то время как гаргульи (Gargoyle) демонстрируют наивысший средний рейтинг. Это подтверждает гипотезу о доминировании классических готических типов и неравномерном распределении фанатской популярности. Итоговая таблица с топ-5 типами монстров была сохранена отдельно и использовалась в дальнейших этапах визуализации.
Оформление данных

В оформлении я использовала цветовую палитру, отражающую индивидуальность каждого ключевого персонажа из вселенной My Little Pony.
На светлом нейтральном фоне я выделила семь основных цветов, каждый из которых ассоциирован с конкретным персонажем: глубокий фиолетовый для Twilight Sparkle, ярко-голубой для Rainbow Dash, насыщенный розовый для Pinkie Pie, золотисто-оранжевый для Applejack, лавандовый для Rarity, зелёный для Spike и солнечно-жёлтый для Fluttershy. Такое цветовое кодирование позволило сохранять визуальную идентичность героев на всех этапах анализа, обеспечивая интуитивную читаемость графиков. В сочетании с чёткими контурами элементов, контрастными подписями и умеренной сеткой это создало гармоничный и информативный стиль, отвечающий как аналитической строгости, так и тематическому духу сериала.
Цветовая палитра проекта
Итоговые графики

Анализируется: Распределение персонажей по типам монстров, выделение наиболее представленных видов во вселенной Monster High. Ключевые инсайты:
Самый распространённый тип — Ghost (Призрак) — 13 персонажей (17,3% от общего числа)
Топ-5 типов охватывает 37 персонажей (49,3%) — почти половину всего состава школы
Наблюдается значительный перекос в представленности: призраки и вампиры доминируют, в то время как многие другие типы представлены единичными персонажами Вывод: Monster High демонстрирует фокус на классических «готических» типах монстров, что соответствует эстетике франшизы.

Анализируется: Гендерное распределение и соотношение главных/второстепенных персонажей. Ключевые инсайты:
Яркий гендерный дисбаланс: 85,3% персонажей — женского пола, лишь 14,7% — мужского
Преобладание второстепенных персонажей: 86,7% против 13,3% главных героев
Совмещённая статистика: Все главные персонажи — женского пола Вывод: Франшиза ориентирована преимущественно на женскую аудиторию, с фокусом на расширенной вселенной персонажей, а не только на основной группе.

Анализируется: Возрастные характеристики различных типов монстров. Ключевые инсайты:
Экстремальные возрастные различия: Мумии (Ø5843 года) и вампиры (Ø1600 лет) радикально старше других типов
Подростковый фокус: Большинство типов (оборотни, зомби, монстры Франкенштейна, горгоны) имеют возраст 15-17 лет
Повествовательная логика: Соответствие мифологическим особенностям — древние существа против подростков-монстров Вывод: Monster High умело сочетает мифологическую достоверность (древние монстры) с подростковой темой (большинство персонажей-подростков).

Анализируется: Корреляция между типом монстра и фанатским рейтингом (Tier List). Ключевые инсайты:
Абсолютный лидер: Gargoyle (Гаргулья) имеет наивысший средний рейтинг — 6.0 (максимум S)
Высоко оценённые типы: Alien (Инопланетянин), Dragon (Дракон), Yeti (Йети) — рейтинг A-B
Самые низкие оценки: Plant Monster (Растительный монстр), Unknown (Неизвестный), Deer Spirit (Олений дух) — рейтинг D-E
Визуальный паттерн: Тёмные оттенки (высокие оценки) сосредоточены в верхней части Вывод: Фанаты высоко ценят «экзотические» и мифологически мощные типы монстров, в то время как более «мирные» типы получают низкие оценки.
Заключение
Визуальный анализ выявил дополнительные инсайты: гаргульи, несмотря на малочисленность (всего 2 персонажа), демонстрируют наивысший средний рейтинг (6.0 по шкале S-E), что указывает на фанатское предпочтение мифологически мощных и экзотических типов. Парадоксально, что самые многочисленные типы (призраки — 13 персонажей) не достигают аналогичных высот в рейтингах, что свидетельствует о разрыве между количественным представлением и качественным восприятием. Гибридные монстры, составляющие лишь 8% выборки, не показывают преимущества в рейтингах или коммерческом успехе, что ставит под вопрос нарративный потенциал «смешанных» существ во вселенной.
Особый интерес представляет анализ возрастных кластеров: выявлены две чёткие группы — «древние» (мумии ~5840 лет, вампиры ~1600 лет) и «подростки» (большинство типов 15-17 лет). Это разделение отражает двойственную природу франшизы: уважение к мифологическим канонам сочетается с подростковой идентификацией. Бизнес-логика прослеживается в 100% охвате куклами главных персонажей и прогрессивном снижении этого показателя от рейтинга S (100%) к E (0%), демонстрируя чёткую связь между фанатской популярностью и продуктовой стратегией.
Таким образом, Monster High представляет собой сложную экосистему, где каждая характеристика — от типа монстра до возраста — выполняет конкретную функцию в построении вселенной. Проект подтвердил, что за внешней «стильностью» и подростковой эстетикой скрывается продуманная система, балансирующая между мифологической аутентичностью, повествовательной логикой и коммерческой целесообразностью.
Использованные ресурсы и генеративные модели
1. Нейросеть GPT 5.2 — для решения ошибок и консультации по поводу возможностей тех или иных библиотек. 2. Google Collab — работа с датасетом, создание графиков. 3. Kaggle — источник датасета.