Исходный размер 1140x1600

Анализ Disney+

PROTECT STATUS: not protected

Концепция проекта

Disney+ — одна из самых популярных стриминговых платформ в мире, которая предлагает огромное количество фильмов, сериалов и другого контента. Анализ данных этой платформы позволяет понять, какие тенденции существуют в индустрии развлечений, и какие типы контента наиболее востребованы.

Понимание структуры контента Disney+ может быть полезно для маркетологов, продюсеров и создателей контента, которые хотят лучше ориентироваться в предпочтениях аудитории.

Я всегда был большим фанатом Disney. С детства меня вдохновляли их фильмы, мультфильмы и сериалы, которые не только развлекали, но и учили важным жизненным ценностям. Когда у меня появилась возможность проанализировать данные, я сразу подумал о Disney+, потому что это платформа, которая объединяет всё, что я люблю: классические мультфильмы, фильмы Marvel, Star Wars и многое другое.

Какие данные вы выбрали и где вы их нашли?

Данные: Информация о контенте на Disney+ (фильмы, сериалы, рейтинги, жанры, годы выпуска и т. д.) на сайте Kaggle.

Какой вид графиков вы решили сделать?

  1. Круговые диаграммы (распределение типов контента).

  2. Столбчатые диаграммы (распределение рейтингов и жанров).

  3. Линейные графики (количество выпусков по годам).

  4. Интерактивные графики с использованием Plotly для более детального анализа.

Этапы работы

  1. Загрузка данных
  2. Анализ данных
  3. Обработка пропущенных значений
  4. Визуализация данных

import pandas as pd try: …df = pd.read_csv ('disney_plus_titles.csv') except Exception as e: …print (f"Ошибка при чтении файла: {e}»)

Описание: Загрузка данных из CSV-файла и обработка возможных ошибок.

print («Информация о данных:») custom_info (df)

Описание: Получение общей информации о данных (количество строк, столбцов, типы данных).

missing_values = df.isnull ().sum ().rename_axis ('Колонка').reset_index (name='Количество пропусков') print (tabulate (missing_values, headers='keys', tablefmt='pretty', stralign='left'))

Описание: Подсчёт пропущенных значений в каждом столбце.

import plotly.express as px fig = px.pie (df, names='type', title='Распределение типов контента на Disney+') fig.show ()

Описание: Создание круговой диаграммы для анализа распределения типов контента.

Итоговые графики

Исходный размер 1920x975

Круговая диаграмма, показывающая процентное соотношение фильмов и сериалов на Disney+.

Исходный размер 758x94
Исходный размер 1398x525

Горизонтальная столбчатая диаграмма, показывающая количество контента для каждого рейтинга.

Исходный размер 1082x161
Исходный размер 1398x525

Горизонтальная столбчатая диаграмма, показывающая самые популярные жанры на Disney+.

Исходный размер 982x166
Исходный размер 1398x525

Линейный график, показывающий количество выпусков контента по годам.

Исходный размер 1265x215
Исходный размер 1398x525

Горизонтальная столбчатая диаграмма, показывающая страны, которые производят больше всего контента для Disney+

Исходный размер 992x256

Заключение

  1. Большая часть контента на Disney+ — это фильмы.
  2. Наиболее распространенные рейтинги — TV-G, TV-PG и G.
  3. Самые популярные жанры — это комедии, семейные фильмы и анимация.
  4. Количество выпусков значительно увеличилось с 2010-х годов.
  5. Больше всего контента производится в США, Индии и Великобритании.

Использование нейросетей

Для создания обложки я использовал нейросеть leonardo.ai с промтом: «disney castle as hacker pattern »

https://leonardo.ai/

Скачать датасет и код

Анализ Disney+
Проект создан 10.04.2025
Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную...
Показать больше