Исходный размер 1082x1623

дата<10101>сет

PROTECT STATUS: not protected
Исходный размер 848x816

Учась основам кино, мне необходимо учитывать реакции людей, психологию воздействия. Изучая субъективные данные от зрительской аудитории, я получаю возможность самосовершенствоваться. Восприятие публики формирует основы для культурного, духовного, эстетического развития.

В исследовании использованы датасет (https://www.kaggle.com/datasets/sahilislam007/letterbox-movie-classification-dataset) с сайта Kaggle.

Исходный размер 1163x307

Набор данных Letterbox Movie Classification Dataset представляет собой обширную и подробную коллекцию метаданных о 10 001 фильмах и исчерпывающий срез их характеристик.

Для анализа применены такие данные, как жанры фильмов, рейтинги и количество просмотров, страны производства, данные о студиях, длительность фильма, оценки зрителей.

цветовое решение

Исходный размер 1588x435

Цвета взяты с интернет страницы Letterboxd, дабы подчеркнуть палитру и эстетику найденного датасета.

использование библиотек

В кодах использованы библиотеки: > gdown для скачивания файла из Google Drive > pandas для работы с csv-файлом > matplotlib.pyplot для осн. визуализации данных > seaborn для стилизации графика > matplotlib.colors для работы с заливкой

Исходный размер 1241x243

import gdown

file_id = '1Go5gyaugXVBdiAQ0el6mDrlxRjFLcwat' output_name = 'your_dataset.csv'

gdown.download (f'https://drive.google.com/uc?id={file_id}', output_name, quiet=False)

import pandas as pd

df = pd.read_csv (output_name)

df.head ()

Исходный размер 959x369

обработка данных / диаграммы!

[1.] Популярные комбинации жанровых специфик дают понимание текущих зрительских ожиданий и предпочтений позволяет выбирать тематику будущего проекта, минимизируя риски «провала» и развивая потенциал привлечения аудитории.

Исходный размер 1212x433

самые популярные жанры по среднему рейтингу

Для начала рассмотрим эту линейную диаграмму. Выясним первые самые популярные 10 комбинаций по среднему рейтингу. Из диаграммы видно, что первое место занимает ['Thriller', 'Drama', 'Mystery', 'TV Movie'] с очень маленьким отрывом от ['Animation', 'Mystery', 'Family', 'Comedy']

Исходный размер 919x388
Исходный размер 1191x316
Исходный размер 1191x448

самые популярные жанры по просмотрам

Теперь рассмотрим столбчатую диаграмму. Выясним первые топ-10 комбинаций по просмотрам. Из диаграммы видно, что самую высокую нишу занимает ['Animation', 'Family', 'Comedy', 'Fantasy'], а комбинации, которая была самой популярной по рейтингу (['Thriller', 'Drama', 'Mystery', 'TV Movie']) и вовсе нет в топе.

Исходный размер 1647x1160

Для успешного планирования целесообразно учитывать обе метрики — рейтинг и просмотры — и искать баланс между созданием высокорейтинговых, но возможно менее популярных среди массовой аудитории проектов и более массовых, популярных среди зрителей, даже если они имеют чуть ниже оценки.

[2.] Знание кинорынка и конкурентоспособности студий показывает зоны влияния и возможные точки роста узнаваемости. Можно искать возможности сотрудничества с международными партнёрами.

Исходный размер 1744x261

топ-5 списков студий через призму среднего рейтинга

Благодаря круговой диаграмме видим, что страна-лидер по производству кинокартин — США, так как большинство студий из приведенного топа 5 связаны именно с ней. Есть представительства из Великобритании (BBC), Германии (ZDF), Франции (France Télévisions) и Китая (Tencent).

Исходный размер 1043x998
Исходный размер 787x219
Исходный размер 2001x251

топ-5 списков студий через призму просмотров

Вторая круговая диаграмма показывает топ-5 студий, основываясь на просмотрах. По ней понятно, что страны-лидеры по количеству и влиянию — Соединенные Штаты Америки и Великобритания. Они доминируют в мировой киноиндустрии, особенно в производстве фильмов с большим бюджетом. Также присутствуют студии из Австралии, Германии, Южной Кореи и Канады.

Исходный размер 1004x1006

[3.] Продолжительное или короткое повествование требует особых подходов к монтажу, динамике сцены и удерживанию внимания зрителя. Понять оптимальное соотношение продолжительности и качества истории полезно для управления процессом съёмок и постпродакшена.

В сравнении с базой лайков и рейтингом Highest★★★★★ разберемся, какая продолжительность фильма наиболее оптимальна и приятна для пользователей. Это тем более актуально в современный период, когда многие пользователи стали носить ярлык «клиповое мышление», что подразумевает, что долго что-либо смотреть им все труднее и труднее.

Исходный размер 2062x691
Исходный размер 2081x879

Общий топ по лайкам показывает самые популярные фильмы в целом — это может быть как очень длинные, так и короткие. Однако, диаграмма с их продолжительностью указывает на то, что все они длятся более 90 минут (1 час 30 мин), так что если фильм какими-то другими факторами (сюжетом, динамикой, ритм, визуальным миром и тп) завладевает вниманием зрителей, то тогда они способны «выдержать» длинный фильм.

Исходный размер 2081x667
Исходный размер 2089x876

Есть общие фильмы в обоих топах: Parasite, Interstellar, Spider-Man: Into the Spider-Verse. > Фильмы, входящие только в топ по лайкам: Fight Club, Barbie. > Фильмы, входящие только в топ по пятизвездочному рейтингу: The Dark Knight, Everything Everywhere All at Once.

В топ по лайкам попали более короткие фильмы (Fight Club — 139 минут, Barbie — 114 минут), что логично, так как короткие фильмы чаще могут набрать много лайков за короткий период.

В топ по рейтингу звезд — фильмы с чуть большей продолжительностью (The Dark Knight — 152 минута, Everything Everywhere All at Once — 140 минут), возможно потому, что они считаются более динамичными/«эпичными».

Исходный размер 2062x679
Исходный размер 2065x687

> Средняя длина фильмов в топе по лайкам: 131.67 минут > Средняя длина фильмов в топе по пятизвездочному рейтингу: 142.20 минут

Фильмы, попавшие в оба топа, такие как Parasite, Interstellar, Spider-Man: Into the Spider-Verse, — имеют длительность более 90 минут, что свидетельствует о престижности и высокой оценке зрителей независимо от критериев (лайки или рейтинг). Наличие более коротких фильмов в топе по лайкам говорит о необходимости «быстрого» вовлечения зрителя, тогда как в топе по рейтингам выделяются фильмы с более длинным и насыщенным сюжетом, что требует сильного погружения.

Анализируя данные о продолжительности фильмов в топах по лайкам и рейтингу Highest★★★★★, можно сделать вывод, что наиболее оптимальная длительность для современного зрителя составляет примерно 130-140 минут. Создание фильмов в данной временной рамке может повысить их популярность и удовлетворенность зрителей, учитывая тенденции к сокращению внимания и предпочтение динамичного контента.

Исходный размер 789x277

инструменты / генеративные модели:

  1. Gpt + Giga chat — исправление ошибок в кодах
  2. Google Collab — работа с датасетом, создание графиков

(ссылки на нейросети: https://trychatgpt.ru/ + https://giga.chat/)

Исходный размер 1283x428
дата<10101>сет
Проект создан 05.02.2026
Загрузка...
Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную...
Показать больше