Исходный размер 1140x1600

Анализ зрительских предпочтений на примере 50 лучших фильмов

PROTECT STATUS: not protected

Концепция

Свой проект я бы хотела посвятить анализу зрительских предпочтений на примере 50 лучших фильмов разных жанров. В наше время через человека проходит огромный поток информации и успеть её обработать и зафиксировать становится крайне сложно, даже если речь заходит о простом выборе фильма на вечер. Целью моего проекта является формирование кратких выводов, которые облегчат зрителю поиск и выбор фильма. Используя разные базы данных, я выявила наиболее популярного режиссёра, 10 самых просматриваемых фильмов, самый популярный жанр и самые длинные фильмы. Данные представила в виде круговой диаграммы, гистограммы, точечной диаграммы и облака слов.

Обложка

Обложка для проекта была сгенерирована с помощью ИИ в нейросети Midjourney, выполнена в стиле кинообложек 2000-х.

#660099 Основной цвет

Поиск и обработка данных

Для сбора данных я воспользовалась kaggle и библиотекой numpy, скачала cvs-файл. Код был написан в google colab, а для устранения образовавшихся ошибок пользовалась Chat-GPT.

Визуализация полученных данных

Гистограмма демонстрирует нам, что наиболее востребованным жанром является Action/Боевик, он встречается в каждом из 50 фильмов, за ним идут жанры Drama/Драма и Adventure/Приключение.

Исходный размер 1190x790

Гистограмма. Распределение фильмов по жанрам

Исходный размер 1800x994

На круговой диаграмме мы наглядно видим, что самым популярным режиссером является Christopher Nolan/Кристофер Нолан. Он снял наибольшее количество фильмов из списка (4).

Исходный размер 1182x841

Круговая диаграмма. Распределение фильмов по режиссерам

Исходный размер 1800x1108

Облако слов показывает нам названия 10 самых просматриваемых фильмов из списка 50 лучших фильмов.

  1. The Dark Knight — 2564876 голосов
  2. Inception — 2276070 голосов
  3. The Matrix — 1863163 голосов
  4. The Lord of the Rings: The Fellowship of the Ring — 1803162 голосов
  5. The Lord of the Rings: The Return of the King — 1781988 голосов
  6. The Dark Knight Rises — 1656953 голосов
  7. The Lord of the Rings: The Two Towers — 1609410 голосов
  8. Gladiator — 1457691 голосов
  9. Batman Begins — 1430635 голосов
  10. Star Wars — 1326295 голосов
Исходный размер 1252x661

Облако слов. 10 наиболее просматриваемых фильмов из списка

Исходный размер 1800x1161

Точечная диаграмма фиксирует самы длинные по продолжительности фильмы из списка.

  1. Gangs of Wasseypur — 321 min
  2. Seven Samurai — 207 min
  3. The Lord of the Rings: The Return of the King — 201 min
  4. RRR — 187 min
  5. Avengers: Endgame — 181 min
  6. The Lord of the Rings: The Two Towers — 179 min
  7. The Lord of the Rings: The Fellowship of the Ring — 178 min
  8. Heat — 170 min
  9. K.G.F: Chapter 2 — 168 min
  10. Baahubali 2: The Conclusion — 167 min
Исходный размер 1179x790

Точечная диаграмма. Самые длинные фильмы

Исходный размер 1718x1252

Заключение

Анализ датасета помог определить некоторые пункты, на которые человек сможет удобно ориентироваться при выборе фильма. Например, по выбору режиссера, длительности фильма, наиболее популярного жанра или краткой выжимки лучших фильмов.

Описание применения генеративных моделей

Для своего проекта я пользовалась ИИ в качестве помощника для генерации изображения (обложки) Midjourney. Для написания кода был использован Google Colab. Для устранения неточностей в коде я пользовалась Chat-GPT. Текст для проекта был сформулирован лично мной, без помощи ИИ.

Анализ зрительских предпочтений на примере 50 лучших фильмов
Проект создан 16.01.2026
Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную...
Показать больше