Original size 896x1200

Эволюция аниме‑жанров за последние 30 лет: факторы успеха

PROTECT STATUS: not protected
The project is taking part in the competition

Данные

Я использовала датасет «Top 15,000 Ranked Anime Dataset (Update to 2025)» с Kaggle. Таблица содержит около 15 000 аниме с MyAnimeList с полями: название, жанры, год/сезон премьеры, рейтинг, популярность, количество участников, студии и др. ​ Для генерации изображений я использовала нейросеть Krea, где были задействованы разные промпты по созданию аниме картинок в выбранной стилистике. Я вставила скрин цветовой палитры, найденной в интернете и попросила ее сгенерировать несколько изображений в милой chibi стилистике.

big
Original size 1024x1024

Почему аниме?

На самом деле, основная причина весьма проста: я смотрю аниме, пока делаю учебные проекты, но с каждым разом найти новое, хорошее аниме всё проблематичнее. Перебирать тысячи тайтлов вручную слишком тяжело, вот и получается, что нужен какой-то более быстрый и рациональный подход. Чтобы анализ отвечал требованиям учебного проекта, я не просто буду перебирать статистику в поисках хороших аниме, но и проанализирую, как за последние 30 лет менялись аниме-тренды, а также как связаны рейтинг и популярность.

Original size 1024x1024

План анализа и графики

Всего будет 5 графиков: линейный, столбчатая диаграмма, рейтинговая таблица, точечная диаграмма с линией регрессии, ящик с усами. Эти графики покажут, какие жанры были наиболее популярны в тот или иной период (где мне искать, что посмотреть в следующем модуле), какой их средний рейтинг (точно ли мне стоит их смотреть), связана ли популярность с рейтингом, а также как менялись тренды в период с 1990 по 2025 год.

Original size 1024x1024

Обработка данных с Pandas

Сначала загрузка исходного CSV с Kaggle через pd. read_csv. Далее идет отбор нужных столбцов: название, жанры, рейтинг (score), популярность (popularity), members, тип, студия, колонка с сезоном/годом премьеры. Остальные отбрасываются. ​

Original size 1135x1048

Линейный график

Этот график показывает динамику развития двух популярных жанров: slice of life и фэнтези. Примерно до 2004 года slice of life в среднем имел меньший рейтинг, чем фэнтези. В 2005–2015 годах ситуация поменялась, и на этом отрезке рейтинг фэнтези проигрывает своему конкуренту. С 2015 года рейтинг обоих жанров то значительно растет, то значительно падает, и в 2023 году в лидеры выбивается slice of life. Так как я ценитель фэнтези, новые аниме я буду смотреть в годы, соответствующие вершинам розового графика.

Original size 1134x875

Сначала код отбирает из датафрейма аниме нужного жанра, группирует их по году (groupby («Year»)) и считает средний score для каждого года, собирая все такие таблицы в trend_df. Затем sns. lineplot строит линейный график, где по оси X — год, по оси Y — средний рейтинг, а параметр hue="Genre» рисует отдельную линию для каждого жанра. Заголовок и подписи осей оформляются кастомным шрифтом и палитрой, чтобы вписаться в общий аниме-стиль.

Original size 1395x831

Столбчатая диаграмма

Эта диаграмма показывает суммарное число жанров, вышедших в этот период, и долю конкретных жанров в общем количестве. Всегда наиболее популярным является «Other». Причина этому проста: эта группа отражает аниме, содержащее в себе несколько жанров. Вторым по популярности идет «comedy», а за ним «action». Наибольшее число фэнтези выходило в двадцатые годы, значит, я обращу свой взгляд на этот период при выборе.

Original size 1135x1555

Код считает количество тайтлов по комбинации «десятилетие × жанр» и на основе суммарных значений выделяет топ-жанры, остальное складывая в категорию «Other». Потом данные агрегируются и превращаются в таблицу pivot_table, где строки — десятилетия, столбцы — жанры, а значения — число тайтлов. Эта таблица рисуется как сложенная столбчатая диаграмма с разными цветами для каждого жанра из одного градиента. Заголовок поясняет, что показывается структура жанров во времени, а легенда расшифровывает цвета.

Original size 1390x840

Рейтинговая таблица

Этот график показывает средний рейтинг аниме-жанров в разные годы. Самым высокооцененным жанром стал романтика в 2020–2025 годах, а самым низкооцененным — комедия в 2010–2020 годах. Средний рейтинг аниме за весь период — около 7.

Original size 1136x743

Здесь данные снова группируются, но уже по паре Genre × decade, и для каждой пары считается средний рейтинг (mean ()). Результат записывается в genre_score_decade. После фильтрации только по популярным жанрам создаётся таблица heat, где строки — жанры, столбцы — десятилетия, а ячейки — средний score. Функция sns. heatmap отображает эту матрицу как тепловую карту с подписями внутри ячеек и цветовой шкалой, которая помогает быстро увидеть, в какие десятилетия жанр показывал более высокий или низкий средний рейтинг.

Original size 1387x961

Точечная диаграмма и линия регрессии.

Очень часто случается, что аниме крайне популярно, но при этом совершенно не интересно. Поэтому возникает логичный вопрос: можно ли судить о тайтле по количеству людей в фэндоме? Насколько это разумно? Для ответа на этот вопрос построим точечную диаграмму. Она показывает рейтинг аниме и число активных зрителей. Как видно из графика, корреляция есть, но коэффициент Пирсона около 0,4. Это говорит о том, что связь слабая, большинство точек отдалены от линии тренда. Значит, действительно хорошие тайтлы не всегда нравятся большинству смотрящих, но зачастую всё-таки попадают в поле зрения масс.

Original size 1135x777

Сначала код фильтрует данные: оставляет только аниме с количеством участников больше 1000 и рейтингом в адекватном диапазоне 4–10, чтобы убрать шум. Затем sns. regplot строит точечную диаграмму, где каждая точка — аниме, ось X — его рейтинг, ось Y — число участников (в логарифмической шкале), а поверх точек рисуется линия линейной регрессии, показывающая общую тенденцию. После построения графика считается и выводится коэффициент корреляции Пирсона между score и members, который численно оценивает силу связи «рейтинг — популярность».

Original size 1396x830

Ящик с усами

Эта диаграмма тоже показывает средний рейтинг по жанрам, но дает более точное его распределение. Рейтинг 25% аниме находится ниже, чем нижняя граница ящика. Рейтинг 25% аниме находится выше, чем верхняя граница ящика. Основной разброс рейтинга находится внутри ящика. Усы показывают диапазон значений. Кружочки сверху или снизу — выбивающиеся (слишком высоко или низко оцененные аниме). Один из наиболее хороших показателей у romance, несмотря на несколько рекордно низкорейтинговых аниме. Вторым можно назвать action, а последним по показателям — sci-fi.

Original size 1135x596

Код берёт только строки с жанрами из списка top_genres_box, чтобы сравнивать самые крупные направления. Для каждого жанра подготавливается цвет из той же градиентной палитры, а затем sns. boxplot строит «ящики с усами», где по оси X — жанр, по оси Y — рейтинг; внутри каждого боксплота видно медиану, квартильный размах и выбросы. Такой график показывает, в каких жанрах оценки в среднем выше, где разброс больше и у каких направлений чаще встречаются очень высокие рейтинги.

Original size 1393x836

Выводы

Личные: Теперь я знаю, в какие периоды какие жанры мне стоит искать, а также что имеет смысл ориентироваться не только на популярность, но и на рейтинг.

Аналитические: За 30 лет вкусы зрителей ушли от sci-fi в сторону фэнтези, романтики и повседневности, причём эти жанры стабильно получают высокие средние оценки. При этом жанры-лидеры по рейтингам часто оказываются гибридными (action + fantasy, isekai + slice of life), что видно по росту «смешанных» категорий и разнообразию жанровых комбинаций в новых релизах. Про рейтинг можно сказать, что он помогает аниме стать популярным, но не заменяет эффект моды, маркетинга и общей видимости тайтла.

Original size 1024x1024
We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...
Show more