Original size 2480x3500

Анализ музыкальных данных Spotify

PROTECT STATUS: not protected
The project is taking part in the competition

Описание проекта

Стриминговые сервисы кардинально изменили способы потребления музыки в XXI веке. Платформы вроде Spotify дают доступ к миллионам треков, позволяя анализировать предпочтения слушателей, популярность артистов и динамику музыкальных трендов.

Для проекта по анализу данных я выбрала датасет с информацией о треках и артистах Spotify (так как является основным приложением где слушаю музыку), размещённый в открытом доступе (на сайте Kaggle). Данные содержат метаинформацию о композициях: название трека, исполнитель, альбом, дата релиза, популярность трека и артиста, количество подписчиков, а также технические характеристики звучания. Сразу отмечу, что все оценки треков по популярности идут на основе внутренней оценки приложения. Но даже так они представляю собой интересную информацию для анализа.

Этапы работы с данными

1. Датасет был загружен в формате CSV и преобразован для удобства работы. 2. Были очищены и подготовлены данные:  — числовые колонки (track_popularity, artist_popularity, artist_followers) приведены к числовому формату;  — дата релиза альбома парсилась в корректный формат, из неё извлекался год;  — пропущенные значения обработаны консервативно для сохранения целостности данных. 3. Для визуализации использовались библиотеки Matplotlib, Seaborn и NumPy.

Цветовое и визуальное решение

- чёрный (#000000) — фон графиков, - зелёный Spotify (#1DB954) — основной акцентный цвет, - белый (#FFFFFF) — текст, подписи, сетка, - и набор зелёных оттенков для многоцветных диаграм

Визуализация данных

Столбчатая диаграмма: топ артистов по количеству треков

0

Диаграмма показывает артистов с наибольшим числом треков. Как ни странно на первом месте оказалась Тейлор свифт (в датасете включены перезагрузки треков, так что это могло повлиять на результат)

Гистограмма распределения популярности треков

0

Дальше я проверила оценку треков (хотелось узнать как оценивает треки сам спотифай), в среднем оценки нормальные, но некоторые треки не оценены вообще. И только немногие получают оценку больше 90

Горизонтальная столбчатая диаграмма: топ жанров по встречаемости

0

На этой диаграмме представлены самые распространённые музыкальные жанры в датасете. Поп оказался на первом месте, что не удивительно, но не ожидала что так много Кантри музыки вообще есть на платформе

Горизонтальная столбчатая диаграмма: средняя популярность треков по жанрам

0

По визуализации видно, что даже нишевые жанры пользуются огромной популярностью. Но честно, я не ожидала такие результаты

Круговая диаграмма: распределение типов релизов

0

Диаграмма показывает соотношение различных форматов релизов (альбомы, синглы, сборники и др.). В общем — очень доминируют выпуски песен по альбомам

Линейная диаграмма: число треков по году релиза (последние годы)

0

График демонстрирует динамику добавления контента на платформу по годам. Рост в последние годы отражает как увеличение общего объёма музыки в каталоге Spotify, так и возросшую активность артистов

Заключение

В процессе работы с датасетом с атрибутом style: Spotify я провёла предобработку музыкальных данных, выделил ключевых артистов по объёму контента и визуализировал распределение популярности треков. Анализ позволяет увидеть, как устроен каталог платформы, кто из исполнителей наиболее активен в публикации треков и как оценивается их популярность по оценке самого спотифая.

Подволя итог, видно (особенно по последнему графику), что музыка продолжает развиваться стремительно — появляются новые жанры, артисты и группы, вкусы меняются, а музыка продолжает оставаться важной частью нашего мира.

DeepSeek

использовалась для предложений по улучшению читаемости кода и графиков

We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...
Show more