
Описание проекта
Стриминговые сервисы кардинально изменили способы потребления музыки в XXI веке. Платформы вроде Spotify дают доступ к миллионам треков, позволяя анализировать предпочтения слушателей, популярность артистов и динамику музыкальных трендов.
Для проекта по анализу данных я выбрала датасет с информацией о треках и артистах Spotify (так как является основным приложением где слушаю музыку), размещённый в открытом доступе (на сайте Kaggle). Данные содержат метаинформацию о композициях: название трека, исполнитель, альбом, дата релиза, популярность трека и артиста, количество подписчиков, а также технические характеристики звучания. Сразу отмечу, что все оценки треков по популярности идут на основе внутренней оценки приложения. Но даже так они представляю собой интересную информацию для анализа.
Этапы работы с данными
1. Датасет был загружен в формате CSV и преобразован для удобства работы. 2. Были очищены и подготовлены данные: — числовые колонки (track_popularity, artist_popularity, artist_followers) приведены к числовому формату; — дата релиза альбома парсилась в корректный формат, из неё извлекался год; — пропущенные значения обработаны консервативно для сохранения целостности данных. 3. Для визуализации использовались библиотеки Matplotlib, Seaborn и NumPy.
Цветовое и визуальное решение
- чёрный (#000000) — фон графиков, - зелёный Spotify (#1DB954) — основной акцентный цвет, - белый (#FFFFFF) — текст, подписи, сетка, - и набор зелёных оттенков для многоцветных диаграм
Визуализация данных
Столбчатая диаграмма: топ артистов по количеству треков
Диаграмма показывает артистов с наибольшим числом треков. Как ни странно на первом месте оказалась Тейлор свифт (в датасете включены перезагрузки треков, так что это могло повлиять на результат)
Гистограмма распределения популярности треков
Дальше я проверила оценку треков (хотелось узнать как оценивает треки сам спотифай), в среднем оценки нормальные, но некоторые треки не оценены вообще. И только немногие получают оценку больше 90
Горизонтальная столбчатая диаграмма: топ жанров по встречаемости
На этой диаграмме представлены самые распространённые музыкальные жанры в датасете. Поп оказался на первом месте, что не удивительно, но не ожидала что так много Кантри музыки вообще есть на платформе
Горизонтальная столбчатая диаграмма: средняя популярность треков по жанрам
По визуализации видно, что даже нишевые жанры пользуются огромной популярностью. Но честно, я не ожидала такие результаты
Круговая диаграмма: распределение типов релизов
Диаграмма показывает соотношение различных форматов релизов (альбомы, синглы, сборники и др.). В общем — очень доминируют выпуски песен по альбомам
Линейная диаграмма: число треков по году релиза (последние годы)
График демонстрирует динамику добавления контента на платформу по годам. Рост в последние годы отражает как увеличение общего объёма музыки в каталоге Spotify, так и возросшую активность артистов
Заключение
В процессе работы с датасетом с атрибутом style: Spotify я провёла предобработку музыкальных данных, выделил ключевых артистов по объёму контента и визуализировал распределение популярности треков. Анализ позволяет увидеть, как устроен каталог платформы, кто из исполнителей наиболее активен в публикации треков и как оценивается их популярность по оценке самого спотифая.
Подволя итог, видно (особенно по последнему графику), что музыка продолжает развиваться стремительно — появляются новые жанры, артисты и группы, вкусы меняются, а музыка продолжает оставаться важной частью нашего мира.
использовалась для предложений по улучшению читаемости кода и графиков