Исходный размер 800x1280

Анализ данных о музыкальных треках на базе Spotify

PROTECT STATUS: not protected

Описание

Музыка — это неотъемлемая часть нашей культуры. Она сопровождает нас в разные моменты жизни, способствуя созданию воспоминаний и эмоций. Мы все любим музыку: она вдохновляет, развлекает и успокаивает. Музыка объединяет людей, позволяет выражать чувства и делиться опытом. В современном мире музыка стала доступна каждому благодаря платформам, таким как Spotify, где можно найти треки на любой вкус и настроение.

big
Исходный размер 1248x832

Анализ основан на данных из Spotify Tracks Dataset, который был взят с платформы Kaggle. Этот датасет содержит информацию о 114  000 музыкальных треках, доступных на Spotify, и включает в себя множество параметров, которые позволяют глубоко изучить особенности популярной музыки. Данные охватывают различные аспекты треков, такие как их популярность, жанры, аудио-характеристики и длительность.

Анализ данных о музыкальных треках интересен, потому что музыка является важной частью нашей культуры, объединяющей людей по всему миру. Исследуя музыкальные тренды и предпочтения, мы можем понять, как меняются вкусы слушателей и какие жанры становятся популярными. Это полезно для музыкантов и продюсеров, позволяя им адаптировать своё творчество к современным требованиям. Кроме того, анализ данных открывает возможности для изучения психологического восприятия музыки и её влияния на эмоции. В быстроразвивающейся музыкальной индустрии это помогает компаниям разрабатывать более эффективные стратегии продвижения и лучше понимать свою аудиторию. В целом, тема анализа музыкальных данных предлагает увлекательные и полезные инсайты о современных культурных и коммерческих трендах.

Каждая диаграмма была выбрана с учетом того, какой тип визуализации лучше всего подходит для ответа на конкретный вопрос или анализа определенного аспекта данных. В работе были использованы: 1.Столбчатая диаграмма — Этот график позволяет быстро идентифицировать самые популярные треки на платформе Spotify. 2.Горизонтальная столбчатая диаграмма — Этот график помогает понять, какие жанры наиболее представлены на платформе. 3.Точечный график — Этот график позволяет изучить, как длительность трека влияет на его популярность. 4.Круговая диаграмма — Этот график показывает, какие жанры наиболее популярны среди слушателей.

Цветовая гамма

Исходный размер 2488x274

Основной цвет Spotify  — зеленый, но синий часто используется в их интерфейсе и визуализациях как дополнительный цвет. Он также ассоциируется с креативностью и вдохновением, что хорошо подходит для музыкальной тематики.

Начало работы

Я начала с загрузки данных в Google Colab. Для этого я использовала модуль files из библиотеки google.colab, чтобы загрузить CSV-файл с данными о музыкальных треках. После загрузки файла я убедилась, что данные успешно загружены, и сохранила их в переменную df  с помощью библиотеки pandas.

Я провела первичный анализ данных, чтобы понять их структуру и содержание. Для этого я использовала методы info () и isnull ().sum (). Это помогло мне узнать, что данные содержат 114 000 строк и 21 столбец, а также обнаружить, что в некоторых столбцах есть пропущенные значения. Также чтобы избавиться от пропущенных значений, я удалила строки, где они присутствовали. После этого я убедилась, что данные готовы для дальнейшего анализа.

Визуализация данных

График 1

Этот график позволяет быстро и эффективно идентифицировать самые популярные треки на платформе Spotify. С его помощью можно наглядно сравнить количество прослушиваний или лайков различных треков, что помогает выявить лидеров по популярности. Это полезно для музыкантов и продюсеров, которые хотят понять, какие композиции вызывают наибольший интерес у слушателей.

Я решила найти топ-10 самых популярных треков. Для этого я отсортировала данные по столбцу popularity и выбрала первые 10 строк. Затем я визуализировала результат с помощью горизонтального barplot.

Исходный размер 1350x142
Исходный размер 989x590
Исходный размер 2010x1444

Вывод: Треки Blinding Lights, Shape of You и Dance Monkey лидируют по популярности. Это говорит о том, что слушатели предпочитают треки с запоминающимися мелодиями, высоким уровнем энергии и танцевальности. Эти композиции стали настоящими культурными феноменами, что подтверждает их глобальную популярность.

График 2

Данный график помогает проанализировать представительство различных жанров на платформе. С его помощью можно быстро увидеть, какие жанры доминируют в прослушиваниях, и сравнить их популярность. Это позволяет понять, какие музыкальные стили становятся актуальными, что может быть полезно как для артистов, так и для маркетологов при разработке новых музыкальных произведений или стратегий продвижения.

Я решила исследовать жанры треков. Сначала я посчитала количество треков для каждого жанра и выбрала топ-10. Затем я визуализировала это с помощью вертикального barplot.

Исходный размер 1434x112
Исходный размер 990x590
Исходный размер 2220x1406

Вывод: Жанры Pop, Rock и Hip-Hop являются наиболее популярными. Это отражает текущие тренды в музыкальной индустрии, где эти жанры доминируют благодаря своей универсальности и широкой аудитории. Увеличение оси X на 10% сделало график более читаемым, что особенно важно при работе с большим количеством данных.

График 3

Этот график предоставляет возможность изучить связь между длительностью трека и его популярностью. Он позволяет визуализировать, как время звучания композиций влияет на количество прослушиваний или рейтинги. Анализ таких данных может выявить оптимальную длину трека для достижения максимальной популярности, что является ценным инсайтом для исполнителей и продюсеров.

Я добавила новый столбец duration_min, чтобы перевести длительность треков из миллисекунд в минуты. Также я решила исследовать, есть ли связь между популярностью треков и их длительностью. Для этого я отфильтровала треки длительностью до 10 минут.

Исходный размер 1434x188
Исходный размер 843x545
Исходный размер 1794x130
Исходный размер 1794x260

Вывод: Популярные треки обычно имеют среднюю длительность — от 3 до 5 минут. Это связано с предпочтениями слушателей, которые ценят компактные и динамичные композиции. Более длинные треки (свыше 5 минут) реже становятся популярными, что может быть связано с ограниченным вниманием аудитории.

График 4

Этот график показывает распределение популярных жанров среди слушателей. С помощью круговой диаграммы можно быстро оценить, какие жанры занимают наибольшую долю в общем объеме слушаемой музыки, что помогает понять предпочтения аудитории и адаптировать контент под их вкусы. Это, в свою очередь, может помочь в создании более целевого музыкального контента и формировании стратегий по его продвижению.

Перед визуализацией я решила проверить, какие жанры попали в топ-10. Для этого я вывела результат. Это помогло мне убедиться, что данные корректны и готовы для визуализации.

Исходный размер 1794x130
Исходный размер 671x660
Исходный размер 2368x538
Исходный размер 2368x460

Заключение

Исходный размер 1248x832

Анализ позволил сделать данные выводы: 1). Топ-10 самых популярных треков — Треки Blinding Lights, Shape of You и Dance Monkey лидируют по популярности. Это говорит о том, что слушатели предпочитают треки с запоминающимися мелодиями, высоким уровнем энергии и танцевальности. Эти композиции стали настоящими культурными феноменами, что подтверждает их глобальную популярность. 2). Распределение треков по жанрам — Жанры Pop, Rock и Hip-Hop являются наиболее популярными. Это отражает текущие тренды в музыкальной индустрии, где эти жанры доминируют благодаря своей универсальности и широкой аудитории. Увеличение оси X на 10% сделало график более читаемым, что особенно важно при работе с большим количеством данных. 3). Зависимость популярности от длительности трека — Популярные треки обычно имеют среднюю длительность — от 3 до 5 минут. Это связано с предпочтениями слушателей, которые ценят компактные и динамичные композиции. Более длинные треки (свыше 5 минут) реже становятся популярными, что может быть связано с ограниченным вниманием аудитории.

4). Распределение популярности по жанрам — Жанры Pop и Dance имеют самые высокие показатели популярности. Это подтверждает, что данные жанры наиболее соответствуют предпочтениям широкой аудитории. Их успех может быть связан с высокой танцевальностью, энергичностью и доступностью для слушателей разных возрастов.

Применение генеративной модели

В работе я использовала нейросеть DeepSeek-R1 для корректировки моих кодов для создания инфографики. Ссылка на модель: https://www.deepseek.com/ Для генерации изображений я обращалась к Ideogram. Ссылка на модель: https://ideogram.ai/t/explore

Анализ данных о музыкальных треках на базе Spotify
Проект создан 03.04.2025
Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную...
Показать больше