Original size 1140x1600

Анализ песен Blur в данных

PROTECT STATUS: not protected
The project is taking part in the competition

Почему Blur?

Blur — легендарная британская поп группа с начала 90-х. Группа известна тем, что за весь период существования она прошла несколько этапов: начиная с классического бритпопа и заканчивая более экспериментальным и альтернативным звучанием.

Лично я в восторге от Blur и их песен, как из самых старых и самых поздних альбомов. Участники прошли долгий путь от энергичной молодости к более спокойному и вдумчивому звучанию, что делает группу особенно показательной для анализа.

Именно поэтому я решила проанализировать основные хиты Blur и проследить, как менялись их музыкальные характеристики со временем.

Для проекта было выбрано два музыкальный датасета: ClassicHit и Music Info с платформы Kaggle. Датасеты включают такие параметры, как исполнитель, год выхода, жанр, популярность, а также разные характеристики треков из Spotify: танцевальность, энергия, темп, громкость, акустичность и другие. Из общего массива данных я выделила группу Blur, что позволило сосредоточиться на анализе творчества одного исполнителя.

Дополнительно помимо анализирования числовых характеристик треков была я также поработала с визуальными образами — обложками альбомов (обложки альбомов были взяты из Википедии.) Это позволило связать музыку и визуальный стиль группы и использовать цвета альбомов как основу для стилизации графиков.

big
Original size 620x154

Итоговая палитра цветов

Для анализа данных я выбрала несколько типов графиков:

Линейные графики — для отображения изменений средней популярности треков и эмоциональной окраски музыки (valence) по годам, что позволяет проследить динамику показателей во времени.

Диаграмма рассеяния (scatter plot) — для анализа соотношения энергичности и танцевальности отдельных треков, а также выявления разнообразия звучания внутри дискографии группы.

Тепловая карта — для представления взаимосвязей между аудиохарактеристиками песен, такими как energy, loudness, acousticness и другими.

Радарная диаграмма — для формирования обобщенного «звукового портрета» группы на основе средних значений ключевых музыкальных характеристик.

Цветовая палитра (на основе обложек альбомов) — как визуальный инструмент, формирующий единый стиль инфографики.

Этапы

Поиск датасета

Первым делом я полезла на платформу Kaggle в поиске нужного мне датасета.

0

1. подключение библиотеки Pandas 2. загрузка музыкального датасета 3. проверка структуры таблицы 4. выделение треков Blur

Первые типы графиков были без какого либо стиля и спрограммированы в стандартном стиле питона, поэтому следующим шагом я занялась стилизацией графиков и составлении цветовой палитры.

0

1. определение среднего уровня показателя energy по годам 2. сравнение музыкальных периодов по характеристикам

Палитра

Затем захотелось разобраться с палитрой для графиков и проекта в целом. Далее пошел долгий этап работы и не без помощи чата GPT удалось составить цветовую палитру для проекта.

Первым этапом я подключила библиотеки для работы с изображениями, массивами данных и кластеризацией и добавила в список нужные мне обложки группы Blur.

Original size 795x455

1. импорт библиотек 2. формирование списка обложек

Затем каждая обложка была загружена, приведена к RGB-формату и уменьшена для ускорения обработки. Пиксели изображений были преобразованы в числовой массив для последующего анализа.

Пиксели всех обложек были объединены в единый массив, содержащий цветовую информацию по всем изображениям.

Original size 644x300

1. подготовка контейнера данных 2. извлечение цветовых данных 3. сбор всех цветов

Для выявления наиболее часто встречающихся цветов была применена кластеризация методом KMeans. Количество кластеров соответствует числу доминирующих цветов палитры.

В результате кластеризации были получены центры кластеров, представляющие собой доминирующие цвета обложек в RGB-формате.

Original size 733x272

1. поиск доминирующих цветов 2. формирование цветовой палитры

Для удобства использования в визуализациях значения цветов были переведены из RGB в HEX-формат.

Original size 587x162

1. форматирование значений в RGB

Полученные доминирующие цвета были визуализированы в виде набора цветных маркеров для первичной проверки и оценки палитры.

На финальном этапе была построена компактная цветовая палитра, используемая в дальнейшем для стилизации всех графиков проекта.

0

1. предварительная визуализация палитры 2. финальное оформление палитры 3. получившийся результат

Формирование общего стиля на основе палитры

Я задала стиль графиков кодом, чтобы визуализация была частью исследования, а не постобработкой в редакторе. Это позволяет воспроизводить стиль автоматически и сохранять визуальную консистентность при работе с данными.

0

1. настраивание основного стиля. 2. определение цветовой палитры

Новый датасет

Затем мне показалось, что первый датасет содержит мало данных для изучения, поэтому я нашла еще один, где было побольше треков и данных, на основе которых можно было разнообразить графики. Однако в новом датасете отсутствовал параметр Popularity, поэтому некоторые графики созданы на основе только первого датасета.

0

1. подключение библиотеки Pandas 2. загрузка музыкального датасета 3. проверка структуры таблицы 4. выделение треков Blur

Обложка проекта

Последним этапом я сгенерировала обложку в Sora, совместив стиль обложки The Best of с понравившейся мне фотографией членов группы, попросив также нейросеть использовать мою основную палитру в итоговой иллюстрации.

Промпт: Vertical vector cover illustration for an academic data visualization project. Four stylized human figures (exactly four), minimalist linear style with clean outlines, flat shapes, dot eyes, subtle shadows. Group portrait: figures standing close together, holding simple white flowers. Dark minimal background, calm and slightly melancholic mood. Strict color palette only: 1868b7, 81665b, e0993c, 0f1016, c7c2bf. High resolution

0

Итоговые графики

Совокупность графиков позволяет проанализировать музыку Blur на уровне отдельных треков, общих характеристик, взаимосвязей параметров и изменений во времени.

1. Линейный график — Popularity vs. Year

Original size 887x386

Линейный график Popularity vs. Year показывает изменение средней популярности треков Blur по годам. Показатель популярности усреднен для всех песен, выпущенных в соответствующий период. Этот график позволяет увидеть динамику интереса аудитории и периоды роста или спада популярности.

Можно заметить, что в начале 1990-х популярность группы находится на сравнительно невысоком уровне, но уже к 1994 году можно наблюдать заметный рост. После небольшого снижения в середине периода популярность снова увеличивается и достигает максимального значения к концу 1990-х годов.

Таким образом, график демонстрирует общий тренд роста интереса к творчеству Blur с течением времени.

Original size 1169x357

код для линейного графика Popularity vs. Year

2. Столбчатая диаграмма — Популярность треков

Original size 987x486

Столбчатая диаграмма показывает сравнение популярности отдельных песен Blur. Она помогает выявить самые известные треки и понять, какие композиции формируют общий успех группы.

Что удивительно для меня здесь, так то, что песня Song 2 уступает по популярности песне Girls& Boys, хотя мне всегда казалось, что Song 2 чуть ли не самая известная песня Blur и настолько известная, что многие знают именно песню, но не знают ее авторов.

Original size 1096x422

код для столбчатой диаграммы, отображающей популярность треков

3. Точечный график — Energy vs Danceability

Original size 686x586

Точечный график здесь показывает соотношение энергичности и танцевальности отдельных треков. Он позволяет оценить, связаны ли ритмичность и динамика музыки между собой, и увидеть разнообразие звучания.

Большинство треков сосредоточено в области средних и высоких значений energy, при этом значения danceability варьируются достаточно широко. Это может говорить о том, что высокая энергетика не всегда напрямую связана с танцевальностью.

Можно сказать, что музыка Blur отличается разнообразием: в дискографии присутствуют как энергичные, но не танцевальные композиции, так и более ритмичные треки со средней энергетикой.

Original size 983x364

код точечного графика, показывающий соотношение параметров energy и danceability

4. Heatmap корреляций аудиохарактеристик

Original size 740x587

Эту тепловую карту мне подсказал сделать чат GPT, когда я его спросила какие еще интересные графики можно сделать по второму датасету, который я подобрала дополнительно к первому.

Карта показывает корреляции между аудиохарактеристиками: energy, loudness, valence, tempo и другими. Полученные данные позволяют выявить скрытые взаимосвязи параметров и глубже понять структуру звучания музыки.

В первую очередь внимание привлекает корреляция между характеристиками energy и loudness, хотя в этом ничего удивительного: обычно самые энергичные треки также и самые громкие.

0

код heatmap с разбором аудиохарактеристик

5. Линейный график — Valence по годам

Original size 886x387

Этот линейный график показывает изменение эмоциональной окраски песен Blur в течение долгого периода (с начала 1990 до 2015 года). С помощью него можно проследить как меняется тон настроения музыки на разных этапах творчества группы.

По графику можно заметить, что настроение песен группы нестабильно. В их творчестве есть периоды более позитивного звучания, которые сменяются более мрачными и сдержанными этапами. Здесь ярко прослеживаются как резкие спады и подъемы

Таким образом, анализ valence по годам показывает эволюцию эмоционального настроения музыки Blur и подчеркивает экспериментальный характер творчества группы.

Original size 1275x420

код линейного графика, позволяющие рассмотреть изменения эмоциональной окраски в музыке Blur с годами.

6. Радарная диаграмма — «звуковой портрет Blur»

Original size 586x550

Завершить свое исследование я хочу радарной диаграммой, которая отображает средние значения ключевых аудиохарактеристик группы. Эта диаграмма позволяет сформировать взгляд на обобщенный звуковой профиль Blur в одном визуальном образе.

Из графика видно, что наибольшие значения приходятся на energy и danceability, что указывает на динамичное и ритмичное звучание. В то же время низкие значения acousticness и instrumentalness свидетельствуют о преобладании электрического, вокально ориентированного формата песен.

Таким образом, radar chart позволяет в наглядной форме охарактеризовать музыкальный стиль Blur и выделить его ключевые особенности.

Original size 1075x817

код для радарной диаграммы, показывающий ключевые особенности аудиохарактеристик группы Blur.

Описание применения генеративной модели

При создании проекта я пользовалась помощью Chat GPT, который помогал мне исправлять основные ошибки в коде и просила подсказки по составлению более интересных по смыслу графиков. Также я просила его помочь мне с кодом, который мог вытащить из обложек основные цвета и собрать их в единую цветовую палитру.

Sora я использовала для генерация обложки

Выводы

Во-первых, анализ показал, что популярность песен Blur в целом увеличивалась с течением времени. Также можно сказать, что музыка группы отличается разнообразием по уровню энергии, танцевальности и эмоциональности, что говорит о стремлении коллектива экспериментировать со звучанием.

Во-вторых, по графикам видно, что более энергичные треки обычно звучат громче, а акустические композиции заметно отличаются от насыщенных по звучанию.

Ну и напоследок, самым интересным было посмотреть на изменения показателя valence по годам, которые отразили то, как менялось настроение музыки Blur на разных этапах творчества.

Ссылка на блокнот

Ссылка на датасеты

We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...
Show more