
Описание
Для многих, в том числе и для меня, прослушивание музыки является неотъемлемой частью жизни. Часто это приносит нам положительные эмоции или может помочь пережить тяжелые времена. Так, мне стало интересно есть ли какая-то связь музыки и психического здоровья человека
В своём анализе я использовала датасет Music & Mental Health Survey Results, представленный на платформе Kaggle. Датасет состоит из данных опроса людей использующих музыкальную терапию в качестве способа снятия стресса, улучшения настроения и общего психического состояния человека
Главная цель этого набора данных — понять, существуют ли корреляции между музыкальным вкусом человека и оценкой его психического здоровья
- Столбчатая диаграмма - Диаграмма размаха - Круговая диаграмма - Сгруппированная гистограмма - Линейная диаграмма - Точечная диаграмма
Стилистика
Основную палитру я составила из ненасыщенных цветов на основе одной из своих работ при помощи Adobe Color. Мне показалось важным использовать не просто набор оттенков одного тона, а разные цвета, так как это поможет сделать графики более понятными и читаемыми
В качестве основного шрифта я взяла Roboto Slab Regular, а для заголовков использовала его жирное начертание

Предобработка данных и подготовка их к исследованию
Для начала работы я импортировала все необходимые мне библиотеки и модули
Затем я загрузила шрифты в директорию проекта и задала им названия для удобства
Выгружаю и сохраняю данные в датафрейм и вывожу на экран первые пять строк таблицы, чтобы убедиться, что данные подгрузились корректно
После этого я считаю процент пропусков в каждом столбце. В итоге я выяснила, что самый большой процент пропусков в колонке BPM 14,5%. В еще нескольких колонках 1% и менее
После того как я посчитала процент пропусков, я удаляю пустые значения там, где они не влияют на результат, и заполняю остальные пропущенные значения наиболее распространенными в категории
Затем привожу данные к типу соответствующему содержанию данных столбцов
Визуализация данных
[1] Диаграмма размаха
График размаха полезен для быстрой оценки формы распределения, разброса и аномалий. На основании данных графика можно оценить разброс данных, медиану и выбросы
Наибольший размах наблюдается в категориях age и bpm — это говорит о высокой вариативности данных. Низкие же значения и компактное распределение характерны для психологических показателей (anxiety, depression, insomnia, ocd), что может свидетельствовать о том, что у респондентов (людей практикующих музыкальную терапию) относительно низким уровнем стресса
Выбросы в age и bpm требуют дополнительного анализа — они могут быть связаны с аномалиями в данных или представлять особый интерес для исследования (например, очень молодые/пожилые респонденты или экстремальные музыкальные предпочтения)
[2] Круговая диаграмма
График наглядно показывает популярность различных стриминговых сервисов. Популярнее всего Spotify, который занимает больше половины доли от общего числа опрошенных. Pandora же занимает всего 1 процент, что даже меньше количества людей, которые в принципе не пользуются сервисами
[3] Столбчатая диаграмма
Этот график дополняет предыдущий, показывая, среди каких возрастных групп популярны те или иные сервисы
На графике видно, что среди молодежи наиболее популярны Spotify и Apple Music. YouTube Music занимает промежуточное положение (около 27–28 по шкале). Люди зрелого возраста пользуются сервисом Pandora или же вообще не используют никаких стриминговых сервисов
[4] Точечная диаграмма
График наглядно демонстрирует, что музыкальные вкусы тесно связаны с возрастом и поколением. Молодёжь предпочитает динамичные и современные жанры (Поп, Хип-хоп, а также EDM). Зрелые слушатели предпочитают проверенные временем направления (Classical и Country). Промежуточные группы демонстрируют смешанные предпочтения
Интересно, что жанр Рок популярен среди наибольшего числа возрастных категорий, что означает, что этот жанр может нравится всем вне зависимости от возраста
[5] Сгруппированная гистограмма
На данном графике хорошо видно распределение жанров по частоте прослушивания слева направо, от самых популярных до наименее прослушиваемых
Аудитория демонстрирует разнообразие музыкальных предпочтений, но доминируют современные жанры (Pop, Hip-hop, EDM). Традиционные и нишевые жанры (Classical, Gospel, Latin) имеют меньшую популярность, но сохраняют свою аудиторию. Альтернативные и расслабленные жанры (Lo-fi, Folk, Jazz) занимают промежуточную нишу, часто выбираются «иногда».
Существует чёткая корреляция между популярностью жанра и частотой его прослушивания — чем популярнее жанр, тем чаще его слушают
[6] Линейная диаграмма
Линейная диаграмма отчетливо показывает пик положительного воздействия музыки на самочувствие. Так, оптимальное время прослушивания составляет от 1 до 3 часов в день (максимум пользы, минимум негативных эффектов)
Чрезмерное прослушивание (более 6–7 часов) не приносит пользы и может быть связано с нейтральным или негативным влиянием на самочувствие. Минимальное прослушивание (менее 1 часа) также не даёт выраженного эффекта
Таким образом график подтверждает гипотезу о дозировании влияния музыки — польза есть только в определённом диапазоне времени
[7] Точечная диаграмма
График показывает градацию жанров по темпу музыки от медленных к быстрым Спокойные жанры (Gospel, Lofi, Classical) — самые медленные, а энергичные и танцевальные жанры (EDM, Latin, Metal) — самые быстрые
- Video game music имеет средний BPM, что логично — музыка в играх должна быть динамичной, но не перегружать игрока
- K-pop выделяется среди поп-музыки более высоким BPM, что отражает энергичность и хореографичность этого направления
- Metal — один из самых быстрых жанров на графике, что соответствует его агрессивному и мощному звучанию
Общий вывод
Таким образом, анализ графиков позволяет сделать вывод о том, что музыкальные предпочтения, длительность прослушивания и темп музыки (BPM) тесно взаимосвязаны и влияют на эмоциональное состояние человека. Оптимальный подход — комбинировать умеренное время прослушивания (1–3 часа в день) с подбором жанров в зависимости от текущей задачи (отдых, работа, тренировка), ориентируясь на их темп. Это помогает максимально эффективно использовать музыку для улучшения самочувствия и продуктивности
Ссылки на источники и используемые иструменты
Kaggle — источник данных для анализа
ChatGPT — корректировка кодов и вопросы по тому, как правильно использовать те или иные функции, а также генерация обложки
Adobe Color — подбор цветовой палитры