Исходный размер 1146x1608

Анализ данных. Влияние музыки на ментальное состояние

Выбор данных для анализа

Для своего проекта я решил проанализировать датасет, посвященный влиянию музыки на ментальное состояние человека. В таблице содержится множество данных, охватывающих такие аспекты, как возраст респондентов, их музыкальные предпочтения, любимый стриминговый сервис, показатели ментального состояния, время ежедневного прослушивания музыки и многое другое.

Данные я нашел на сайте Kaggle, который проводит соревнования для специалистов по Data Science.

Ссылка на датасет

Я выбрал этот датасет для анализа, потому что сам обладаю практически аддиктивной привычкой постоянно слушать разнообразную музыку. Музыка всегда была для меня главным инструментом, который помогает найти силы в трудные моменты. Она способна утешить, приободрить или вдохновить. Иными словами, она всегда выступает катализатором моих чувств, усиливая их и формируя определенные ассоциативные связи в голове.

Исходя из этого, мне захотелось проанализировать, как прослушивание музыки влияет на внутреннее состояние и самоощущение человека.

Выбор графиков для визуализации

В своей работе я использовал несколько типов графиков:

  1. Столбчатые диаграммы, которые позволяют наиболее легко определить максимальные значения в зависимости от контекста. Помимо этого они очень визуально удобны и просты с точки зрения восприятия и анализа.

  2. Круговая диаграмма-бублик позволяет легко определить процентное соотношение групп или значений. Она дает наглядное представление о доле каждой категории в общей структуре.

  3. Диаграмма рассеяния помогает выявить корреляции и зависимости между двумя переменными. Она полезна для визуализации распределения данных и обнаружения аномалий.

  4. Двойная гистограмма дает возможность сравнивать распределение двух наборов данных на одной шкале. Это облегчает анализ различий и сходств между двумя группами данных.

  5. Скрипичный график сочетает в себе элементы ящика с усами и плотности распределения данных. Он позволяет увидеть как распределение данных, так и их вариативность.

Описание применения генеративной модели

При создании графиков я обращался к Chat GPT, чтобы выяснить, как провести те или иные операции, какие функции при этом можно использовать, а также для исправления ошибок в коде. Все использованные промпты приведены далее.

Для создания обложки я использовал нейросеть Midjourney.

Промт для обложки: (lo fi girl studying, 16-year-old girl with long Reddish brown hair is reading a book, sitting at desk with laptop, a cup can a cat on the desk, one wind chime, sundown --v 6.0 --c 25 --ar 4:7)

Стилистическое оформление графиков

Перед началом анализа данных я решил не выбирать готовый дизайн графиков. Мне хотелось, чтобы дизайн сформировался в процессе работы. Основной целью было определить, какой жанр музыки оказывает наибольшее положительное влияние на ментальное состояние человека.

После определения жанра с наибольшим влиянием, я сгенерировал изображение, отражающее его настроение. Затем, с помощью сервиса Adobe Color, я выбрал цветовую гамму для своих графиков и заменил все цвета.

Забегая вперед, таким жанром стал Lo-Fi, который занял лидирующее место среди любимых жанров респондентов по среднему показателю улучшения ментального состояния.

Исходный размер 862x100

Цветовая палитра Adobe Color на основе сгенерированной обложки проекта

Этапы работы

Сперва я импортировал все необходимые библиотеки, подключил файл с данными и вывел таблицу, чтобы подробнее изучить её содержимое

Исходный размер 833x551
Исходный размер 862x446

Код столбчатого графика

Промт для Chat GPT: «how can I make my colors alternate on the graph. Every third must match one of the three colors in my palette»

Исходный размер 841x591

Столбчатая диаграмма. Популярность жанров по возрастам

Сначала я решил проанализировать связь между любимыми жанрами респондентов и их возрастом. Анализ показал, что рок является одним из самых популярных жанров среди людей в возрасте от 0 до 30 лет. В то время как госпел, благодаря своей специфике и узкой направленности, остается любимым среди более пожилой аудитории. А среди молодежи до 20 лет наибольшей популярностью пользуется латиноамериканская музыка.

Исходный размер 862x426

Код диаграммы рассеяния. Определение часов прослушанной музыки в зависимости от возраста

Исходный размер 841x525

Далее я решил проанализировать, сколько времени в среднем люди слушают музыку в течение дня. В своем графике я ограничил максимальное значение 12 часами, так как это максимальное число, которое указывали респонденты. Другие значения, такие как 24 часа в сутки, были скорее шуточными и нереалистичными.

Согласно диаграмме, видно, что молодые люди в возрасте от 16 до 24 лет в среднем слушают музыку по 3,5 часа в день. Однако с увеличением возраста наблюдается резкий спад в количестве времени, уделяемого прослушиванию музыки ежедневно.

Исходный размер 862x455

Код круговой-диаграммы бублика. Процентное соотношение категорий респондентов по их отношению к музыке (музыкант, играет на инструменте, просто потребляет музыку)

Промт для GPT: «How I can build a round pie diagram with a white hole inside.»

Исходный размер 862x482

Мне стало интересно какое отношение к музыке имеют респонденты. Я хотел определить насколько обычных потребителей больше чем её создателей или же просто людей, которые использую игру на инструменте в качестве хобби. 24,6% создателей музыки и 75,5% обычных пользователей.

Исходный размер 862x485

Код столбчатой двойной диаграммы. Соотношение показателя ментального состояния и признака отношения к группе: музыкант, слушатель

Промт для GPT: «How can I add numeric values ​​above each column so that the data is more understandable and the difference between the columns is clearer»

Исходный размер 862x541

На основе полученной информации я решил определить, отличаются ли показатели усредненного ментального состояния у людей, которые только слушают музыку, и у тех, кто ее создает. Для наглядности я попросил ChatGPT добавить числовые параметры над каждым столбцом.

Из данных видно, что ментальные показатели у людей, создающих музыку, немного лучше, чем у тех, кто просто потребляет её.

Исходный размер 862x369

Код для построения скрипичного графика. Влияние музыки на человека в зависимости от часов прослушивания в день

Исходный размер 862x529

Также я решил выяснить, как количество часов прослушивания музыки в день влияет на общее состояние человека. Люди, которые слушают музыку примерно 3-4 часа в день, отмечают улучшение состояния. При прослушивании 2-3 часов обычно никакого эффекта не наблюдается. Некоторые респонденты заметили, что при прослушивании музыки 1-2 часа, их состояние заметно ухудшается. При превышении отметки в 3-4 часа, значительно меньше людей начинает отмечать улучшение настроения.

Исходный размер 862x507

Код столбчатого горизонтального графика. Отношение показателя ментального здоровья к любимым жанрами

Исходный размер 862x629

В заключение я решил определить, поклонники какого жанра имеют лучшие усредненные ментальные показатели. К моему удивлению, классическая музыка не оказалась лидером в этом списке. Победителем стал жанр, который набирает уже как несколько лет большую популярность на YouTube: Lofi. Длительное прослушивание таких плейлистов, видимо, действительно оказывает положительный эффект на психику человека.

Анализ данных. Влияние музыки на ментальное состояние
Проект создан 25.09.2024
Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную...
Показать больше