Выбор данных для анализа
Для своего проекта я решил проанализировать датасет, посвященный влиянию музыки на ментальное состояние человека. В таблице содержится множество данных, охватывающих такие аспекты, как возраст респондентов, их музыкальные предпочтения, любимый стриминговый сервис, показатели ментального состояния, время ежедневного прослушивания музыки и многое другое.
Данные я нашел на сайте Kaggle, который проводит соревнования для специалистов по Data Science.
Я выбрал этот датасет для анализа, потому что сам обладаю практически аддиктивной привычкой постоянно слушать разнообразную музыку. Музыка всегда была для меня главным инструментом, который помогает найти силы в трудные моменты. Она способна утешить, приободрить или вдохновить. Иными словами, она всегда выступает катализатором моих чувств, усиливая их и формируя определенные ассоциативные связи в голове.
Исходя из этого, мне захотелось проанализировать, как прослушивание музыки влияет на внутреннее состояние и самоощущение человека.
Выбор графиков для визуализации
В своей работе я использовал несколько типов графиков:
Столбчатые диаграммы, которые позволяют наиболее легко определить максимальные значения в зависимости от контекста. Помимо этого они очень визуально удобны и просты с точки зрения восприятия и анализа.
Круговая диаграмма-бублик позволяет легко определить процентное соотношение групп или значений. Она дает наглядное представление о доле каждой категории в общей структуре.
Диаграмма рассеяния помогает выявить корреляции и зависимости между двумя переменными. Она полезна для визуализации распределения данных и обнаружения аномалий.
Двойная гистограмма дает возможность сравнивать распределение двух наборов данных на одной шкале. Это облегчает анализ различий и сходств между двумя группами данных.
Скрипичный график сочетает в себе элементы ящика с усами и плотности распределения данных. Он позволяет увидеть как распределение данных, так и их вариативность.
Описание применения генеративной модели
При создании графиков я обращался к Chat GPT, чтобы выяснить, как провести те или иные операции, какие функции при этом можно использовать, а также для исправления ошибок в коде. Все использованные промпты приведены далее.
Для создания обложки я использовал нейросеть Midjourney.
Промт для обложки: (lo fi girl studying, 16-year-old girl with long Reddish brown hair is reading a book, sitting at desk with laptop, a cup can a cat on the desk, one wind chime, sundown --v 6.0 --c 25 --ar 4:7)
Стилистическое оформление графиков
Перед началом анализа данных я решил не выбирать готовый дизайн графиков. Мне хотелось, чтобы дизайн сформировался в процессе работы. Основной целью было определить, какой жанр музыки оказывает наибольшее положительное влияние на ментальное состояние человека.
После определения жанра с наибольшим влиянием, я сгенерировал изображение, отражающее его настроение. Затем, с помощью сервиса Adobe Color, я выбрал цветовую гамму для своих графиков и заменил все цвета.
Забегая вперед, таким жанром стал Lo-Fi, который занял лидирующее место среди любимых жанров респондентов по среднему показателю улучшения ментального состояния.
Цветовая палитра Adobe Color на основе сгенерированной обложки проекта
Этапы работы
Сперва я импортировал все необходимые библиотеки, подключил файл с данными и вывел таблицу, чтобы подробнее изучить её содержимое
Код столбчатого графика
Промт для Chat GPT: «how can I make my colors alternate on the graph. Every third must match one of the three colors in my palette»
Столбчатая диаграмма. Популярность жанров по возрастам
Сначала я решил проанализировать связь между любимыми жанрами респондентов и их возрастом. Анализ показал, что рок является одним из самых популярных жанров среди людей в возрасте от 0 до 30 лет. В то время как госпел, благодаря своей специфике и узкой направленности, остается любимым среди более пожилой аудитории. А среди молодежи до 20 лет наибольшей популярностью пользуется латиноамериканская музыка.
Код диаграммы рассеяния. Определение часов прослушанной музыки в зависимости от возраста
Далее я решил проанализировать, сколько времени в среднем люди слушают музыку в течение дня. В своем графике я ограничил максимальное значение 12 часами, так как это максимальное число, которое указывали респонденты. Другие значения, такие как 24 часа в сутки, были скорее шуточными и нереалистичными.
Согласно диаграмме, видно, что молодые люди в возрасте от 16 до 24 лет в среднем слушают музыку по 3,5 часа в день. Однако с увеличением возраста наблюдается резкий спад в количестве времени, уделяемого прослушиванию музыки ежедневно.
Код круговой-диаграммы бублика. Процентное соотношение категорий респондентов по их отношению к музыке (музыкант, играет на инструменте, просто потребляет музыку)
Промт для GPT: «How I can build a round pie diagram with a white hole inside.»
Мне стало интересно какое отношение к музыке имеют респонденты. Я хотел определить насколько обычных потребителей больше чем её создателей или же просто людей, которые использую игру на инструменте в качестве хобби. 24,6% создателей музыки и 75,5% обычных пользователей.
Код столбчатой двойной диаграммы. Соотношение показателя ментального состояния и признака отношения к группе: музыкант, слушатель
Промт для GPT: «How can I add numeric values above each column so that the data is more understandable and the difference between the columns is clearer»
На основе полученной информации я решил определить, отличаются ли показатели усредненного ментального состояния у людей, которые только слушают музыку, и у тех, кто ее создает. Для наглядности я попросил ChatGPT добавить числовые параметры над каждым столбцом.
Из данных видно, что ментальные показатели у людей, создающих музыку, немного лучше, чем у тех, кто просто потребляет её.
Код для построения скрипичного графика. Влияние музыки на человека в зависимости от часов прослушивания в день
Также я решил выяснить, как количество часов прослушивания музыки в день влияет на общее состояние человека. Люди, которые слушают музыку примерно 3-4 часа в день, отмечают улучшение состояния. При прослушивании 2-3 часов обычно никакого эффекта не наблюдается. Некоторые респонденты заметили, что при прослушивании музыки 1-2 часа, их состояние заметно ухудшается. При превышении отметки в 3-4 часа, значительно меньше людей начинает отмечать улучшение настроения.
Код столбчатого горизонтального графика. Отношение показателя ментального здоровья к любимым жанрами
В заключение я решил определить, поклонники какого жанра имеют лучшие усредненные ментальные показатели. К моему удивлению, классическая музыка не оказалась лидером в этом списке. Победителем стал жанр, который набирает уже как несколько лет большую популярность на YouTube: Lofi. Длительное прослушивание таких плейлистов, видимо, действительно оказывает положительный эффект на психику человека.




