Original size 1750x2480

Визуализация данных

PROTECT STATUS: not protected

Вводная часть

Я решила проанализировать датасет, посвященный тревожности и депрессии, на который наткнулась на сайте kaggle.com. Мне было интересно проанализировать данный датасет, так как он заинтересовал меня своим содержанием. В наше время депрессия — довольно популярное расстройство. Его можно обнаружить практически у каждого человека. Поэтому я решила проанализировать первых 500 участников опроса и выяснить, какие факторы ведут к развитию депрессии, а какие наоборот, снижают риск её развития. Для своего исследования я выбрала 4 фактора: сон, физическая активность, стресс на работе и финансовый стресс. Для демонстрации я решила использовать столбчатые диаграммы, так как в моём случае они были наиболее удобны.

Этапы работы

Я решила каждый фактор обрабатывать по отдельности, и для начала проанализировала как время сна влияет на уровень депрессии. Для начала я создала датафрейм, выделила первых 500 человек и далее выделила из фрейма 2 столбца: время сна и уровень депрессии:

big
Original size 1604x329

Далее я создала несколько массивов и прошлась с помощью цикла for по строкам датасета, добавив условия для добавления в массивы с помощью if/elif/else. В сами массивы я добавила показатели уровня депрессии:

big
Original size 1132x776

После я создала еще 2 массива, один с помощью numpy и его функции array. В него я добавила средние значения уровня депрессии с каждой группы, которые я получила с помощью функции mean. Во второй массив я добавила время сна участников:

Original size 1601x74

Далее я прикрепила картинку, создала и вывела диаграмму и задний фон, задав цвет столбцов и прикрепив названия самой диаграммы и её осей:

Original size 1488x532

С последующими факторами я проделала все те же действия. В качестве заднего фона я решила использовать минималистичный черный фон, так как он фокусирует внимание на диаграмме и позволяет легче воспринимать информацию.

Итоговые графики

Original size 1223x910
Original size 1155x902
Original size 1181x894
Original size 1217x909

Вывод

Исходя из полученных данных, я сделала вывод, что большая физическая активность и здоровый сон имеют большое влияние на уровень депрессии у участников опроса, в то время как стресс на работе и финансовый стресс оказывают не столь сильный эффект на развитие депрессии.

Облако с датасетом и блокнотом с кодом доступно по ссылке: https://disk.yandex.ru/d/N2PRwdnszg8J-A

Визуализация данных
We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...
Show more