Введение
Для анализа были выбранны данные о здоровом сне и образе жизни. В таблице из 13 столбцов и 374 строк охвачена информация о продолжительности сна, уровне активности, качестве сна, уровне стресса и многом другом. С помощью этих данных можно отследить взаимосвязь одних факторов с другими, их потенциальное влияние на весь организм и общее самочувствие.
В качестве наиболее удобного вида для визуализации данной информации были выбраны гистограммы, так как они позволяют отследить зависимость одного фактора от другого, а также рассеивающие диаграммы, чтобы показать частотность.
Данные были взяты с ресурса Kaggle.
Описание применения генеративной модели
При создании диаграмм я обращалась к ChatGPT, чтобы выяснить, как совершать те или иные операции, какие функции при этом можно использовать. Все использованные промпты приведены далее.
Обложка проекта была сгенерирована с помощью Stable Diffusion XL по запросу: «A troubled man suffering from insomnia blue colour palette»
Этапы работы
Форматирование таблицы
Первым шагом я загрузила дополнительные библиотеки, которые позже могут помочь в создании диаграмм, и вывела таблицу с данными с помощью функции .read_csv
После первоначального вывода таблицы было обнаружено, что в столбце «BMI Cathegory» присутствуют два значения, одинаковых по смыслу (Normal weight и Normal). Однако, за счет того, что они записаны по-разному, Python отнес бы их к разным категориям, что могло бы помешать рассчетам.
Чтобы избежать этой проблемы, я объединила эти категории в одну, назвав ее „Normal». Для этого была использована функция .replace (значение Normal weight было заменено на Normal)
Запрос в ChatGPT: „какая функция заменит одно значение другим в Python»
Далее было замечено, что в столбце «Sleep Disorder» в местах пропусков (у тех опрашиваемых, у кого не было обнаружено каких-либо расстройств сна) стоит NaN, что обозначает пустую ячейку. Однако такая ячейка не будет считываться в отдельную категорию при выводе графика, поэтому я заменила значение NaN на No Sleep Disorder с помощью функции .fillna (), заменяющей все значения NaN в указаном столбце на новые значения.
Запрос в ChatGPT: „как заменить значение NaN в столбце „Sleep Disorder“ на значение „No Sleep Disorder“ код“
Создание диаграмм
Для диаграмм была выбрана спокойная пастельная цветовая гамма, так как именно с такими цветами у меня ассоциируется сон, которому посвящена основная часть датасета. Фон выбран черный, так как на нем лучше видно светлые тона.
Для начала я решила выяснить, сколько представителей каждой профессии страдают от разных расстройств сна.
Поэтапный процесс
- Установка стиля графика (whitegrid)
- Установка темного фона графика
- Создание столбчатой диаграммы, указали, данные из каких столбцов будут отображаться на каждой оси, установка палитры (pastel)
- Установка заголовка графика
- Поворот подписей на оси x на 90 градусов, чтобы они не накладывались друг на друга
- Установка заголовка оси x
- Установка заголовка оси y
- Добавление легенды графика в правом верхнем углу
- Отображение графика
Глядя на построенный график можно отметить, что:
— Среди инженеров-программистов, врачей, инженеров, бугалтеров наибольшее количество опрашиваемых не страдают расстройствами сна — Большинство медсестер страдает остановками дыхания во время сна (Sleep Apnea — апноэ) — Среди учителей и продавцов большинство имеют бессонницу — В целом наибольшее количество больных апноэ наблюдается среди медсестер. Возможно это связано с тем, что у них ненормированный график работы, что негативно сказывается на сне.
Далее рассмотрим как уровень физической активности влияет на уровень стресса.
Поэтапный процесс:
- Создание столбчатой диаграммы
- Установка черного фона
- Установка заголовка для оси х
- Установка заголовка для оси у
- Установка заголовка для диаграммы
- Отображение диаграммы
Итак, можно сделать следующий вывод:
— У людей с высокой активностью (65 — 85 минут ежедневно) уровень стресса в среднем меньше чем у людей, тратящих меньшее количество времени на физ.активность. — Примечательно, что у людей с активностью 90 мин/день высокий уровень стресса. Это может сигнализировать о том, что такой уровень активности является для них чрезмерным
Также интересно было бы выяснить, зависит ли качество сна от уровня физической активности.
Поэтапный процесс
- Создание фигуры для графика
- Установка черного фона
- Создание рассеивающей диаграммы, указываем, информацию из какого столбца помещаем на какую ось. Цвет точек зависит от качества сна
- Установка заголовка оси х
- Установка заголовка оси у
- Установка заголовка диаграммы
- Установка отображения сетки графика, для лучшей ориентации по графику
- Отображение графика
Из диаграммы можно сделать следующий вывод:
— качество сна прямо пропорционально уровню физической активности
Рассмотрим, насколько ИМТ зависит от количества шагов в день.
Поэтапный процесс:
- Создаем словарь, ключами в которой являются категории ИМТ, а значениями — разные пастельные цвета. Таким образом, каждая категория ИМТ будет иметь собственный цвет
- Создание фигуры (поля) для диаграммы
- Создание рассеивающей диаграммы, каждой оси присваивается столбец из датасета.
- Присвоение каждой метке на оси х значение одной из категорий ИМТ
- Установка заголовка для оси у
- Установка заголовка для оси х
- Установка заголовка диаграммы
- Отображение сетки в диаграмме для более удобной ориентации
- Установка черного фона
- Отображение диаграммы
На диаграмме прослеживается следующая закономерность:
— Люди с нормальным весом (категория Normal) проходят в среднем большее количество шагов в день чем люди из других категорий. Люди с сильным ожирением (категория Obese) имеют минимальную физическую активность
Выясним, взаимосвязаны ли ИМТ и расстройства сна.
Поэтапный процесс:
- Группировка данных из стобцов BMI Category и Sleep Disorder
- Создание столбчатой диаграммы
- Установка черного фона
- Установка заголовка для оси х
- Установка заголовка для оси у
- Установка заголовка для таблицы
- Создание легенды для таблицы
- Отображение диаграммы
Глядя на диаграмму, можно проследить следующие закономерности:
— большая часть людей с нормальным весом не имеет проблем со сном — люди с небольшой и повышенной степенью ожирения имеют в одинаковом количестве как проблемы с бессонницей, так и апноэ — избыточный вес может влиять на возникновение проблем со сном




