
ВСТУПЛЕНИЕ
В современном обществе кофе является одним из самых популярных напитков. Кофеин, содержащийся в кофе, широко используется для повышения концентрации, работоспособности и снижения утомляемости. Однако влияние кофеина на здоровье человека, в частности на качество и продолжительность сна, уровень стресса и физиологические показатели, остаётся предметом дискуссий.
Для анализа я выбрала датасет Global Coffee Health Dataset, представленный на платформе Kaggle. Датасет содержит 10 000 строк, каждая из которых соответствует одному человеку.
Датасет посвящён потреблению кофеина и различными показателями здоровья человека. Он моделирует данные о повседневных привычках и физиологическом состоянии людей и позволяет проанализировать, как уровень потребления кофе и кофеина может быть связан с качеством сна, уровнем стресса и общими показателями здоровья.
ЦВЕТОВАЯ ПАЛИТРА
Для палитры я выбрала сдержанные коричнево‑бежевые оттенки, характерные для темы «Кофе».

ЭТАПЫ РАБОТЫ
Импорт библиотек и стиль
В начале работы я импортирую необходимые библиотеки для анализа данных и визуализации. Также задаю единый визуальный стиль, чтобы все графики выглядели консистентно и как цельная инфографика.

Загрузка датасета
На этом этапе я загружаю CSV-файл с данными в рабочее окружение Google Colab. Первые строки датасета используются для ознакомления со структурой и содержимым данных.
ИССЛЕДОВАНИЕ РАСПРЕДЕЛЕНИЯ ДАННЫХ
С помощью гистограммы я изучаю, как распределено потребление кофе среди участников исследования. Это помогает выявить наиболее распространённые паттерны поведения.
АНАЛИЗ ВЗАИМОСВЯЗИ ПОКАЗАТЕЛЕЙ
Использую точечный график и линию тренда для изучения связи между потреблением кофеина и продолжительностью сна.
СРАВНИТЕЛЬНЫЙ АНАЛИЗ КАТЕГОРИЙ
С помощью столбчатой диаграммы анализирую уровень стресса в зависимости от уровня потребления кофе. Для этого применяю группировку и агрегацию данных.
АНАЛИЗ РАСПРЕДЕЛЕНИЯ И ВАРИАЦИИ
Boxplot используется для сравнения продолжительности сна при разном качестве сна. График наглядно показывает медиану, квартили и выбросы.
АНАЛИЗ ДОЛЕЙ И СТРУКТУРЫ ДАННЫХ
Круговая диаграмма демонстрирует соотношение курящих и некурящих участников исследования. Этот формат удобен для визуального сравнения долей.
ВЫВОДЫ
Проведённый анализ показал, что потребление кофе является важным, но не единственным фактором, влияющим на состояние здоровья и образ жизни человека. Умеренное употребление кофе является наиболее распространённым и не сопровождается выраженными негативными эффектами. При увеличении потребления кофеина прослеживается тенденция к сокращению продолжительности сна, что может отражаться на общем самочувствии. Также более высокий уровень потребления кофе чаще связан с повышенным уровнем стресса. Качество сна оказалось тесно связано с его длительностью, что подчёркивает важность режима отдыха. Анализ сопутствующих факторов, таких как курение и физическая активность, показал необходимость комплексного подхода при интерпретации данных. В целом результаты подтверждают, что влияние кофе на здоровье следует рассматривать в контексте образа жизни, а не изолированно.
ИСТОЧНИКИ И ДАННЫЕ
я задействовала chatgpt, чтобы править код, генерировать обложку.
Ссылка на код