
ВВЕДЕНИЕ
Представленный проект посвящен анализу наборов данных и их визуализации. Для продуктивной работы я выбрала тему «Анализ психического здоровья студентов во время онлайн-обучения — это реальные табличные данные в формате Excel с платформы kaggle, в которых содержится большое количество разнообразных переменных, с которыми удобно работать.
Мне интересно проанализировать именно эти данные, потому что для меня тема психологического здоровья в рамках онлайн-образования очень актуальна. В связи с технологическим прогрессом образование все больше переходит в онлайн формат, потому что такой вид обучения невероятно удобен. Я тоже столкнулась в необходимостью проходить многие курсы онлайн, и кроме плюсов от экономии времени на дорогу, я почувствовала минусы в виде сильной тревоги и стресса. Мне интересно понять является ли мое состояние личностным явлением или оно массово и затрагивает большие группы людей.
Моя цель: Проанализировать взаимосвязь и влияние онлайн-обучения на психическое здоровье студентов, а также выявить ключевые факторы риска.
ВИДЫ ГРАФИКОВ И ОБОСНОВАНИЕ ВЫБОРА
В проекте реализованы 4 типа визуализаций, каждый из которых выбран для решения конкретных задач:
Изучающие визуализации: 1. Точечная диаграмма (для обнаружения взаимосвязей между экранным временем и сном). 2. Столбчатая диаграмма (для сравнения переменных «стресс» и «успеваемость» между конкретными группами.
Объясняющие визуализации: 3. Круговая диаграмма (для наглядного представления пропорций и долей (распределение тревожности)). 4. Линейная диаграмма (для демонстрации трендов и изменении метрик во времени или по группам (активность и стресс).
ЭТАПЫ РАБОТЫ
Чтобы загрузить и переработать данные я воспользовалась блокнотом Google Colab и выбрала Python в качестве основного языка программирования.
Дополнительно для анализа и обработки данных я использовала Pandas, для визуализации — Matplotlib и Seaborn, а для математических — вычислений NumPy.
Также я пользовалась статистическими методами: 1. Общая статистика (средние значения и проценты). 2. Анализ взаимосвязей (проверяла в какой степени показатели связаны между собой). 3. Сравнение групп. 4. Прогнозирование изменений.
Для стилизации графиков прежде всего я сгенерировала единую цветовую палитру с помощью сайта coolors.co. Она стала точкой вдохновения, и уже с помощью готовых цветов я создала инфографики в едином стиле через настройку rcParams. Во всех графиках присутствует темный фон, белый текст и набор семантических цветов.


сайт: coolors.co


ИТОГОВЫЕ ГРАФИКИ
Первый график — это точечная диаграмма. Он показывает взаимосвязь между экранным временем и продолжительностью сна у 1000 студентов (каждая точка — один студент).
ГРАФИК 1: точечная диаграмма Тип: Изучающая визуализация Расчет статистики для графика: • Превышают норму экрана (>6 ч/день): 57,9% • Не высыпаются (<7 ч/ночь): 59,9% • В опасной зоне (>6 ч э
С помощью визуализации с помощью первого графика становится понятно, что больше экрана = меньше сна. Особенно у студентов с высоким показателем стресса.
код 1 графика
Второй график — это столбчатая диаграмма. С его помощью можно пронаблюдать, как уровень стресса влияет на академическую успеваемость студентов.
ГРАФИК 2: СТОЛБЧАТАЯ ДИАГРАММА Тип: Изучающая визуализация подготовка данных: • Уровни стресса: ['High', 'Low', 'Medium'] • Изменения успеваемости: ['Declined', 'Improved', 'Same']
Обращаясь к данным графика, видно, сто с ростом стресса (слева направо), красная часть столбца увеличивается. Это показывает, что чем выше стресс, тем ниже успеваемость студентов.
код для второго графика
Третий график является круговой диаграммой и отображает распределение тревожности перед экзаменами среди студентов.
ГРАФИК 3: круговая диаграмма Тип: Объясняющая визуализация Анализ данных по тревожности: • Найдены значения: ['Yes', 'No'] • Количество: [513 487] • Всего ответов: 1000 из 1000 студентов
Обращаясь к диаграмме видно, что большая часть диаграммы занимает ответ «Да», что значит, что большинство студентов испытывают тревогу перед экзаменами.
код для третьего графика
Четвертый и последний график — линейная диаграмма. Он отображает изменения физической активности и стресса у студентов разных возрастов и зависимость друг представленных метрик друг от друга.
ГРАФИК 4: линейная диаграмма Тип: Объясняющая визуализация Анализ данных по тревожности:
объяснение
код для графика 4
ВЫВОД