
Выбор темы
С помощью сайта kaggle.com мне удалось обнаружить интересный датасет, содержащий информацию о студенческих привычках в учёбе, их образе жизни и успеваемости. Мне стало интересно рассмотреть влияние этих двух факторов на достижение успехов в учёбе. С помощью анализа этих данных я хочу понять, каким образом студент сможет добиться наибольших успехов.
Типы диаграмм: [1] диаграмма рассеяния [2] гистограммы [3] диаграмма размаха [4] корреляционная диаграмма
Импорт кода и стиль
Сначала импортируем датасет, скаченный с kaggle

Теперь задаём фирменный стиль для графиков.
В качестве фонового цвета я выбрала кремовое-жёлтый, как цвет страниц в старой тетради. Синий цвет для подписей ассоциируется с надписями в тетради, серый отсылает на графики, построенные простым карандашом. Красный цвет выбран в качестве акцентного, как будто учитель исправляет в тетради ошибки на верные ответы. Шрифт Just Breathe имитирует быстрый и неаккуратный почерк студента

Скачиваем и регистрируем шрифт. В дополнение к шрифту задаём фирменные цвета для графиков
Зависимость оценок от часов учёбы и часов сна
Составим графики для выявления зависимости успеваемости студентов от количества сна (код слева) и от количества посвящённому учёбе времени (код справа).




Используем диаграммы рассеяния
При просмотре первого графика становится понятно, что в целом, студенты, уделяющие больше времени учёбе, демонстрируют более высокую успеваемость, хотя при больших значениях эффект может снижаться.
Второй график показывает, что оптимальное количество сна связано с более высокими оценками. Недостаток сна негативно влияет на успеваемость, а чрезмерный сон не всегда приводит к дополнительному улучшению результатов.
Представим данные в едином графике для наглядности.
Обе величины влияют на успеваемость, однако вклад часов учёбы в среднем более выражен, чем влияние часов сна.
Посещаемость и стресс
Выясним влияние посещаемости на оценки
Высокая посещаемость занятий в большинстве случаев сопровождается более высокими оценками.
Узнаем влияние стресса на успеваемость.
Распределение оценок показывает, что при низком уровне стресса значения оценок выше. При росте стресса снижается средний уровень успеваемости.
Теперь сравним влияние посещаемости и стресса на оценки
Общий вывод: посещаемость оказывает более стабильное положительное влияние на оценки, тогда как рост уровня стресса связан со снижением успеваемости.
Корреляционная матрица всех факторов
Составим общий для всех факторов график и на его основании сделаем общие выводы исследования.
Корреляционная матрица демонстрирует, что наибольшую связь с оценками имеют часы учёбы и посещаемость, тогда как уровень стресса имеет отрицательную корреляцию. Часы сна оказывают умеренное влияние на успеваемость.
Вывод
Исходя из всех выше представленных графиков можно выявить наиболее значимые факторы, влияющие на успеваемость студентов. Студенты, посещающие учёбе больше времени получают лучшие оценки, в то время как стресс имеет негативное влияние на учёбу. Самым интересным фактором, на мой взгляд, стал сон. Несмотря на то, что наивысшие оценки всё же получают высыпающиеся студенты, сон оказывает не столь сильное влияние на посещаемость как я предполагала. Намного важнее становится посещаемость и часы, потраченные на учёбу.
Получается, можно продолжать не спать и сдавать проекты на отличные оценки :) Это не самый здоровый, но научный подход
Блокнот и датасет
В проекте использовался ChatGPT для проверки промтов