Выбранные данные и источники
Для анализа я использовала датасет Screen Time and App Usage Dataset (iOS/Android) с платформы Kaggle. В нём собраны данные об использовании мобильных приложений: название приложения, его категория (продуктивные, развлекательные, социальные и утилитарные), дата использования и продолжительность экранного времени. Этот набор данных подходит для исследования, потому что в нём есть как количественные показатели использования, так и классификация приложений по типам, что позволяет сравнивать разные категории и анализировать цифровые привычки пользователей.
Датасет является симулированным и представляет собой анонимизированную модель использования мобильных приложений, что делает его удобным для учебного анализа и визуализации цифровых паттернов поведения.
Почему эти данные мне интересны
Мне было интересно поработать с данными про использование мобильных приложений, потому что смартфон — это основной цифровой инструмент в повседневной жизни. Мы постоянно переключаемся между рабочими, учебными и развлекательными приложениями, но редко задумываемся, как именно распределяется это время.
Как студентке направления «Дизайн и программирование», мне важно понимать поведение пользователей и их цифровые привычки. Анализ таких данных помогает лучше представлять, какие типы приложений используются чаще и как люди взаимодействуют с цифровыми продуктами.
Какие виды графиков я использовала и почему
Круговая диаграмма — чтобы показать распределение общего экранного времени между категориями приложений и увидеть, на какие типы приложений в целом уходит больше времени.
Столбчатая диаграмма — чтобы сравнить приложения между собой по суммарному экранному времени и выделить те, которые используются больше всего.
Линейный график — чтобы проследить, как меняется общее экранное время по дням и увидеть динамику использования смартфона во времени.
Точечная диаграмма — чтобы показать связь между частотой использования приложений и средним экранным временем, а также сравнить разные категории приложений между собой.
Этапы работы и обработка данных
a) Чтение и подготовка
На первом этапе я подключила библиотеки Pandas и Matplotlib для работы с данными и построения графиков.
Далее я загрузила датасет из файла screen_time_app_usage_dataset.csv с помощью функции pd.read_csv.
После чтения данных я привела названия столбцов к более удобному формату, удалив лишние пробелы и заменив пробелы на подчёркивания. Это упростило дальнейшую работу с данными и обращение к колонкам в коде.
Дальше я добавила выбранную палитру цветов.
Палитра цветов
Для визуализации я использовала контрастную цветовую палитру с яркими и насыщенными оттенками.
Такие цвета хорошо подходят для темы цифровых технологий и мобильных приложений. Они ассоциируются с интерфейсами приложений, экранами смартфонов и активным взаимодействием с цифровой средой.
Мне было важно, чтобы цвета помогали визуально различать категории приложений и делали графики более читаемыми и выразительными.
в) Агрегация
Для построения графиков я агрегировала данные в зависимости от задачи визуализации. Я группировала данные по категориям приложений, названиям приложений и датам, используя метод groupby.
г) Статистические методы
В ходе работы использовались базовые описательные статистические методы:
Суммирование (sum) — для расчёта общего экранного времени по категориям приложений, отдельным приложениям и по дням.
Подсчёт количества наблюдений (count) — для анализа частоты использования приложений и категорий.
Среднее значение (mean) — для определения средней продолжительности экранного времени.
Группировка данных (groupby) — для объединения данных по категориям приложений, названиям приложений и датам.
Описание графиков и интерпретация
Круговая диаграмма показывает, как общее экранное время распределяется между разными категориями приложений: продуктивными, развлекательными, социальными и утилитарными. Можно заметить, что доли категорий достаточно близки друг к другу, что говорит о том, что пользователи регулярно переключаются между разными типами приложений и используют смартфон для разных задач — работы, общения и отдыха.
Столбчатая диаграмма «Топ-10 приложений по суммарному экранному времени»
Столбчатая диаграмма отражает приложения, на которые в сумме тратится больше всего экранного времени. График позволяет выделить наиболее используемые приложения и сравнить их между собой. Видно, что отдельные сервисы опережают другие по суммарному времени использования, что указывает на их важную роль в повседневных цифровых привычках пользователей.
Линейный график «Динамика общего экранного времени по дням»
Линейный график показывает, как меняется суммарное экранное время по дням. С его помощью можно увидеть колебания активности пользователей во времени, а также периоды с более высокой или более низкой интенсивностью использования смартфона. Такой график помогает понять общую динамику и выявить изменения в поведении пользователей.
Точечная диаграмма «Частота использования и среднее экранное время приложений»
Точечная диаграмма показывает связь между частотой использования приложений и средней продолжительностью экранного времени. Каждая точка соответствует отдельному приложению, а цветовая кодировка отражает его категорию. График позволяет сравнить паттерны использования разных типов приложений и увидеть, что приложения могут отличаться как по частоте использования, так и по времени, которое на них тратится.
Итоговый вывод исследования
В ходе проекта были проанализированы данные об использовании мобильных приложений и экранном времени. Анализ показал, что пользователи используют приложения разных типов достаточно равномерно, при этом отдельные сервисы выделяются по суммарному времени использования.
Также было видно, что уровень активности меняется со временем, а разные категории приложений имеют разные сценарии использования: одни используются чаще, другие — более продолжительными сессиями. Проект показал, что базовые методы анализа данных и визуализация позволяют выявлять основные паттерны цифрового поведения пользователей.
Описание применения генеративной модели
В ходе выполнения проекта я использовала генеративную модель ChatGPT в качестве вспомогательного инструмента. Модель применялась для разъяснения технических ошибок в коде и уточнения логики построения графиков.
Также с помощью ИИ я редактировала и упрощала текстовые описания этапов работы и интерпретацию графиков, чтобы сделать их более структурированными и понятными.
С помощью ChatGPT была сгенерирована обложка проекта.
Все аналитические решения, выбор данных, построение визуализаций и итоговые выводы были выполнены мной самостоятельно.



