сгенерированное изображение 1
Вводная часть
В качестве исходных данных для проекта я выбрала датасет Fashion Products, размещённый на платформе Kaggle. Это табличный CSV-файл, содержащий информацию о товарах одежды: категории, бренды, цены, рейтинги, цвета и размеры. Датасет включает 1000 записей и 9 колонок. Мне было интересно проанализировать эти данные, потому что они позволяют посмотреть на моду через простые и наглядные количественные показатели. В датасете представлены категории одежды, бренды, цены и пользовательские рейтинги, что даёт возможность сравнить, какие категории товаров встречаются чаще, как различаются средние рейтинги у разных брендов и как распределяются цены на одежду. Для анализа были выбраны столбчатые диаграммы, гистограмма и точечный график, так как они лучше всего подходят для сравнения категорий, отображения распределений и поиска возможных зависимостей между числовыми параметрами.
Этапы работы
Для стилизации графиков была выбрана яркая контрастная цветовая палитра с акцентами розового, фиолетового и бирюзового цветов. Эти цвета ассоциируются с визуальным языком модной индустрии, digital-платформами и fashion-медиа, где часто используются насыщенные и «поп-цвета» для привлечения внимания. Каждый тип графика имеет свой основной цвет, что помогает визуально различать типы данных и не смешивать смысловые уровни. Для построения графиков использовался стандартный шрифт matplotlib без замены на кастомный, чтобы сохранить читаемость и нейтральность текста и не отвлекать внимание от самих данных. Основной акцент в визуализации был сделан не на декоративность шрифта, а на цвет, композицию и ясность структуры графиков.
цветовая палитра графиков
Количество товаров по категориям
график 1
код 1
Средний рейтинг по брендам
график 2
код 2
Распределение цен на товары
график 3
код 3
Связь цены и рейтинга
график 4
код 4
сгенерированное изображение 2



