Введение
Мой проект основывается на исследовании по датасету о продажах шоколада «Chocolate Sales», доступной на сайте Kaggle, который проводился с применением питона для визуализации данных в рамках прошлогоднего проекта
Я выбрала именно эту тему, потому что шоколад — это универсальный продукт, который любят во всем мире, но при этом структура его продаж остается «за кадром». Мне было интересно заглянуть за кулисы шоколадного рынка и оценить, насколько хорошо продаются разные шоколадные продукты в разных странах. В датасете содержится вся необходимая для полноценного анализа информация — страна, продукт, продавец, дата, сумма продажи и количество коробок, которая позволяет понять рыночные тенденции и продумать улучшения для стратегии продаж
В качестве формата для инфографики я выбрала постер, который будет содержать основные инсайты из анализа данных в компактном, наглядном виде, чтобы быстро уловить ключевые закономерности бизнеса и была возможность понять каким образом туда можно встроиться. Формат постера позволяет это сделать максимально не навящего, одновременно привлекая достаточно внимание, так как может быть органично размещен в разных средах, и передавая главную суть информацию
Польза заключается в том, что она во-первых решает проблему с восприятием табличных данных, демонстрируя главные инсайты, доносит идеи до коллег, руководства или клиентов, делая обсуждение данных более предметным и эффективным, вызывает интерес и желание вникнуть в содержание. К тому же так как она содержит данные разного типа, она приносит практическую пользу как аналитикам или владельцам бизнеса, так и широкой аудитории, которая заинтересована в этой тематике
Описание процесса работы
Если говорить кратко, то основной пайплайн производства состоит из . этапов:
- Скачивание исходных данных (Kaggle)
- Обработка в Python и создание визуализаций (pandas, matplotlib)
- Разработка дизайн-концепции (цвета, шрифты, сетка)
- Сборка макета постера в Figma
- Финальная верстка и улучшение стиля написанного текста через ИИ
- Экспорт постера и создание мокапов в Photoshop
Первым этапом была обработка данных и создание визуализаций. Исходный датасет был предварительно проанализирован в рамках отдельного проекта по анализу данных. Для работы я использовала Python с библиотеками pandas и matplotlib.pyplot — это позволило не только обработать данные, но и сразу создавать стилизованные визуализации, которые легко адаптировать под будущий дизайн постера.
В процессе этого я выполнила следующие действия: очистка данных, агрегация данных по нужным категориям и построение и стилизация графиков с применением библиотеки matplotlib.pyplot. Результатом этого этапа стали три готовых визуализации, которые я использовала в последующем для наполнением постера контентом: столбчатая диаграмма (общая сумма продаж по странам), круговая диаграмма (общее количество проданных коробок) и гистограмма (распределение сумм продаж).
код для создания диаграмм и визуализации данных
Следующим и основным этапом были разработка визуальной концепции и сборка самого макета постера. В качестве основы для визуальной концепции я выбрала утонченный стиль (шрифт с засечками) и «шоколадные» цвета, чтобы создать теплую и «вкусную» атмосферу, но при этом сохранить чистоту и сдержанность. После чего начала проектировать модульную сетку, чтобы органично распределить информацию внутри, пересобирать графики на auto layouts, чтобы их можно было легко редактировать при размещении, и верстать финальную версию макета.
Использованные нейросети
Для улучшения стиля написанного мною текста:
Для генерации картинок
Промпт для генерации иллюстрации и обложки: A photo of a white kitchen table with mountains of various chocolates: white, milk, and dark. There are also nuts and cocoa powder scattered nearby. The beige kitchen furniture is at the back. The light is warm and comes from a window on the right
Результат работы
итоговый макет



