Original size 896x1152

Анализ цен на авокадо в США (2015–2018)

PROTECT STATUS: not protected
The project is taking part in the competition

Я выбрала открытый датасет «Avocado Prices» с платформы Kaggle — он содержит еженедельные данные о ценах, объёмах продаж и типах авокадо (традиционные и органические) в 54 регионах США за период с 2015 по 2018 год.

Авокадо — символ современного здорового питания и «зелёного» тренда. Анализ его рынка позволяет увидеть географические и сезонные закономерности, а также проследить рост популярности органических продуктов.

big
Original size 1344x768

Изображение сгенерировано при помощи Nano Banana

Я построила 6 графиков:

4 стандартных (по заданию): линейный, гистограмма, столбчатый, круговая 1 дополнительный: «сезонные волны»

Такой набор позволяет показать данные не только как цифры, но и как явление культуры.

Очистка данных:

Удалила строку TotalUS (это итог по всем регионам, а не отдельный регион) Преобразовала колонку Date в формат даты с помощью pd.to_datetime () Выделила месяц отдельной колонкой для анализа сезонности.

big
Original size 1052x570

Линейный график

Original size 888x340

График 1: Средняя цена на авокадо

Original size 1386x528

Я использовала только простые цвета: green, lightgreen, darkgreen, чтобы не перегружать. На графиках добавила подписи прямо на столбики (например, $1.75), так удобнее смотреть.

Гистограмма

Original size 789x340

График 2: Как часто встречались разные цены?

Original size 1362x438

Столбчатый график

Каждый график строился отдельно: сначала я смотрела, что можно посчитать, потом как это визуализировать. Например, для «Топ-10 регионов» я сгруппировала данные по региону, посчитала среднюю цену и отсортировала.

Original size 690x440

График 3: Топ 10 регионов по цене

Original size 1324x736

Круговая диаграмма

Original size 1280x720

График 4: Какое авокадо чаще продается?

Original size 1066x436

График «Сезонные волны»

Original size 790x340
Original size 1502x700

Были применены следующие статистические методы:

Группировка (groupby), чтобы посчитать среднюю цену по регионам, месяцам, типам Фильтрация (df[df['type'] == 'organic']) для сравнения типов Агрегация (mean (), value_counts ()) для расчёта показателей Визуализация распределений: гистограммы и линейные графики показывают, как данные меняются.

Original size 1344x768

Изображение сгенерировано при помощи Nano Banana

We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...
Show more