Исходный размер 896x1152

Анализ цен на авокадо в США (2015–2018)

PROTECT STATUS: not protected

Я выбрала открытый датасет «Avocado Prices» с платформы Kaggle — он содержит еженедельные данные о ценах, объёмах продаж и типах авокадо (традиционные и органические) в 54 регионах США за период с 2015 по 2018 год.

Авокадо — символ современного здорового питания и «зелёного» тренда. Анализ его рынка позволяет увидеть географические и сезонные закономерности, а также проследить рост популярности органических продуктов.

big
Исходный размер 1344x768

Изображение сгенерировано при помощи Nano Banana

Я построила 6 графиков:

4 стандартных (по заданию): линейный, гистограмма, столбчатый, круговая 1 дополнительный: «сезонные волны»

Такой набор позволяет показать данные не только как цифры, но и как явление культуры.

Очистка данных:

Удалила строку TotalUS (это итог по всем регионам, а не отдельный регион) Преобразовала колонку Date в формат даты с помощью pd.to_datetime () Выделила месяц отдельной колонкой для анализа сезонности.

big
Исходный размер 1052x570

Линейный график

Исходный размер 888x340

График 1: Средняя цена на авокадо

Исходный размер 1386x528

Я использовала только простые цвета: green, lightgreen, darkgreen, чтобы не перегружать. На графиках добавила подписи прямо на столбики (например, $1.75), так удобнее смотреть.

Гистограмма

Исходный размер 789x340

График 2: Как часто встречались разные цены?

Исходный размер 1362x438

Столбчатый график

Каждый график строился отдельно: сначала я смотрела, что можно посчитать, потом как это визуализировать. Например, для «Топ-10 регионов» я сгруппировала данные по региону, посчитала среднюю цену и отсортировала.

Исходный размер 690x440

График 3: Топ 10 регионов по цене

Исходный размер 1324x736

Круговая диаграмма

Исходный размер 1280x720

График 4: Какое авокадо чаще продается?

Исходный размер 1066x436

График «Сезонные волны»

Исходный размер 790x340
Исходный размер 1502x700

Были применены следующие статистические методы:

Группировка (groupby), чтобы посчитать среднюю цену по регионам, месяцам, типам Фильтрация (df[df['type'] == 'organic']) для сравнения типов Агрегация (mean (), value_counts ()) для расчёта показателей Визуализация распределений: гистограммы и линейные графики показывают, как данные меняются.

Исходный размер 1344x768

Изображение сгенерировано при помощи Nano Banana

Анализ цен на авокадо в США (2015–2018)
Проект создан 14.01.2026
Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную...
Показать больше