Исходный размер 1140x1600

Анализ динамики цен на продукты питания в России (2020–2024)

PROTECT STATUS: not protected

Вводная часть:

Какие данные вы выбрали и где вы их нашли?

Я выбрал данные о ценах на 5 основных продуктов питания (хлеб, молоко, яйца, мясо, овощи) за период с января 2020 по март 2024 года. Данные в формате CSV были собраны из открытых статистических источников

Почему вам было интересно проанализировать именно эти данные?

Тема инфляции и роста цен — одна из самых актуальных для каждого человека. Эти данные показывают реальную динамику стоимости жизни за последние годы, что имеет практическую ценность для понимания экономической ситуации

Какой вид графиков вы решили сделать и почему?

Я создал 5 видов графиков:

  1. Линейный график — для отображения динамики цен во времени
  2. Столбчатая диаграмма — для сравнения средних годовых цен
  3. Столбчатая диаграмма с процентами — для наглядного показа роста цен
  4. Тепловая карта — для визуализации корреляции между ценами
  5. Box plot — для анализа распределения и выбросов цен

Этапы работы

1. Загрузка данных

Загрузка CSV-файла с помощью библиотеки Pandas. Проверка доступности файла и создание резервного набора данных на случай его отсутствия

Исходный размер 0x0

Загрузка данных

2. Предобработка данных

Преобразование дат в правильный формат, создание столбца с годом для группировки, расчёт средних значений по годам и процентного роста цен

Исходный размер 713x221

Предобработка данных

3. Настройка стиля

Создание собственной цветовой палитры и установка единого стиля оформления для всех визуализаций

Исходный размер 578x95

Настройка стиля

4. График 1: Динамика цен

Построение линейного графика, показывающего изменение цен на все продукты за весь период

Исходный размер 569x335

График динамики цен

Исходный размер 4168x2370

График динамики цен

5. График 2: Средние цены по годам

Создание группированной столбчатой диаграммы для сравнения средних годовых цен

Исходный размер 613x370

График средних цен

Исходный размер 3568x2073

График средних цен

6. График 3: Процент роста цен

Визуализация процентного роста цен за 4 года в виде столбчатой диаграммы

Исходный размер 620x321

График роста цен

Исходный размер 2969x1774

График роста цен

7. График 4: Корреляция цен

Построение тепловой карты корреляций между ценами на разные продукты

Исходный размер 571x309

График корреляции

Исходный размер 2662x2373

График корреляции

8. График 5: Распределение цен

Создание box plot для анализа распределения, медиан и выбросов цен в 2024 году

Исходный размер 666x415

График распределения

Исходный размер 3568x2073

График распределения

9. Сохранение результатов

Сохранение графиков в формате PNG и статистических данных в CSV файл для дальнейшего использования

Исходный размер 572x187

Сохранение результатов

Ключевые выводы

  1. Цены на все продукты выросли более чем на 100%за период 2020–2024 гг.
  2. Наибольший рост наблюдался у молока (+115.9%) и овощей (+114.7%)
  3. Сильная корреляция между ценами на хлеб и молоко (0.97) указывает на взаимосвязанность рынков
  4. 2022 год стал переломным — именно тогда начался наиболее интенсивный рост цен
  5. Распределение цен в 2024 году показывает наличие сезонных колебаний

Статистические методы

В проекте использованы следующие статистические методы:

  1. Описательная статистика: среднее значение, стандартное отклонение, минимум, максимум, квартили
  2. Процентный анализ: расчёт роста в процентах
  3. Корреляционный анализ: матрица корреляций Пирсона
  4. Анализ распределения: box plot с медианой и интерквартильным размахом
  5. Временной анализ: изучение динамики изменения показателей

Ссылки на материалы

Все файлы проекта доступны в Google Drive: https://drive.google.com/drive/folders/1pyIF0pfNTkx3zIx3ZCcZKr7BDUHsL_dk?usp=drive_link

В папке находятся: — Блокнот с полным кодом (.ipynb файл) — Исходный датасет (food_prices.csv) — 5 итоговых графиков (PNG формата) — Файл с расчётными статистиками (summary_statistics.csv)

Описание применения генеративной модели

В проекте использовался ChatGPT (GPT-4) для помощи в следующих задачах:

  1. Оптимизация кода: помощь в написании эффективного кода для визуализаций
  2. Подбор цветовой палитры создание гармоничной цветовой схемы для графиков
  3. Решение технических проблем: помощь с обработкой ошибок и настройкой библиотек
  4. Структурирование кода: разделение на логические блоки с комментариями

Модель GPT-4 Ссылка: https://chat.openai.com Использование: Все аналитические выводы и интерпретации данных выполнены самостоятельно, нейросеть использовалась только как инструмент для ускорения разработки.

Анализ динамики цен на продукты питания в России (2020–2024)
Проект создан 16.01.2026
Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную...
Показать больше