Original size 2480x3500

Измерения качества воздуха в городах Индии

PROTECT STATUS: not protected
The project is taking part in the competition

Для анализа я выбрала тему: «Как меняется качество воздуха в крупных городах и от чего оно зависит».

big
Original size 1024x1024

Описание проекта:

Для проекта был выбран датасет с измерениями качества воздуха в городах Индии, опубликованный на платформе Kaggle. Данные собирались на основе показаний экологических станций и содержат ежедневные измерения загрязняющих веществ.

Качество воздуха напрямую влияет на здоровье людей, уровень смертности и качество жизни. Индия — одна из стран с наиболее острыми проблемами загрязнения воздуха, поэтому данные: имеют высокую социальную значимость, отражают реальные экологические процессы, позволяют анализировать различия между городами и сезонами. Стоит отметить, что с недавних пор Индия стала моим личным интересом — поэтому я не могла упустить возможность изучить ее с еще одной стороны.

big
Original size 1024x1024

Я использовала один датасет, который хорошо отражает информацию, нужную мне для исследования.

Это набор данных , в котором каждая строка датасета соответствует одному дню наблюдений в конкретном городе. Датасет включает в себя 4 группы признаков: географические и временные данные, загрязняющие вещества, летучие органические соединения (VOC), интегральные показатели. Датасет представляет собой комплексный источник информации о состоянии атмосферного воздуха и позволяет провести глубокий, наглядный значимый анализ.

Набор данных был найден на интернет-ресурсе Kaggle.

Типы графиков: - линейные графики — анализ изменений во времени - столбчатые диаграммы — сравнение городов - гистограммы — распределение загрязнения - boxplot — выявление выбросов - тепловая карта — корреляция загрязнителей

Этапы работы

1 этап работы: загрузка и первичный анализ, очистка данных: экологические данные часто содержат пропуски, а медиана снижает влияние аномальных значений

2 этап: стилизация визуализации: идея визуального стиля - тёмные насыщенные цвета - ассоциация с дымом и смогом - минимализм без визуального шума источники вдохновения: - экологические отчёты WHO - инфографика The Guardian - Datawrapper environmental reports

График 1 — линейный график, изменение AQI во времени

график/пример кода

Данный линейный график отображает изменение индекса качества воздуха (AQI) во времени для выбранного города (например, Дели). По оси X отложена дата наблюдения, по оси Y — значение AQI. Этот график используется для анализа временной динамики загрязнения воздуха и позволяет: - выявить долгосрочные тренды (улучшается или ухудшается ситуация со временем); - обнаружить сезонность (повторяющиеся пики загрязнения); - увидеть экстремальные значения AQI, соответствующие периодам сильного смога.

График 2 — столбчатая диаграмма, средний AQI по городам

график/пример кода.

Столбчатая диаграмма отражает среднее значение AQI для каждого города за весь период наблюдений. Каждый столбец соответствует отдельному городу. Этот график используется для сравнительного анализа между городами и позволяет: - определить, в каких городах воздух в среднем наиболее загрязнён; - выявить географические различия в качестве воздуха; - сформировать рейтинг городов по уровню загрязнения. Столбчатая диаграмма наглядно подходит для сравнения агрегированных показателей между категориями (городами) и легко интерпретируется.

График 3 — Гистограмма, распределение PM2.5

график/пример кода

Гистограмма отображает распределение значений концентрации PM2.5 — одного из наиболее опасных загрязняющих веществ. По оси X — концентрация PM2.5, по оси Y — количество наблюдений. Этот график позволяет: - понять, какие значения PM2.5 встречаются чаще всего; - оценить, насколько часто фиксируются опасные уровни загрязнения; - определить, является ли распределение симметричным или имеет длинный «хвост» экстремальных значений. Гистограмма помогает перейти от отдельных измерений к пониманию общей картины загрязнения воздуха и показывает, является ли высокий уровень PM2.5 редким или типичным явлением.

График 4 — Boxplot, AQI по категориям качества

график/пример кода

Boxplot визуализирует распределение значений AQI внутри каждой категории качества воздуха (Good, Moderate, Poor, Very Poor, Severe). Этот график позволяет: - сравнить диапазоны значений AQI между категориями; - выявить перекрытия и выбросы; - оценить, насколько корректно категории отражают реальные числовые значения. Этот график особенно полезный для анализа экологических данных с выбросами.

График 5 — Тепловая карта корреляций

график/пример кода

Тепловая карта отражает корреляции между концентрациями загрязняющих веществ и AQI. Цвет ячеек показывает силу и направление связи. Этот график помогает: - определить, какие загрязнители сильнее всего связаны с ростом AQI; - выявить взаимосвязи между разными веществами; - сделать выводы о ключевых факторах ухудшения качества воздуха.

Выводы:

Original size 1024x1024

В рамках данного проекта было проведено исследование изменений качества воздуха в крупных городах Индии и факторов, влияющих на его формирование. Для анализа использовались ежедневные данные измерений загрязняющих веществ, собранные экологическими станциями мониторинга и представленные в открытом доступе на платформе Kaggle. В результате проведённого анализа можно сделать вывод, что качество воздуха в крупных городах Индии формируется под влиянием совокупности факторов, среди которых ключевую роль играют концентрации мелкодисперсных частиц, сезонные изменения и локальные особенности городской среды. Проблема загрязнения воздуха носит системный характер и требует комплексного подхода как на уровне отдельных городов, так и на уровне государственной политики. Социальная значимость данной темы, а также личный исследовательский интерес к Индии, позволили рассмотреть проблему качества воздуха не только с технической точки зрения анализа данных, но и в более широком контексте влияния окружающей среды на качество жизни и здоровье населения.

Использованные нейросети: 1. Chat GPT — для подбора визуализаций под временные ряды и для оптимизации Pandas-кода; 2. Krea— для генерации изображений.

We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...
Show more