Исходный размер 1240x1750

Анализ данных о пингвинах архипелага Палмер (Антарктида)

PROTECT STATUS: not protected

Концепция

Для финального проекта по курсу «Программирование для креативных индустрий‎» я выбрала данные о пингвинах архипелага Палмер (Антарктида) с сайта Kaggle.

Архипелаг Палмер расположен у побережья Антарктического полуострова и является одной из ключевых зон обитания пингвинов в Южном океане. Благодаря относительной доступности региона и стабильным условиям наблюдений, именно здесь на протяжении многих лет ведутся систематические биологические исследования в рамках программы Palmer Station Long Term Ecological Research (LTER).

На архипелаге Палмер обитают три вида пингвинов, каждый из которых обладает своими морфологическими и поведенческими особенностями: Adelie (Pygoscelis adeliae), Chinstrap (Pygoscelis antarcticus), Gentoo (Pygoscelis papua).

Исходный размер 1419x461

Целью проекта является выявление морфологических различий между видами и изучения взаимосвязей физических характеристик.

Этот датасет интересен, потому что: — он основан на реальных полевых биологических наблюдениях; — позволяет изучать морфологические различия между видами; — данные достаточно чистые (но при этом требуют предварительной обработки); — тема экологии и биоразнообразия Антарктиды актуальна в контексте климатических изменений

Какие виды графиков были выбраны и почему?

В проекте использованы следующие типы визуализаций:

  1. Столбчатая диаграмма — для сравнения количества пингвинов разных видов
  2. Гистограмма — для анализа распределения массы тела
  3. Boxplot — для сравнения морфологических характеристик между видами
  4. Диаграмма рассеивания — для выявления взаимосвязей между параметрами
  5. Составная диаграмма — для анализа распределения полов внутри видов

Эти графики позволяют сочетать исследовательский и объясняющий подходы.

Визуальный стиль вдохновлён холодной палитрой Антарктиды: оттенками синего

Исходный размер 1920x1116

мудборд

Исходный размер 1920x1116

Используемые статистические методы:

  1. Описательная статистика;
  2. Анализ распределений;
  3. Межгрупповое сравнение;
  4. Визуальный анализ корреляций;
  5. Работа с категориальными переменными.

Данные в датасете были собраны в рамках проекта Palmer Station Long Term Ecological Research (LTER) и включают морфологические характеристики пингвинов трёх видов:

  1. Adelie
  2. Chinstrap
  3. Gentoo

Также представлены следующие параметры: — длина и глубина клюва — длина ласт — масса тела — пол — остров обитания — вид пингвина

Обработка данных

Сначала были подключены необходимые библиотеки — pandas и matplotlib (pyplot), после чего выполнено чтение CSV-файла с данными.

Исходный размер 2644x222

Далее делаю очистку и подготовку данных. Убираю строки с пропущенными значениями в ключевых столбцах.

Исходный размер 2404x798

Следующим этапом я задаю палитру и цвета графикам

Исходный размер 2296x280
Исходный размер 2252x1196

Визуализация данных

График 1

График демонстрирует количество наблюдений для каждого вида пингвинов: Adelie, Gentoo и Chinstrap. Данный график был построен для понимания структуры датасета и оценки представленности различных видов пингвинов в выборке. Это важно для корректной интерпретации всех последующих результатов анализа.

Исходный размер 1660x1126
Исходный размер 2234x584

Можно заметить, что вид Adelie представлен значительно чаще, чем остальные. Это означает, что выборка несбалансирована, и этот факт необходимо учитывать при сравнении морфологических характеристик между видами.

График 2

Гистограмма помогает понять, как распределена масса тела пингвинов в общей выборке. График отражает частотное распределение массы тела пингвинов и позволяет оценить форму распределения, диапазон значений и плотность наблюдений.

Исходный размер 1632x1124
Исходный размер 2374x552

График 3

График Boxplot позволяет сравнивать распределения числовых показателей между несколькими группами. Он был выбран для анализа различий в массе тела между видами пингвинов.

Исходный размер 1674x1120
Исходный размер 2420x936

Вид Gentoo заметно отличается большей медианной массой тела по сравнению с другими видами. При этом Adelie и Chinstrap имеют более компактные распределения, что подчёркивает морфологические различия между видами.

График 4

Диаграмма рассеивания используется для изучения взаимосвязи между двумя количественными переменными. В данном случае он позволяет исследовать связь между длиной ласт и массой тела пингвинов.

Каждая точка представляет отдельную особь, а положение точки отражает её длину ласт и массу тела.

Исходный размер 1676x1128
Исходный размер 2384x558

Наблюдается явная положительная корреляция: чем больше длина ласт, тем выше масса тела. Это биологически обоснованная связь, подтверждающая, что морфологические параметры пингвинов взаимосвязаны.

График 5

Этот график был построен для анализа структуры выборки и проверки баланса полов внутри каждого вида пингвинов.

Исходный размер 1658x1246
Исходный размер 2350x592

В целом распределение полов выглядит относительно сбалансированным, однако для некоторых видов можно заметить небольшие перекосы. Это важно учитывать при дальнейшем анализе морфологических характеристик, так как пол может влиять на размеры и массу тела.

Анализ данных о пингвинах архипелага Палмер (Антарктида)
Проект создан 14.01.2026
Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную...
Показать больше