
Совсем недавно южнокорейская группа TWICE выпустила свой 14 мини-альбом «STRATEGY» (на обложке проекта как раз одна из концепт-фотографий, посвящённая выходу нового альбома). Стоит отметить, что эта группа существует уже на протяжении 9 лет, что довольно много для этой индустрии.
Именно поэтому мне захотелось провести анализ корейских поп артистов, которые выступают в группах или сольно. Данные, используемые в графиках и диаграммах далее, были взяты с сайта kaggle.com.
В данной таблице присутствует информация о 1778 артистах: сценическое и настоящее имя, дата рождения, группа, в которой они состоят (отдельным столбцом выносится прошлая группа, если такая есть), родная страна и город, рост, вес и пол.
Для репрезентации данный я использовала графики различных видов, а именно:
1. Вертикальная и горизонтальная столбчатая диаграмма 2. Точечная диаграмма 3. Динамическая диаграмма 4. Круговая диаграмма
Цветовое и шрифтовое решение
За основу цветового решения я также решила взять концепт-фото группы TWICE, поскольку мне очень понравились наряды девушек и цветовые сочетания на фото.




Таким образом, палитра проекта будет состоять из следующих оттенков:

Выбранное цветовое решение
Для шрифтового решения я решила подобрать что-нибудь популярное и тематически подходящее. Популярным в Южной Корее сейчас является стиль Y2K, который отсылает нас к 00-м годам XXI века. Проведя небольшой ресёрч в интернете, я взяла бесплатный шрифт: Chilly UI (by Daniel Lyons)
Подготовка таблицы
После импортирования всех необходимых библиотек, я решила удалить несколько ненужных столбиков, так как они немного мешали восприятию таблицы.
Например, столбик с корейским сценическим и полным именем. Ещё я решила удалить столбцы «Second Country» и «Other Group», потому что они в большинстве случаев были заполнены значениями «NaN» и не подходили для анализа.
После этого, мне также необходимо было создать отдельный столбец, где были бы указаны только фамилии (без имён).
Кроме того, для работы необходима была библиотека со шрифтами, которую я также загружаю вместе с выбранным шрифтом, ранее загруженным на github.
Графики
Увидев, что в найденной таблице есть столбик, в котором указана компания, я сразу подумала о круговой диаграмме с распределением самых «популярных» компаний, контракты с которыми заключили больше всего артистов.
Поэтому я приняла решение сделать 2 графика: среди топа из 7 Entertainment’ов и как эти 7 компаний выглядят в соотношении с остальными, указанными в списке.


Далее, пользуясь уже созданным ранее столбиков с фамилиями айдолов, я решила узнать, какая же фамилия в к-попе встречается чаще остальных!
Следующий график-тренд расскажет нам о том, как к-поп набирал свою популярность, и как стремительно в индустрию начало попадать всё больше и больше людей.
В конце периода график резко идёт вниз, но, полагаю, это происходит из-за того, что таблица заполнена только до середины 2020 года. На самом деле, в настоящее время групп и их участников стало гораздо-гораздо больше!
Сколько же лет айдолам? Линейный график ниже покажет, в каком году родилось наибольшее количество южно-корейских артистов!
Далее идёт один из наиболее интересных для меня графиков. Он показывает, в каком соотношении представлены айдолы различных знаков зодиака!
Столбчатая диаграмма, показанная ниже, докажет, что далеко не все жители Азии обладают низким ростом.
Последний в этом проекте график демонстрирует, какое соотношение рост-вес встречается у артистов из Южной Кореи.
Вывод
При работе я использовала нейросеть Chat GPT (https://chatgpt.com/) для того, чтобы исправлять непонятные для меня ошибки. Также я пользовалась им для того, чтобы разобраться с тем, как изменить цвет фона и колонок. Кроме того, он помог сформулировать код для графика со знаками зодиака.
Для улучшения качества получившихся изображений и диаграммами я использовала нейросеть Upscayl (https://upscayl.org/)
Блокнот с кодом и датасетом: https://drive.google.com/drive/folders/1l7d6P-yMRcp6Wv7u0WqnhavoCdGlXXxu?usp=sharing