Aparecium — заклинание которое используется для обнаружения скрытых предметов и тайных посланий, написанных невидимыми чернилами. Подобно тому, как анализ данных помогает выявлять скрытую информацию в книгах.
В преддверии новогодних праздников, хочется привнести немного волшебства даже в учебные проекты, поэтому в качестве предмета своего исследования я выбрала вселенную Гарри Поттера.
Читая серию этих чудесных книг, становиться очевидно что внутри этой вселенной содержится изобилие разных магических артефактов, профессий, персонажей и различных волшебных категорий, за которыми не всегда можно уследить и не всегда получается удержать все важные факты в голове. По этому было принято решение провести анализ некоторых данных из вселенной созданной Джоан Роулинг и создать их визуализацию, для еще более глубоко понимания мира магии и волшебства.
Были использованы дата сеты с сайта kaggle.com и язык python для анализа данных и создания диаграмм.
Типы диаграмм:
точечная диаграмма круговая диаграмма линейчатая диаграмма столбчатая диаграмма
Дизайн
Для создания цветовой палитры, я использовала ресурс https://color.adobe.com/ и извлекла цветовую гамму из обложки фильма «Гарри Поттер и Орден Феникса» так как мне она кажется самой насыщенной и атмосферной.
Доминантный статус Крови
Во вселенной Гарри Поттера существуют разные статусы крови, которые определяют степень принадлежности того или иного персонажа к миру волшебства.
Самые привилегированные это Чистокровки, персонажи у которых оба родителя маги. Далее идут Полукровки и Грязнокровки у которых один из родителей Магл, соответственно их степень принадлежности к волшебству чуть ниже, и это естественно отражается на их магических способностях. Самая последняя категория в этой иерархии это Магл — человек, который не обладает никакими магическими способностями.
Мне стало интересно посмотреть, персонажам какого статуса крови уделено больше всего внимания в книге. Существует около 15 категорий, но я выбрала 4 категории, для того чтобы график был понятный и не перегруженный. Эти категории: Чистокровка, Полукровка, Магло-рожденные и Маглы.
График показал что большинство персонажей в книгах это Чистокровки, а меньше всего внимания уделяется Маглам.
Факультеты
Все мы знаем что в Хогвартсе существует четыре факультета, Гриффиндор, Слизерин, Пуффендуй и Когтевран. Мы знаем то что каждый персонаж в книге относиться к одному из факультетов. Так же не секрет, что большинство внимания уделяется Гриффиндору и Слизерину, это некое противостояние добра и зла в книге. Пуффендуй и Когтевран же упоминаются не так часто.
Но мне стало интересно проанализировать насколько это правда, и какой из факультетов является самым редко упоминаемым и играет самую маленькую роль в книге.
Мои ожидания оправдались, как показал график, факультету Пуффендуй уделено меньше всего внимания в книге, то есть персонажей этого факультета самое маленькое количество, то есть он меньше всего влияет на сюжет.
Корреляция между факультетами и профессией
Далее я решила провести небольшое социальное исследование и узнать о том из какого факультета выпускаются персонажи которые становятся профессорами в Хогвартсе. Так же я решила посмотреть есть ли какое-либо разнообразие в том кто становиться пожирателем смерти и так же насколько равномерное распределение между факультетами среди учеников.
Вопреки моим ожиданиям, чаще всего, профессорами становятся ученики Слизерина, я предполагала что эта работа больше подойдет выпускникам Когтеврана, так как они славятся своими академическими качествами.
Как и стоило ожидать, пожиратели смерти это исключительно выпускники Слизерина.
И так же, диаграмма показала что доминантный факультет в школе это Гриффиндор, соответственно распределение между факультетами не равное. Это подтверждает тот факт, что распределительная шляпа действительно анализирует внутреннее качества будущего ученика, а не просто пытается равномерно распределить всех по факультетам.
Волшебные палочки
В волшебной лавке Олливандера, любой волшебник может выбрать себе палочку, а точнее полочка выберет его.
Мы подходим к предмету исследования который был наиболее интересен для меня, и это состав волшебных палочек. Известно, что каждая палочка отличается уникальным составом. По скольку мне никогда не удавалось точно понять какие же все-таки стандартные ингредиенты для создания палочки, я решила создать график который показывает 4 самых часто используемых ингредиента в волшебных палочках.
Как показывает график, самые часто используемые ингредиенты в волшебных палочках это: волосы, часть тела дракона, сердечная струна, часть тела единорога, сердцевина растений.
Заключение
В ходе данного исследования был проведён анализ различных аспектов магической вселенной Гарри Поттера с использованием инструментов анализа данных и визуализации. Применение языка программирования Python и датасетов помогло мне структурировать различные данные из книг и наглядно представить скрытые закономерности магического мира, созданного Джоан Роулинг.



