Исходный размер 1240x1750

Анализ данных персонажей Dungeons&Dragons

Вводная часть

Для анализа я выбрал набор данных о персонажах в НРИ Dungeons&Dragons 5E, найденный на сайте Kaggle. Данные взяты с самого популярного инструмента, который используют для создания и хранения персонажей игроки, и D&D 5 редакции является самой популярной НРИ в истории. Как геймдизайнер, заинтересованный в НРИ, мне стало интересно составить впечатление об игроках по этим данным.

big
Исходный размер 2232x557

Интерфейс сайта D&D Beyond, с которого взяты данные

Основное, что меня интересовало — это частота появления определенных вещей и соотношения разных черт персонажей, например, рас и классов. Типы графиков были выбраны соответственно этому.

Этапы работы

Я открыл Jupyter notebook и, с некоторой помощью ChatGPT, написал код.

big
Исходный размер 1033x764

Начало ноутбука в Юпитере

Как можно увидеть, для теста я вывел самые популярные имена для персонажей. Так как D&D Beyond прост в использовании и игроки любят придумывать новых персонажей, в топ-5 вошли «Test» и 'test'. На втором месте было имя «Bob», что тоже просто объяснить — это короткое, немного забавное имя, которое просто вписать, когда не можешь ничего придумать. Имена «Varis» и «Rhogar» предположительно являются рандомными именами, которые дает персонажам D&D Beyond.

Исходный размер 792x214

Пример промпта для ChatGPT

Так как счет шел в сотнях тысяч, стилизовать графики просто выписав данные в сторонние программы оказалось невозможным. Так что я привел их к единому стилю используя встроенные возможности matplotlib: Просто покрасил в фирменный для D&D красный.

Графики

Исходный размер 991x547

Увидев колонку «inventory», я захотел узнать, какие предметы чаще всего встречаются. Список предметов в инвентаре персонажа подавался разделенным с помощью слэша. Я разделил все инвентари на отдельные предметы и вывел топ-20. Первые места не очень интересны: это просто предметы из набора, который получает каждый персонаж на 1 уровне. Далее можно увидеть самое популярное оружие, тоже из того списка, что можно получить на 1 уровне. Для сравнения я нашел количество зелий лечения — 70622 и бездонных волшебных сумок — 43493. Это самые популярные волшбеные предметы, которые можно получить за деньги или квесты во время игры. По сравнению с сотнями тысяч стартовых предметов, можно понять, что большинство игроков или так и не доходят до игры, или и не пытаются, а просто делают персонажей, потому что это весело.

Исходный размер 921x790

Далее я вывел матрицу корреляции между классом и расой персонажа. Самой частой комбинацией стал человек-воин, что не удивительно. У эльфов самый популярный класс — следопыт, скорее всего, из-за ассоциации с эльфами Толкиена и Леголасом в частности. Матрица показала именно то, что я ожидал: ловкие полурослики — плуты, харизматичные полуэльфы — барды и сильные полуорки — варвары.

Исходный размер 989x590
Исходный размер 989x590

У характеристик в игре есть всем известные названия, но в данных они назывались stats_1 — stats_6. Я предположил, что порядок такой же, как в классическом листе персонажа, и чтобы проверить вывел два примера. На первом линейном графике — частота значений stats_1 (предположительно сила) у класса Воина, а на втором stats_4 (интеллект). Мои предположения оказались правильными — можно увидеть, что характеристика силы у воинов чаще всего 14-16, а характеристика интеллекта 8-10.

Исходный размер 989x590

1 — сила, 2 — ловкость, 3- телосложение, 4-интеллект, 5 — мудрость, 6- харизма.

Наконец, я вывел сложенный график частоты значений характеристик. Он ограничен 5 самыми часто встречающимися числами. Разброс, учитывая количество данных, не слишком большой — это значит, что все классы достаточно популярны, так как разные классы требуют хороших значений в разных характеристиках. Выделяется stats_3 — это телосложение, и оно так популярно из-за того, что от него зависит количество очков здоровья персонажа. Иметь высокое телосложение полезно вне зависимости от класса и расы.

Блокнот и датасет

Описание применения генеративной модели

https://chatgpt.com/ ChatGPT 4.0 использовался для решения ошибок кода и подбора правильного вида графиков для визуализации данных.

Анализ данных персонажей Dungeons&Dragons
Проект создан 24.10.2025
Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную...
Показать больше