Введение
Для своего проекта я выбрала набор данных о преступности в различных регионах страны, представленных на официальном сайте прокуратуры Российской Федерации.
Меня заинтересовало изучение статистики преступности, чтобы выявить ключевые тенденции и закономерности, которые демонстрируют различия в уровнях преступности по регионам и годам, а также оценить эффективность мер, направленных на борьбу с преступностью. Эти данные позволят лучше понять факторы, влияющие на общую безопасность общества.
В своем анализе я визуализирую данные с помощью графика, гистограммы и точечной диаграммы. Эти инструменты позволяют наглядно представить ключевые выводы исследования.
Процесс работы
Для начала я выполнила обработку XML-данных, чтобы извлечь информацию о количестве преступлений по регионам и годам, а затем формирует из этих данных таблицу с помощью библиотеки pandas.
[1] График преступности по годам
Сгруппировала данные по году, суммировала количество преступлений для каждого года. Так, получился линейный график, показывающий, как менялось общее число преступлений по годам. Позволяет увидеть тренды: рост, спад или стабильность преступности.
[2] Топ-10 регионов по числу преступлений
Далее написала код, который группирует данные по региону, суммирует количество преступлений в каждом регионе. Сортирует регионы по убыванию числа преступлений и выбирает 10 лидеров.
[3] Распределение преступлений
Следующий код строит гистограмму по столбцу «Crimes». Он показывает, как распределено количество преступлений: есть ли регионы с экстремально высокими или низкими значениями, насколько распределение близко к нормальному.
[4] Диаграмма размаха
И последний график строит boxplot (ящик с усами) для столбца «Crimes». Он позволяет визуально оценить медиану, квартили, выявить выбросы (аномально высокие или низкие значения).



