Для поиска данных для работы был избран сайт «Портал правовой статистики» [1]. В качестве массива данных используется файл «Не раскрыто особо тяжких преступлений.xml» [5], который в дальнейшем преобразован в CSV-файл благодаря конвертеру [2].
Возник интерес к тому, как менялось количество нераскрытых преступлений из года в год с начала их учета. Самые ранние записи датируются 2010 годом.
Для анализа данных применены точечные диаграммы, гистограммы и линейный график, так как именно данный вид отображения данных в лучшей степени показывает динамику изменений с течением времени и позволяет сравнить наибольшие и наименьшие значения.
Мне захотелось построить точечные диаграммы отдельно для периода 2010-2019 и для периода 2020-2022, а также исключить из графика данные всей Российской Федерации и федеральных округов, поэтому сначала к содержимому файла применился фильтр, исключающий строки по ключевым словам. Новые данные затем сортировались по периодам и записывались в новые переменные.
Для приведения графиков к общему виду применяется библиотека Seaborn, которая позволяет отрисовать сетку графиков.
Точечная диаграмма по регионам
Для удобства чтения легенда разделена на три колонны, а годы изображены под углом 45 градусов.Точечные диаграммы позволяют увидеть пики нераскрытых преступлений за разные периоды: это 2014–2017 годы в периоде с 2010 по 2019, и 2021 в периоде с 2020 по 2022.
В точечной диаграмме за весь период можно увидеть общую картину пиков и спадов по числу нераскрытых преступлений во вех регионах.
Гистограмма: минимум и максимум
Для расчета Топ-10 регионов с минимальным и максимальным числом нераскрытых особо тяжких преступлений, данные группировались по названию региона, и затем соответствующие значения суммировались для каждого отдельного региона.
Как можно заметить, больше всего нераскрытых преступлений особой тяжести в Москве и Санкт-Петербурге, а меньше всего — в Ненецком и Чукотском АО.
Чтобы сохранить единство стиля, гистограммы выполнены в пастельных оттенках.
Линейный график: прогноз
Динамика числа нераскрытых особо тяжких преступлений утешительна: в целом существует тенденция к снижению, особенно при сравнении с 2015 годом, хотя в ближайшие годы график может прийти в локальный максимум.
Вывод
Таким образом, проведен небольшой анализ данных по нераскрытым особо тяжким преступлениям за 2010-2022 годы. Согласно полученным графикам, пик нераскрытых преступлений приходится на 2015-2017 годы, и с тех пор эти значения постепенно снижаются из года в год. На это могут влиять различные факторы: улучшение работы соответствующих органов, установка видеокамер в общественных местах и другие.
Ресурсы
- Генеральная прокуратура Российской Федерации Портал правовой статистики//Режим доступа: http://crimestat.ru/opendata (Дата обращения 22.06.2024)
- XML To CSV Converter//Режим доступа: https://www.convertcsv.com/xml-to-csv.htm (Дата обращения 22.06.2024)
- Ideogram male thief in balaclava under magnifying glass in glamorous vibrant translucent pastel style with bright yellow and white colors, minimalistic and noisy picture, poster, illustration//Режим доступа: https://ideogram.ai/g/Ad5wlIa9S-yj0×288-vmRg/3 (Дата обращения 22.06.2024)
- osobo_tyazhkiye.ipynb Google Collab//Режим доступа: https://colab.research.google.com/drive/1TqlNysdaaPt4ojyXDPuc9vHXpHILRvbe?usp=sharing (Дата обращения 22.06.2024)
- Проект_Особо_тяжкие_нераскрытые//Режим доступа: https://drive.google.com/drive/folders/1U0nl1GZklnhekjBE1-EMz1zyRQBL1FsZ?usp=drive_link (Дата обращения 22.06.2024)
Для обложки проекта использовалась нейросеть Ideogram, промпт и ссылка доступны по списку ресурсов.




