Original size 1140x1600

Анализ данных преступности в России: 2003–2019 годы

PROTECT STATUS: not protected

Описание проекта

Для анализа я выбрала базу данных «Преступность в России: 2003–2019 годы», который представлен на сайте http://hubofdata.ru — негосударственный каталог всех открытых данных в Российской Федерации, пополняемый активистами. Эта тема интересна мне в связи популярностью жанра тру-крайм.

Для визуализации были использованы столбчатые диаграммы, тепловая карта, бокс-плот, диаграмма рассеяния.

Графики

Сначала нужно импортировать необходимые библиотеки, затем также подключиться к Google Drive, чтобы получить доступ к файлу. Далее происходит загрузка данных из CSV файла

big
Original size 787x328

Преобразовываем некоторые столбцы для удобства работы с данными — в столбце «Месяц» оставляем только месяц, год выводим в отдельный столбец.

big
Original size 783x187

Чтобы узнать количество преступлений по годам, а не месяцам, группируем данные по каждому году отдельно.

Затем устанавливается стиль графиков, который будет использован и в дельнейшем. Фон графиков черный, а цвет столбца в зависимости от Количества преступлений варьируется от белого до красного.

big
Original size 1050x563
Original size 1489x790

Для создания графиков по конкретным категориям преступлений создадим список categories и с помощью цикла for происходит генерация подграфиков для каждой категории преступлений. Насыщенность цвета линий и точек каждого графика также зависит от количества преступлений.

Original size 1080x218
Original size 1167x707
Original size 1990x1474

Для создания столбчатой диаграммы с разбивкой по категориям преступлений за каждый год сначала создается список с названиями категорий преступлений, которые необходимо отобразить на графике.

Original size 1287x542
Original size 1489x989

Далее можно создать график, который отображает показатели за конкретный год, который можно задать в переменной selected_year. Также добавляем зависимость насыщенности цвета от количества преступлений.

Original size 1097x452
Original size 1489x790

Проследить распределение преступлений по месяцам и годам наиболее наглядно можно с помощью тепловой карты. Это создает наиболее полную картину, где можно сравнить как каждый год между собой, так и каждый месяц внутри года.

Original size 1111x267
Original size 1374x790

Далее происходит визуализация данных о преступности в виде бокс-плота для анализа распределения количества преступлений по месяцам. На этом графике можно заметить, в какие месяцы статистически совершается больше преступлений.

Original size 1005x233
Original size 1489x790
Original size 993x322

С помощью диаграммы рассеяния можно провести анализ корреляции между двумя категориями преступлений — в данном случае изнасилованиями и убийствами.

Original size 1252x710

Обложка проекта сгенерирована с помощью нейросети Ideogram. Промт: a mysterious crime-related illustration

Анализ данных преступности в России: 2003–2019 годы
We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...
Show more