Original size 799x1125

UFO sight / анализ данных

PROTECT STATUS: not protected
The project is taking part in the competition

описание проекта

Для анализа был выбран датасет UFO Sights 2016 US and Canada с data.world. Он содержит информацию о частоте наблюдений, их местоположении и времени, короткие заметки о том, что люди видели.

Эта тема показалась мне интересной, так как позволяет с помощью анализа данных и визуализации исследовать, как люди описывают необычные наблюдения, выявляя повторяющиеся паттерны в субъективных и неструктурированных данных.

виды графов

[1] — Scatter plot [2] — Line plot [3] — Pie chart [4,5] — Bar chart [6] — Word cloud

этапы работы

Для визуализации данных я намерено выбрала темный фон с яркими элементами, что отсылает нас к эстетике sci-fi, с которой могут ассоциироваться наблюдения за нло.

big
Original size 2400x1000

В начале работы я импортировала все необходимые библиотеки, которые понадобятся для анализа и визуализации данных.

После я задала единый визуальный стиль для всех графиков — задала цветовую палитру, загрузила и подключила шрифт, а также добавила ко всем графикам шум и небольшое свечение.

0

[1]

Сначала я решила посмотреть, как территориально распределяются сообщения об НЛО. Для этого я построила Scatter plot, оси которого отражают долготу и широту.

Original size 2400x797
Original size 2400x1000

На карте отчётливо видны скопления сообщений вокруг густонаселённых регионов США и Канады. Это отражает смещение выборки: сообщения — не объективная частота явлений, а активность пользователей в доступных местах.

[2]

Затем, сгруппировав сообщения по месяцу, в который они были зафиксированы, я построила LIne PLot, чтобы наглядно изобразить, в какие месяцы люди чаще всего замечали что-то странное в небе.

Original size 2400x756
Original size 2400x1000

На графике видно, что в 2016 году количество наблюдений достигло своего пика в тёплое время года. Это может отражать сезонность — люди чаще наблюдают объекты под открытым небом в тёплые месяцы.

[3]

Чтобы наглядно сравнить, когда чаще всего фиксировались НЛО — днем или ночью, — был построен Pie chart.

Original size 2400x1371
Original size 2400x1000

Ночные наблюдения доминируют в отчетах, что соответствует ожиданиям наблюдений в темное время суток.

[4]

Далее я посчитала, сколько раз люди видели объекты разных форм и построила Bar chart.

Original size 2400x756
Original size 2400x1000

Значительное количество наблюдателей описывают НЛО как вспышку света. Подобное распределение может быть связано как с ограниченными условиями наблюдения, так и с субъективным восприятием быстро движущихся или удалённых объектов.

[5]

Чтобы посмотреть, о чем чаще всего говорят (форме, движении или свете) описывая НЛО, я сначала сгруппировала слова, похожие по смыслам в группы (также форма, движение и свет), а затем посчитала, как часто люди используют слова той или иной группы. Для визуализации этих данных я также использовала Bar chart.

0
Original size 2400x1000

Наиболее популярные описания относятся к категории «свет», что можно связать с преобладающим количеством ночных наблюдений.

[6]

Ну и последним я решила построить Word cloud самых частых слов из сообщений. Для этого я выделила основные смысловые слова, и исключила из анализа различные местоимения, предлоги и междометия, благодаря чему будет получена более «чистая» семантика.

Затем я импортировала Word cloud и уже построила сам график.

0
Original size 2400x1412
Original size 2400x1000

Облако слов выявило ключевые термины, такие как «moving», «light», «round», «hovering», отражающие визуальные и динамические характеристики наблюдений. Описывая НЛО, наблюдатели чаще всего обращают внимание на то, как он двигается на его внешний вид.

использование нейросетей

ChatGPT— исправление ошибок в кодах, анализ графиков

We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...
Show more