
описание проекта
Для анализа был выбран датасет UFO Sights 2016 US and Canada с data.world. Он содержит информацию о частоте наблюдений, их местоположении и времени, короткие заметки о том, что люди видели.
Эта тема показалась мне интересной, так как позволяет с помощью анализа данных и визуализации исследовать, как люди описывают необычные наблюдения, выявляя повторяющиеся паттерны в субъективных и неструктурированных данных.
виды графов
[1] — Scatter plot [2] — Line plot [3] — Pie chart [4,5] — Bar chart [6] — Word cloud
этапы работы
Для визуализации данных я намерено выбрала темный фон с яркими элементами, что отсылает нас к эстетике sci-fi, с которой могут ассоциироваться наблюдения за нло.

В начале работы я импортировала все необходимые библиотеки, которые понадобятся для анализа и визуализации данных.
После я задала единый визуальный стиль для всех графиков — задала цветовую палитру, загрузила и подключила шрифт, а также добавила ко всем графикам шум и небольшое свечение.
[1]
Сначала я решила посмотреть, как территориально распределяются сообщения об НЛО. Для этого я построила Scatter plot, оси которого отражают долготу и широту.
На карте отчётливо видны скопления сообщений вокруг густонаселённых регионов США и Канады. Это отражает смещение выборки: сообщения — не объективная частота явлений, а активность пользователей в доступных местах.
[2]
Затем, сгруппировав сообщения по месяцу, в который они были зафиксированы, я построила LIne PLot, чтобы наглядно изобразить, в какие месяцы люди чаще всего замечали что-то странное в небе.
На графике видно, что в 2016 году количество наблюдений достигло своего пика в тёплое время года. Это может отражать сезонность — люди чаще наблюдают объекты под открытым небом в тёплые месяцы.
[3]
Чтобы наглядно сравнить, когда чаще всего фиксировались НЛО — днем или ночью, — был построен Pie chart.
Ночные наблюдения доминируют в отчетах, что соответствует ожиданиям наблюдений в темное время суток.
[4]
Далее я посчитала, сколько раз люди видели объекты разных форм и построила Bar chart.
Значительное количество наблюдателей описывают НЛО как вспышку света. Подобное распределение может быть связано как с ограниченными условиями наблюдения, так и с субъективным восприятием быстро движущихся или удалённых объектов.
[5]
Чтобы посмотреть, о чем чаще всего говорят (форме, движении или свете) описывая НЛО, я сначала сгруппировала слова, похожие по смыслам в группы (также форма, движение и свет), а затем посчитала, как часто люди используют слова той или иной группы. Для визуализации этих данных я также использовала Bar chart.
Наиболее популярные описания относятся к категории «свет», что можно связать с преобладающим количеством ночных наблюдений.
[6]
Ну и последним я решила построить Word cloud самых частых слов из сообщений. Для этого я выделила основные смысловые слова, и исключила из анализа различные местоимения, предлоги и междометия, благодаря чему будет получена более «чистая» семантика.
Затем я импортировала Word cloud и уже построила сам график.
Облако слов выявило ключевые термины, такие как «moving», «light», «round», «hovering», отражающие визуальные и динамические характеристики наблюдений. Описывая НЛО, наблюдатели чаще всего обращают внимание на то, как он двигается на его внешний вид.
использование нейросетей
ChatGPT— исправление ошибок в кодах, анализ графиков