Введение
В рамках моего исследования я детально изучила информацию о перевозках городским такси. Цель работы — не ограничивается визуализацией информации, а предполагает обнаружение существенных зависимостей: каким образом погодные условия, время дня и дни недели отражаются на количестве заказов, и как объективно определяется цена за поездку в Санкт-Петербурге.

Для начала работы над проектом были импортированы библиотеки pandas для обработки табличных данных и matplotlib для создания графических представлений.
В коде применила функцию df.columns.str.strip (). Этот этап имеет ключевое значение, поскольку позволяет устранить ненужные пробелы в наименованиях столбцов таблицы, что нередко препятствует корректному доступу к данным.

График 1
Время суток
Используя метод value_counts (), была произведена оценка частоты появления каждого времени суток (утра, дня, вечера, ночи) в предоставленном наборе данных. Результаты анализа были отображены в виде столбчатой диаграммы посредством функции plt.bar ().
График 2
Цена vs Дистанция
В коде применена функция plt.scatter () для отрисовки графика рассеивания. На одной оси размещено значение параметра «Длина пути» (продолжительность поездки), на другой — «Цена» (стоимость).
Полученное изображение представляет собой совокупность точек, каждая из которых соответствует конкретной поездке. Для улучшения видимости и демонстрации плотности точек установлена степень прозрачности alpha=0.4. Наблюдается отчетливая тенденция роста стоимости в зависимости от расстояния, подтверждающая справедливую ценовую политику сервиса.
График 3
Влияние погоды
В коде реализовано создание круговой диаграммы с использованием функции plt.pie (). Данная операция основана на анализе уникальных значений столбца «Weather», которые были распределены по сегментам диаграммы в соответствии с их относительным весом в общем объеме данных (100%).
Визуальное оформление диаграммы выполнено с акцентированием внимания на секторах желтого и черного цветов, целью которого является наглядное представление условий, при которых пользователи предпочитают вызывать такси вместо самостоятельной ходьбы пешком.
График 4
Влияние погоды
Чтобы избежать перегруженности графика, был создан список day_order, определяющий последовательный порядок отображения дней недели. Впоследствии функция plt.plot () была использована для построения линии, соединяющей точки данных с помощью маркеров 'o'.
Такой подход позволил визуально выделить динамику активности городских перевозок, демонстрируя периоды снижения и повышения интенсивности использования такси. Использование линейного графика оказалось оптимальным решением для представления этих данных во временном формате.
Вывод
Проведенный анализ продемонстрировал, что функционирование рынка такси в Санкт-Петербурге характеризуется высокой степенью организованности, где спрос и формирование цен соответствуют четким закономерностям. Исследование выявило прозрачность ценовой политики, обусловленную прямой зависимостью цены от расстояния поездки, а также значительное влияние на загруженность сервиса таких факторов, как время суток и погодные условия. Разработанный аналитический инструмент обеспечивает автоматизацию обработки первичных данных и преобразование их в понятные графические представления, подтверждающие роль такси в качестве неотъемлемой части городской инфраструктуры, эффективно интегрированной в повседневную жизнь мегаполиса.
Источники
Написание кода: https://colab.research.google.com Помощь в написании кода, генерации картинок: https://gemini.google.com Датасет: https://www.kaggle.com/datasets/mlfool/yandex-taxi-saint-petersburg



