Заведём таймер ⏰
Мой проект посвящон пицце, потомучто пица вкусная (покрайней мере те что я пробовал)! Крометого выбраная тема открывает возможности для следования двух интересных вопросов: Как выглядит идеальная пица для обсолютно разных людей? И наколько вообще полезна такая пица для физического и финансового благополучая?
Чтобы найти ответы, я взял два набора данных, которые смотрят на пиццу с разных сторон.
Pizza Tastes.csv — данные о заказах из разных ресторанов. Содержит информацию о добавках (сыр, грибы, острота), размере в дюймах и цене. Это наш «финансовый» датасет.
Pizza Health.csv — лабораторные данные о химическом составе пицц. Содержит процентное содержание влаги, белка, жира, золы, натрия, углеводов и калорийность. Это наш «физический» датасет.
Подготовка 🎒
Прежде чем приступить к иследованию, данные нужно почистить и обогатить. Вот ключевые шаги:
Идеальная пица 🪄
B представленной табице Pizza Tastes (которую можно найти по ссылке ниже) представлены данные об начинках, размере и цены пиццы, визуализируем эти данные:
🪧 Большие пиццы (15 дюймов) часто имеют низкую цену за квадратный дюйм, то есть они выгоднее по площади. Маленькие пиццы (8-9 дюймов) — самые невыгодные с этой точки зрения.
🪧 Обсолютно естественно, что пицца «Всё вместе» — самая дорогая. «Только острота» добавляет мало к стоимости. «Сыр+Грибы» — популярная и дорогая комбинация.
Поллезная пица 🍃
Теперь расмотрим таблицу Pizza Health (которая тагже доступна по ссылке ниже). Вней расматриваеться пищевая ценность саммых разснообразных пицц. Визуализируем эту информацию.
🪧 Жир (fat) имеет самую сильную положительную корреляцию с калорийностью (cal). Хочеться мало калорийной пиццы — нужен вариант с пониженным содержанием жира (меньше сыра, колбасы).
🪧Большая часть образцов попадает в рекомендуемый диапазон 2-5%, но значительная доля (23.2%) превышает максимальную норму в 5%, что немного растраивает. Однако есть небольшая группа пицц с содержанием золы ниже 2%, что ободряет.
Время пришло 🏁

Чтож расмотрев ичерпывающие граффики можно сделать несколько смелых заявлений:
🌟 Популярная пицца: 12 дюймов, с сыром и грибами, без остроты. Это баланс размера, цены и умеренной калорийности. 🧾 Цена: Сильнее всего на нее влияет размер и комбинация добавок. Самая выгодная цена за площадь — у большой пиццы (15 дюймов) без добавок. 📊 Калорийность: Главный источник калорий — жир (сыр, колбаса). Острые добавки сами по себе мало влияют на калории. Такчто если вы хотите малоколариуную пицу придёться отказаться от двойного сыра и добавок в виде колбасы. 🤖 Наиболее привлекательное соотношение: Низкая стоимость и низкие калории — пицца без добавок или только с грибами. Если вкус важнее — комбинация сыра и грибов дает максимальный эффект.
Данные говорят, что существует идеальная пицца, и она размером 12 дюймов. Осталось лишь навестить ближайшую пиццерию и восторженно произнести: «Pizza, per favore!» 🍕
Приложения 📎
Датасеты, блокнот IPYNB: Ссылка на репозиторий.
Основные статистически методы: a. Описательная статистика — средние значения, мода, стандартное отклонение b. Корреляционный анализ — исследование взаимосвязей между переменными c. Группировка и агрегация — анализ данных по категориям (топпинги, размеры) d. Сравнение распределений — box plots, scatter plots для сравнения групп
Датасеты на Kaggle: Pizza Tastes, Pizza Health.



