
Описание
Качество апельсинов — это больше, чем просто цифры в таблице. Для меня, как любительницы этих солнечных фруктов, это целая история о том, что делает апельсины вкусными и привлекательными. Работать с этим проектом мне было особенно интересно, ведь я не только изучала данные, но и находила ответы на вопросы, которые давно меня увлекали.
В качестве анализируемого материала я выбрала базу данных (Orange Quality Analysis Dataset) с сайта Kaggle. Датасет, с которым я работала, охватывает разные параметры, описывающие качество апельсинов: от размера и веса до уровня сладости, кислотности и цвета. Эти данные позволяют глубже понять, что делает апельсины идеальными, а также помогают обнаружить закономерности, которые сложно заметить без анализа.
Для визуализации я выбрала:
Линейную диаграмму, чтобы посмотреть, как связаны размер и сладость.
Круговую диаграмму, чтобы показать распределение цветов апельсинов. Это простой и понятный способ представить категории.
Точечную диаграмму, чтобы изучить связь веса и кислотности.
Гистограмму, чтобы посмотреть, как меняется вес в зависимости от спелости. Это помогает понять динамику.

Процесс работы включал обработку данных, их анализ и визуализацию с помощью Python (библиотеки Matplotlib и Seaborn). Я старалась сделать графики не только информативными, но и красивыми — вдохновлялась современными минималистичными инфографиками.
В итоге у меня получилось создать несколько наглядных графиков, которые я представлю вместе с кодом и датасетом. И таким образом, я показываю наглядно, как выявить лучший апельсин на прилавках в магазинах.
Цвета
Я выбрала бежевый, зелёный, оранжевый, красный и жёлтый, потому что они передают атмосферу апельсинов: оранжевый, жёлтый и красный — их яркость и сочность, зелёный — связь с природой, а бежевый — нейтральный фон для акцента на данных.
Шрифт
Для проекта идеально подойдёт шрифт Raleway — элегантный и современный, легко читаемый. Этот шрифт передаёт ощущение натуральности, что гармонично сочетается с темой апельсинов и помогает создать профессиональный и визуально приятный проект.
downloaded from Freepik
График зависимости размера от сладости
График показывает зависимость между размером апельсинов и их сладостью. Видно, что меньшие по размеру плоды обычно обладают большей степенью сладости, в то время как у более крупных апельсинов сладость снижается.
Трендовая линия на графике подтверждает эту тенденцию, демонстрируя отрицательную корреляцию между размером плода и его сладостью. Это наблюдение позволяет сделать вывод, что размер апельсина может быть важным фактором при оценке его вкусовых качеств.
график № 1
(1) код
График зависимости веса от кислотности

Точечная диаграмма показывает зависимость веса апельсина от его кислотности (pH). По горизонтальной оси отображается кислотность, а по вертикальной — вес. Трендовая линия, добавленная пунктиром, указывает на общую тенденцию: чем выше кислотность (pH), тем чаще наблюдается увеличение веса.
Однако разброс точек достаточно велик, что говорит о наличии значительных вариаций среди плодов. Это значит, что вес апельсина зависит не только от кислотности, но и от других факторов. Тем не менее, тренд помогает уловить общий характер взаимосвязи: более кислые плоды имеют склонность быть тяжелее.
Такой анализ полезен для выявления скрытых закономерностей и понимания того, как разные параметры влияют на характеристики фруктов.
график № 2
(2) код
График цветов апельсинов
downloaded from Freepik
Круговая диаграмма наглядно демонстрирует распределение цветов апельсинов. Большая часть плодов имеет цвет Deep Orange (31,1%) и Light Orange (26,6%), что можно считать наиболее типичными оттенками для апельсинов. Реже встречаются плоды с цветами Orange-Red (22,8%), Orange (15,8%) и совсем небольшая доля Yellow-Orange (3,7%).
Такое визуальное представление удобно для быстрого восприятия — видно, какие цвета преобладают, а какие встречаются редко. Это помогает понять, насколько разнообразна окраска апельсинов в собранных данных.
график № 3
(3) код
График зависимости спелости от веса
На линейной диаграмме представлена зависимость спелости апельсинов от их веса. Каждая колонка показывает средний вес плодов для определённого уровня спелости (от 1 до 5).
График показывает, что вес апельсинов снижается с повышением спелости. Самые тяжёлые плоды встречаются на втором уровне спелости (более 250 г), а на последнем уровне (5) вес опускается ниже 200 г. Это подтверждает и трендовая линия, которая указывает на плавное снижение веса.
Такое распределение позволяет предположить, что на более поздних стадиях спелости апельсины теряют часть массы, возможно, из-за испарения влаги.
график № 4
(4) код
Заключение
downloaded from Freepik
Исследование качества апельсинов позволило выявить интересные зависимости между различными параметрами плодов. Этот вывод подтверждён как визуальным анализом данных, так и построением трендовых зависимостей.
Было установлено, что с увеличением pH (снижением кислотности) масса апельсинов незначительно уменьшается, хотя сильный разброс значений показывает, что на вес влияют и другие факторы. Тем не менее, можно отметить положительную тенденцию: менее кислые плоды чаще оказываются более мелкими.
Анализ распределения цветов апельсинов показал, что наиболее распространены насыщенные оттенки: Deep Orange (31,1%) и Light Orange (26,6%). Наименее часто встречается цвет Yellow-Orange (3,7%), что говорит о малом количестве недозрелых плодов в выборке. Преобладание тёплых оттенков подтверждает высокое качество и оптимальную спелость большинства апельсинов.
При изучении зависимости веса от спелости выявилась обратная корреляция: чем спелее апельсин, тем меньше его масса. Максимальный вес наблюдается у плодов на второй стадии спелости, а минимальный — у самых спелых на пятой стадии. Это может быть связано с потерей влаги в процессе дозревания, что делает плоды легче. Трендовая линия наглядно подтверждает это уменьшение.
Таким образом, можно сделать вывод, что масса, кислотность и цвет апельсинов тесно взаимосвязаны. Самые тяжёлые плоды чаще всего имеют умеренную кислотность и насыщенный оранжевый цвет, который сигнализирует о хорошем качестве. Однако спелость не всегда гарантирует большую массу, что открывает возможности для дальнейшего исследования.
Подобный анализ данных особенно актуален для сельского хозяйства и торговли, так как помогает оптимизировать процесс оценки качества плодов, отобрать наиболее ценные параметры и предложить потребителю наилучший продукт. Результаты исследования могут быть использованы для разработки систем автоматизированного контроля качества, улучшения рекомендаций по хранению и транспортировке апельсинов и, в конечном итоге, для повышения их коммерческой привлекательности.