Исходный размер 1341x1893

«Золотая плитка» на основе датасета

PROTECT STATUS: not protected

Описание идеи и концепция

Шоколад — один из самых популярных десертов в мире, но представления о том, каким должен быть идеальный шоколад, та самая «золотая плитка», часто отличаются. Одни считают лучшим максимально тёмный шоколад, другие предпочитают молочный, а третьи обращают внимание на состав и вкусовые оттенки.

Для проекта я выбрала датасет с результатами дегустаций шоколада и решила проверить, какие характеристики действительно связаны с высокими оценками. Меня заинтересовало, какой шоколад на самом деле считается лучшим и что отличает его от остальных.

Цель проекта — показать, какие особенности чаще всего встречаются у шоколада с высокими оценками, и предоставить результаты в простой и наглядной форме.

Инфографика данного проекта рассчитана на широкую аудиторию: любителей шоколада, покупателей и тех, кому интересны исследования на основе данных.

Исходные данные

Для анализа я взяла открытый датасет Chocolate Bar 2020 Ratings на ресурсе Kaggle, содержащий результаты дегустации 2223 шоколадных плиток разных производителей.

В датасете представлены:

— оценки шоколада; — процент содержания какао; — вкусовые дескрипторы; — состав плитки; — информация о происхождении какао-бобов.

После очистки данных были выбраны показатели, которые позволяли ответить на главный вопрос исследования: какие характеристики чаще всего встречаются у шоколада с высокими оценками.

Процесс создания

Сначала был проведён поиск подходящего датасета. Мне хотелось найти тему, которая была бы понятной широкой аудитории и позволяла построить полноценную историю на данных. После анализа нескольких вариантов был выбран именно этот датасет.

Затем данные были обработаны в Google Sheets. На этом этапе была очистка таблиц, группировка категорий, подсчёт средних значений и подготовка данных для будущих графиков. Часть данных потребовала дополнительного преобразования, так как некоторые числовые показатели были записаны в текстовом формате, поэтому их пришлось приводить к единому виду и перепроверять перед построением диаграмм.

Графики из Google Sheets

После подготовки данных были построены визуализации, отражающие основные закономерности исследования: рейтинг содержания процента какао в шоколаде, количества ингредиентов и вкусовых характеристик на итоговую оценку шоколада.

Дизайн инфографики создавался в Figma. В качестве носителя выбрала журнальный разворот, потому что такой формат позволяет сохранять последовательность и объединять несколько графиков в единое визуальное повествование.

Визуальный стиль проекта вдохновлён эстетикой премиального шоколада и его плиток, разломов. Основой стали тёмно-коричневая палитра, тёплые золотистые акценты и иллюстрации. Некоторые иллюстрации были сгенерированы с помощью GPT и затем доработаны для использования в макете.

ChatGPT также использовался как вспомогательный инструмент для поиска подходящего датасета, решения технических проблем при обработке данных и проверки корректности построения отдельных графиков.

Журнальный разворот

Исходный размер 2553x1803
Исходный размер 1536x1024

Мокапы

Исходный размер 1448x1086

В шоколадном шоуруме

Исходный размер 1491x1055

На журнальном столике

Исходный размер 1492x1054

Дома на диване

Вывод исследования

Анализ показал, что самый высокий рейтинг получает шоколад с содержанием какао около 70–79% и составом из 2-3 ингредиентов, а не самые тёмные и не самые сложные по составу шоколадные плитки. Также выяснилось, что с высокими оценками чаще всего ассоциируются сливочные вкусовые ноты (сreamy).

В итоге оказалось, что лучший шоколад — сбалансированный: умеренное содержание какао, простой состав и мягкие вкусовые ноты.

«Золотая плитка» на основе датасета
Проект создан 22.06.2026
Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную...
Показать больше