Original size 1140x1600

чемпионат мира по футболу 2022

PROTECT STATUS: not protected
The project is taking part in the competition

введение

В рамках анализа данных я выбрала тему «Чемпионат мира по футболу 2022: что предсказывает успех команды». Для исследования были использованы открытые статистические данные по матчам и сборным чемпионата мира 2022 года, приведённые в табличный формат и обработанные в Python с помощью библиотеки Pandas.

Мне было интересно проанализировать именно эти данные, потому что они отражают как контроль игры (владение мячом, передачи), так и эффективность атакующих действий (удары, реализация, точность). Часто считается, что доминирование по владению автоматически ведёт к победе, однако чемпионат мира — хороший пример того, что это не всегда так. Поэтому данные имеют ценность, так как позволяют проверить, какие игровые показатели действительно связаны с успехом команды, а какие — переоценены.

палитра

В работе была использована ограниченная цветовая палитра, вдохновлённая визуальной айдентикой Чемпионата мира по футболу 2022.

post

Тёмно-бордовый цвет #24000C используется как фон графиков и создаёт глубокую, сосредоточенную атмосферу.

post

Светлый розово-алый оттенок #A20F39 выступает в роли основного акцента, выделяя ключевые элементы и тренды.

post

Более тёмный розово-алый цвет #730626 применяется как вторичный акцент для дополнительных визуальных уровней.

post

Белый цвет #FFFFFF используется для текста и линий, обеспечивая высокую читаемость и контраст.

В качестве шрифта был выбран DejaVu Sans. Это нейтральный гротеск, хорошо подходящий для аналитических визуализаций: он легко читается, не отвлекает от данных и корректно отображает числовые значения и подписи на графиках. Использование DejaVu Sans помогает сохранить визуальную строгость и ясность подачи информации.

этапы работы

Original size 3118x1436

На этом этапе была задана единая визуальная идентичность визуализаций: определена цветовая палитра, вдохновлённая айдентикой ЧМ-2022, установлен шрифт DejaVu Sans и настроены параметры отображения графиков (фон, сетка, подписи, цвета осей и текста). Это позволило обеспечить визуальную целостность, высокий контраст и хорошую читаемость всех графиков.

Original size 3118x158
Original size 3118x576

На этом этапе датасет чемпионата мира 2022 был загружен из CSV-файла в среду Python с помощью Pandas. После загрузки была выполнена первичная проверка структуры данных и типов переменных для дальнейшего анализа.

график 01. pearson heat map correlation

Original size 3118x1186

Данный график используется для того, чтобы наглядно показать, какие игровые показатели статистически связаны с победой команды. Тепловая карта позволяет быстро сравнить силу и направление корреляций между показателями и результатом матча. Это помогает выявить метрики, которые потенциально сильнее всего предсказывают успех, и отделить действительно значимые факторы от второстепенных.

Original size 761x683

график 02. boxen plot

Original size 3118x618

Этот график используется для сравнения распределения доли владения мячом у победивших команд и остальных. Boxen plot позволяет увидеть не только средние значения, но и форму распределения, разброс и перекрытие показателей между группами. Это помогает понять, является ли владение мячом устойчивым фактором успеха или его влияние неоднозначно.

Original size 860x583

график 03. scatter plot with trend

Original size 3118x664

Этот график используется для визуальной проверки связи между количеством ударов в створ и числом забитых голов. Линия тренда позволяет увидеть направление и силу зависимости и понять, насколько качество ударов действительно конвертируется в результат.

Original size 784x583

график 04. logistic regression

Original size 3118x1528

Этот график используется для оценки того, какие статистические показатели сильнее всего влияют на вероятность победы. Он позволяет сравнить вклад разных метрик и понять, какие факторы повышают или, наоборот, снижают вероятность успеха команды.

Original size 784x583

график 05. multinomial check

Original size 3118x1330

Этот график используется для анализа того, какие игровые показатели влияют не только на победу, но и на количество набранных очков (поражение, ничья, победа). Он позволяет сравнить вклад факторов для разных исходов матча и понять, какие метрики повышают вероятность набора максимальных очков.

Original size 884x583

вывод

Проведённый анализ данных чемпионата мира по футболу 2022 года показал, что успех команды определяется не столько общим контролем игры, сколько качеством и эффективностью действий.

Pearson heatmap correlation и boxen plot продемонстрировали, что владение мячом само по себе слабо связано с победой и может сопровождаться активными атаками соперника. В то же время показатели, отражающие качество атак — удары в створ и их точность — имеют более устойчивую связь с результатом.

Scatter plot с линией тренда подтвердил, что увеличение количества качественных ударов действительно приводит к росту числа забитых голов. logistic regression показала, что наибольший вклад в вероятность победы вносят точность ударов и реализация моментов, тогда как высокий процент владения мячом не гарантирует положительного исхода. multinomial check (0–1–3 очка) дополнительно подтвердила, что эффективность атак и точность передач чаще связаны с набором максимального количества очков, чем доминирование по владению.

Таким образом, результаты анализа позволяют сделать вывод, что на чемпионате мира 2022 ключевым фактором успеха стала не сама по себе активность или контроль мяча, а способность команды превращать игровые моменты в результат.

датасет и код

We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...
Show more