Получи бонус на первый депозит до 2500₽! Жми «Сделать ставку»!

В футбол все сильнее проникают технологии, появляются новые метрики на основе машинного обучения, которые дают возможность проводить более качественную оценку действий футболистов на поле. Новые метрики охватывают все больше игрового контекста при оценивании того или иного игрового эпизода и позволяют выделять игроков, эффективность и качество игры которых зачастую невозможно измерять стандартными статистическими показателями, такими как голы или ассисты, и даже более продвинутыми метриками, такими как xG, xA, xGBuildUp и др., которые не всегда могут давать максимально объективную картину за счет того, что учитывают очень мало игрового контекста, в котором совершается действие.

Сегодня я предлагаю рассмотреть результаты отчета, подготовленного сотрудниками Лёвенского университета, занимающимися машинным обучением и спортивной аналитикой. В данном отчете приводится рейтинг лучших футболистов АПЛ первой половины текущего сезона для различных игровых позиций по метрикам VAEP и xT. Рейтинг представлен в виде сборной команды игроков с наивысшими значениями рассматриваемых метрик, которые усредняются для 90 минут игрового времени. В качестве игровой схемы была выбрана 4-2-3-1 как наиболее часто используемая схеме в текущем сезоне. Также в отчете рассматриваются лучшие новички АПЛ сезона 20-21 и рейтинг молодых игроков до 21 года, демонстрирующих по указанным метрикам самые высокие показатели. В качестве бонуса будут рассмотрены две голевые передачи, получившие наивысшие оценки по все тем же метрикам.

Перед началом демонстрации результатов будет полезно вспомнить некоторые характерные особенности рассматриваемых метрик и основные отличия между ними без глубокого погружения в особенности вычислений.

Для расчета данной метрики используется . Модель, которая считает VAEP, оценивает футболиста, рассматривая , которые определяют , и рассчитывает вероятность забить и пропустить гол в течение следующих 10 действий.

Получи бонус на первый депозит! Сделай ставку!

Далее модель оценивает то, относительно (которое было рассмотрено аналогично текущему) и складывает эти изменения, в результате чего получается финальная оценка.

В качестве примера: оценка действия по метрике VAEP +0.05 означает, что в результате совершенного действия вероятность забить гол в течение следующих 10 действий увеличилась на 0.05 и наоборот, оценка -0.05 означает, что совершенное действие увеличивает шансы противоположной команды забить гол на 0.05 в течение такого же количества последующих действий.

Подробное описание можете найти в этой статье.

В основе данной метрики лежит статистическая модель, которая рассматривает игровой процесс в виде последовательности переходов между различными игровыми состояниями. Такая модель называется марковской моделью или .

При построении данной модели все поле разбивается на зоны. Для каждой зоны вычисляется показатель (ожидаемая угроза), который является оценкой того, что через несколько следующих действий (обычно 5 действий) будет забит гол, при условии, что игрок с мячом находится в текущей зоне.

Далее для каждого совершенного действия вычисляется разность значений xTдля конечной и начальной зоны. Полученная разность и является финальной оценкой, которая ставится для совершенного действия. Иными словами метрика xT отражает то, как изменяется вероятность забить гол в течение следующих 5 действий, если в результате совершенного действия мяч перешел из одной зоны в другую.

Подробное описание можете найти в этой статье.

  • Обе метрики основаны на описании состояний игры. Подход используемый в , , в то время как  описывает состояние игры и лучше охватывает игровой контекст. По качеству описания состояний игры – метрика VAEP оценивается более высоко.

  • Метрика в отличие от VAEP из-за того, что в ней состояния описываются на основе привязки к зонам. Оценки VAEP основаны на алгоритмах машинного обучения, которые учитывают большое количество параметров и в большинстве случаев не дают возможности простой интерпретации получаемых результатов (т.е. нельзя объяснить, почему та или иная последовательность действий получила какую-то определенную оценку).

  • Метрика VAEP оценивает не только изменение вероятности забить гол (атакующая оценка действия), но и изменение вероятности пропустить гол в свои ворота в результате действия (оборонительная оценка действия), чего не учитывает xT. Это приводит к тому, что .

  • Метрика учитывает только действия по продвижению мяча (пасы, кроссы, ведение мяча и т д) и , такие как подкат или перехват мяча, что уменьшает охватываемый ею игровой контекст, в сравнении с VAEP, которая учитывает широкий спектр игровых действий.

  • (данных о событиях), которые отражают пространственные координаты только одного игрока, совершающего действие в данный момент, но не учитывают информацию о других игроках, что делает эффективность метрик, построенных на таких данных, несколько ниже в сравнении с метриками на основе трекинговых данных (или на основе контекстуальных/контекстных данных, которые сегодня представлены на рынке компанией StatsBomb)

Обе метрики сходятся в определении трех лучших атакующих полузащитников. На флангах больше всего очков набирают и . И если попадание капитана Астон Виллы с 15 очками по системе гол + пас на конец первого круга не вызывает никакого удивления, то присутствие Хадсона-Одои (игрока молодежной сборной Англии) с 3 выходами в старте и 3 результативными очками может удивить рядового болельщика АПЛ, который мало следит за игрой синих.

Справедливости ради стоит отметить, что основными конкурентами Грилиша за место левого вингера в команде лучших по метрике VAEP были , набравший 17 очков по системе гол + пас на конец первого круга, и , для которых итоговые значения метрики оказались несколько ниже.

Лучшие игроки АПЛ первой половины сезона 2020-21 по метрикам VAEP и xT

Лучшим в центре по рассматриваемым метрикам оказался конечно же , входящий на конец первого круга также в , которая определяет среднее ожидаемое количество ассистов созданных "с игры". За матя Бруну зарабатывал в среднем 0.36 xA.

Последним игроком, присутствие которого в команде лучших подтверждается как VAEP так и xT, оказался вратарь Бернли — , являющийся на сегодня основным в воротах сборной Англии. Безусловно, рассматриваемые метрики в какой-то степени отражают и степень снижения вероятности пропустить гол в свои ворота в результате действий голкипера, и увеличение вероятности забить гол за счет длинных и качественных передач вперед, но оценка вратаря — не является основной задачей данных инструментов, поэтому, просто принимаем данный результата к сведению и идем дальше.

Лучшие игроки АПЛ первой половины сезона 2020-21 по метрикам VAEP и xT

Лучшим форвардом по метрике VAEP оказался , по метрике xT — Данное различие может быть объяснено спецификой рассматриваемых метрик. Кейн в текущем сезоне стал опускаться гораздо глубже для поиска мяча и выполнения большого количества работы плеймейкера. Если раньше его амплуа в качестве чистого нападающего в Тоттенхэме было только на бумаге, а фактическую игровую роль можно было определить как "ложную девятку" или "чистую десятку", то в период Моуриньо эпизодами Харри оказывается настолько глубоко, что его функционал соответствует даже "восьмерке" в некоторые моменты, в результате чего преобладающее игровое амплуа для Кейна можно описать в виде некоторой гибридной позиции со смесью 10 с 8 (или глубокой десятки) и 9.

В новом игровом амплуа демонстрирует великолепную результативность , и это обуславливает низкие значения метрики xT, которая оценивает действия, строго привязывая их к определенной зоне игрового поля.

У же наоборот, некоторые сделанные , в зонах с высоким значением xT, что и обуславливает более высокие показатели чем у Кейна. Кроме того, высокий процент точности передач в финальной трети поля у Заа также способствует повышению значений метрики xT.

Отсутствие игроков Ливерпуля в списке лучших по метрике VAEP является дополнительным отражением спада, наблюдаемого у красных в текущем сезоне. Несмотря на это, и все таки попадают в список лучших по метрике xT, .

Самым главным удивлением для меня стало отсутствие в команде лучших по метрике VAEP, по которой его значения оказались ниже, чем у двух других центральных полузащитников — и . По метрике xT КДБ попал в список лучших, получив себе в пару Хендо.

Также стоит отметить одну интересную особенность, метрика , давая сбалансированную оценку действиям игроков, в которой в том числе учитывается , выделяет обоих центральных защитников сильнее, чем крайних, в отличие от xT.

Данные рейтинги рассматривают игроков, подписанных летом 2020 года, но не учитывают тех, кто вернулся из аренды. Лучшим по метрике VAEP стал португалец , уступив одну сотую Грилишу при конкуренции за место в команде лучших. Высокие значения в том числе показывает новичок Астон Вилы . Замыкает тройку , усиливший Эвертон в этом сезоне и показывающий яркую и эффективную игру на старте чемпионата, но затем пропустивший весь декабрь из-за травмы, что, возможно, не позволило продемонстрировать колумбийцу более высокие результаты.

Лучшие игроки АПЛ первой половины сезона 2020-21 по метрикам VAEP и xT

Хамес является единственным игроком попавшим в оба рейтинга и также замыкает тройку лучших по метрике xT. На втором месте по создаваемой угрозе попадает , зарабатывая в среднем за матч на одну сотую больше xT, чем Хамес, а возглавляет рейтинг лучших трансферов по xT новичок Лидса , получая в среднем за матч 0.21 xT.

Лучшие игроки АПЛ первой половины сезона 2020-21 по метрикам VAEP и xT

В данном месте можно отметить тот факт, что оценки по метрике xT перекрывают более узкий диапазон значений, что . Данная особенность хорошо отражена на командах с лучшими игроками, где для VAEP разница между максимальным (Грилиш) и минимальным (Поуп) значениями равна 0.39, а для xT, аналогичная разница равна 0.26. Такая же картина наблюдается для рейтинга лучших трансферов — по метрике VAEP между первым и третьим местом разница составляет 0.22, а по метрике xT и вовсе 0.03. учитывающей 21 тип различных действий и рассматривающей каждый игровой эпизод, основываясь на трех последних действиях совершенных в игре.

Каллум является главным героем сегодняшнего обзора. Помимо попадания в команду лучших игроков АПЛ по метрике VAEP, он также занимает первую строчку в рейтинге молодых талантов по обеим метрикам.

(Внимательный читатель заметит, что значение метрики xT в рейтинге молодых талантов и в команде лучших игроков отличается на одну сотую — 0.28 против 0.27, но предлагаю не обращать большого внимания на закравшуюся ошибку в приведенных результатах, которая может быть обусловлена как учетом большего или меньшего количества игр для одного из рейтингов, так и просто опечаткой).

Лучшие игроки АПЛ первой половины сезона 2020-21 по метрикам VAEP и xT

Другой игрок, на которого стоит обратить особое внимание, — новичок Вулверхэмптона Португалец также попадает в оба рейтинга лучших молодых талантов, причем по метрике VAEP занимает третье место, пропуская на второе место , постепенно закрепляющегося в основе Манчестер Сити и демонстрирующего очень хороший футбол в текущем сезоне. По метрике xT Нету замыкает пятерку, пропуская вперед .

Лучшие игроки АПЛ первой половины сезона 2020-21 по метрикам VAEP и xT

Две передачи, которые будут рассмотрены ниже, получили самые высокие оценки по метрикам xT и VAEP в первом круге АПЛ. Они наглядно отражают специфику расчета каждой из метрик и особенно преимущество VAEP перед xT с точки зрения охвата игрового контекста.

со своей единственной голевой передачей в текущем сезоне в матче против Фулхэма получил самую высокую оценку по метрике xT для совершенного действия. Такая оценка обусловлена зоной, в которой замкнул прострел. Для данной зоны значение xT является самым высоким на футбольном поле, и при вычитании из xT для рассматриваемой зоны значения xT, которое соответствует зоне, из которой Батшуайи отдавал передачу, получается очень высокое итоговое значение метрики xT.

Второй ассист в нашем рейтинге в отрыве от игрового контекста выглядит довольно обычной передачей в разрез в свободную зону и по метрике xT получает не самую высокую оценку, но метрика VAEP, для оценки которой используются модели машинного обучения, позволяет учесть быстрый ввод мяча , начальную точку поля, в которой получил мяч и последующее продвижение мяча игроком Астон Вилы на скорости, время матча, в которое была отдана передача (75 минута) и текущий игровой счет (Арсенал 0:2 Астон Вилла), что в совокупности с набором дополнительных параметров, описывающих данную игровую ситуацию, делает финальную передачу на гораздо более ценной с точки зрения увеличения вероятности забить гол, нежели, если бы передача отдавалась в другой игровой ситуации.

Т.е. исходная вероятность гола перед пасом на Уоткинса была относительно низкой, ввиду того, что Грилиш уже совершил длительный дриблинг на скорости в финальном отрезке матча, пройдя почти половину поля, когда его команда уже имела преимущество в два мяча, а в момент приема Уоткинсом сильно увеличилась, т.к. еще 10 секунд назад мячом владел Арсенал, и то время, за которое мяч был доставлен из своей штрафной в штрафную соперника, говорит о том, что обороняющая команда навряд ли успела перестроится после фазы атаки, что дополнительно добавляет шансы забить гол из точки с номинально неплохим уровнем xG.

По моей субъективной оценке рейтинги на основе метрики VAEP более качественно отражают реальность и более эффективно оценивают игровые эпизоды на футбольном поле. Футбольная аналитика будет двигаться в сторону инструментов на основе машинного обучения, о чем в том числе свидетельствует анонсированная недавно метрика от StatsBomb, которая по описанию, приведенному на презентации StatsBomb Evolve, очень похожа на метрику VAEP, только будет строится на основе новых контекстуальных данных о событиях StatsBomb 360, которые обогащены широким спектром дополнительной информации и учитывают в том числе координаты игроков, находящихся без мяча.

Интересно ваше мнение относительно игроков, которые оказались в различных рейтингах по обеим метрикам.

  • Отражает ли данная картина ваши субъективные оценки или нет ?

  • Наличие каких игроков в рассмотренных рейтингах удивило вас больше всего ?

  • Верите ли вы, что продвинутые метрики на основе машинного обучения и статистического моделирования смогут эффективно оценивать игроков и будут неотъемлемой частью футбольной аналитики ближайшего будущего ?

P.s.

Оригинал обзора — здесь.

Источник: sports.ru
Получи бонус на первый депозит! Сделай ставку!

ОСТАВЬТЕ ОТВЕТ

Please enter your comment!
Please enter your name here

два × четыре =