Йоаким Марнитц - Искусство ставить на спорт. Первое пособие по ставкам на русском языке. Страница 32

Тип используемой регрессии – простая бинарная логистическая (существуют и другие, более сложные), для которой в Интернете есть много калькуляторов и подробных объяснений – например, здесь: www.sigmaxl.com/LogisticRegression.shtml.

По существу, регрессия вычисляет вероятность осуществления события, для которого возможно только два варианта исхода: успех, если гол забит, или неудача в случае любого другого исхода – попадание в штангу, отбитие вратарем или удар мимо ворот.

Методология работает исключительно хорошо с моделями математического ожидания гола, но, кроме того, она может быть применена к целому ряду других игровых событий, связанных с командами и игроками, а также к исходу матча. Итак, взглянем наконец на некоторые полезные применения этой методики в области спортивных ставок.

Короче говоря, если можно сказать, что исход события, который мы хотим предсказать, – это наступление или ненаступление данного события, то можно оценить, насколько вводные параметры, предшествующие этому событию, могут иметь существенное влияние на предсказание вероятности.

Применение к модели простого математического ожидания гола

Модель математического ожидания гола использует две непрерывные переменные – координаты места удара, а также третью дискретную переменную, которая может принимать одно из двух значений – удар ногой или головой. Можно использовать другие непрерывные или дискретные переменные, чтобы усложнить модель с учетом других факторов, которые могут иметь значение: погодные условия, удар с игры, контратака, стандартное положение и т. п. Также можно вводить параметры, учитывающие место или даже силу удара.

Можно также учитывать тактические аспекты игры: подготовленность команды к матчу, наигранные стандартные положения и угловые удары. Аналогично, базовая модель может применяться для предсказания точности удара. Попадание в цель, приводящее к прямому голу или к необходимости вмешательства вратаря, можно определить как успех (зависимая переменная). В этом случае мы можем определить команду, которая, используя точность и вероятность повторного отскока мяча, имеет повышенные шансы забить гол. Удар по отскочившему мячу предоставляет атакующему больше возможностей забить гол, чем при ударе с игры, поэтому такой тактический прием может быть эффективным.

Применение к определению процента точных передач

Точные передачи – еще один вариант дискретного (успех или неудача) исхода в рамках футбольного матча, к которому можно применить данную методику. Вопрос сбора достаточного количества исходных данных здесь также важен, но попытка сделать передачу имеет всего четыре непрерывные переменные, влияющие на вероятность прохождения паса. Такими основными параметрами являются координаты х и у двух точек, с которой передается мяч и в которой он принимается или перехватывается.

Например, в типичном матче чемпионата 2011/12 «Болтон» – «Манчестер-Сити» защитники обеих команд совершили по 76 % точных передач, а нападающие – только по 68 %. Отбросив в сторону нарекания на техническое мастерство атакующих игроков, логистический подход использует начальную и конечную точки каждого паса, чтобы предсказать более низкий уровень математического ожидания точного исполнения пасов, переданных из более напряженных участков поля.

Дальность передачи и место ее выполнения могут стать поводом для дискуссии о соотношении уровней мастерства такого разыгрывающего игрока, как Леон Бриттон, и креативного форварда Давида Силвы. Их роли на поле абсолютно различны.

Сам по себе процент точных передач мало о чем говорит. Пас, отданный вдоль своих ворот, в 90 % случаев будет точным, хотя бы потому, что его не будет пытаться перехватить соперник. А в середине поля, при помехах со стороны противника, только четверть передач являются удачными.

Применение к другим видам спорта

В футболе много дискретных событий. Разработку моделей ограничивают лишь воображение разработчика и наличие данных. Но можно применить подобные модели в регби и американском футболе.

Реализация, штрафные удары и атаки из глубины поля дают отличную возможность изучить влияние погодных условий, ветра, осадков, высоты местности, даже того факта, что игрок – левша, уж не говоря о дальности и угле удара. Каждый из этих параметров может влиять на вероятность успешного исхода события.

Оценить математическую вероятность гола после удачного удара с 40 ярдов из глубины поля на стадионе «Ламбо Филд» при снегопаде с ветром по сравнению с ударом с той же дистанции в безветренный день где-то в горах достаточно легко для того, кто приложит усилия для сбора необходимых данных.

Американцы любят, чтобы любое соревнование заканчивалось победой одной из сторон. Поэтому данный простейший метод анализа здесь применим. Разве что в футбол они играют по общим правилам, но в большинстве американских видов спорта ничьи крайне редки, поэтому исход можно определять как выбор из двух вариантов – успех или неудача.

В играх НФЛ, НБА, НХЛ или ГЛБ очень много числовых показателей, которые повторяются от игры к игре, в отличие от видов спорта, где успех больше зависит от индивидуального таланта спортсмена. Такие показатели эффективности, как пройденная с мячом дистанция, переданный или полученный пас, выражают общекомандную подготовку, особенно с учетом неизбежной неравномерности игрового графика.

Собирая такие независимые непрерывные переменные с разбивкой по матчам и местам их проведения, объединяя их с дихотомическим исходом реального домашнего поражения или выигрыша, закодированного как 1 или 0 в логистической регрессии, можно начать, во-первых, оценивать текущую позицию команды в чемпионате, а во-вторых, предсказывать вероятность домашней победы, если подобные исходные данные будут повторяться в будущем.

Поэтому такой анализ может быть как информативным, так и предсказательным. Трудно найти распространенный вид спорта, к которому нельзя было бы в какой-то степени применить этот тип регрессивного анализа. Те, кто может глубже проработать свои модели с использованием инструментария, доступного в имеющемся программном обеспечении по регрессиям, могут выявить команды, которые, за счет своей необычной или неумелой игры, не подчиняются данной модели.

Имеется множество статистических методов, способных описать любой вид спорта, не умаляя его привлекательности, как это делают многие скептики. Наиболее сложной является задача сформулировать вопрос так, чтобы он сочетался с выбранным методом. Например, каковы шансы участвующей в чемпионате команды, которая к Новому году имеет 6 % от очков, набранных всеми командами, занять на финише сезона место не ниже четвертого? Я ответа не знаю, но знаю метод, который поможет это узнать.