В Гонконге игроки в тотализатор использовали научный подход для оценки показателей каждой лошади, чтобы, сравнив их, составить прогноз по результатам забега. С футболом этот номер провернуть сложнее. Теоретически можно взвесить достоинства каждой команды и вычислить, какая из них успешнее выступит в данном сезоне. Но предсказать победу той или иной команды в каждом конкретном матче неизмеримо труднее. Команда, хорошо выступающая против одного соперника, порой выглядит бледно в поединке с другим. Мяч может попасть в ворота, а может – в штангу. Удачное выступление поднимает боевой дух команды, и даже слабые игроки играют выше своих возможностей. Этот клубок случайных факторов далеко не лучшим образом влияет на статистические расчеты. В 1970-х несколько ученых даже пришли к заключению, что отдельно взятый футбольный матч настолько непредсказуем, что предсказать его точный исход практически невозможно.
Решив заняться исследованием футбольных матчей, Коулз и Диксон ступили на малоизученную территорию. Однако было одно обстоятельство, говорившее в их пользу: в Великобритании коэффициенты ставок объявляли за несколько дней до начала матча. В отличие от Гонконга, где ставки лихорадочно размещались в последние минуты перед забегом, участник футбольного тотализатора располагал достаточным временем для составления прогноза и его сравнения с предсказаниями букмекеров. Что еще лучше, существовал широкий выбор доступных ставок. На давно сформировавшемся беттинговом рынке Великобритании можно биться об заклад о чем угодно: от количества голов в первом тайме до количества угловых.
Диксон и Коулз решили начать с главного вопроса: какая команда победит? Но прежде чем пытаться спрогнозировать конечный результат, они попробовали предсказать, сколько голов будет забито в матче. Допустим, предположили ученые, каждая команда забивает очередной гол через определенный промежуток времени. Вероятность гола в этом случае не зависит от того, что происходило на футбольном поле непосредственно перед голом. В науке подобную череду событий называют процессом Пуассона. Названный в честь физика Симеона Пуассона, он проявляется во многих аспектах повседневной жизни. Исследователи используют процесс Пуассона для моделирования распределения звонков на многоканальном телефоне, распада радиоактивных веществ и даже активности нейронов. Когда мы говорим, что события включены в процесс Пуассона, это значит, что они происходят с определенным интервалом, каждый из которых независим от остальных. Если в первом тайме не было забито ни одного гола, это не повышает вероятность того, что гол будет забит во втором.
Диксон и Коулз смоделировали футбольный матч как процесс Пуассона, предположив, таким образом, что голы забиваются с определенным интервалом на протяжении всей игры. Но как от этого предположения перейти к прогнозу финального результата? Количество забитых в матче мячей, вероятно, зависит от того, какие команды играют. Сколько же голов можно ожидать от каждой команды?
Еще в начале своей статьи от 1997 года Коулз и Диксон определили набор действий, которые необходимо совершить для построения модели игры в рамках футбольной лиги. Прежде всего, необходимо измерить квалификацию каждой команды – например, придумав некую систему рейтинга. Можно присваивать команде определенное количество очков после каждого матча, а по истечении определенного срока суммировать их, скажем, три очка за победу, одно – за ничью и ни одного – в случае поражения. Представив квалификацию команды в виде числа, мы увидим, какая команда играет хорошо. Впрочем, на основе этого рейтинга далеко не всегда можно сделать успешный прогноз. В 2009 году появилось исследование Кристофера Лейтнера и его коллег из Венского университета экономики и бизнеса, ставшее наглядной иллюстрацией к проблеме: ученые проанализировали прогнозы на футбольный Еврокубок 2008 года с опорой на рейтинги ФИФА и пришли к выводу, что оценка букмекеров была гораздо более точной. Для того чтобы заработать деньги на футбольном тотализаторе, одним критерием в оценке команды не обойдешься.
Диксон и Коулз предложили разбить квалификацию команды на две составляющие: атака и защита. Коэффициент атаки показывает способность команды забивать голы, а слабость в защите свидетельствует о пробелах в умении их отражать.
Присвоив команде хозяев коэффициент силы атаки, а команде гостей – коэффициент слабости защиты, Диксон и Коулз пришли к выводу, что ожидаемое количество голов команды-хозяйки можно предсказать на основе учета трех факторов:
Фактор игры на домашнем поле означает важное преимущество – «дома» результаты, как правило, лучше. Точно так же ожидаемое количество голов, забитых гостями, равно коэффициенту силы атаки команды-гостя, помноженному на коэффициент слабости защиты команды-хозяйки (команда-гость не имеет дополнительных преимуществ).