Футболоматика: как благодаря математике «Барселона» выигрывает, Роналду забивает, а букмекеры зарабатывают состояния — страница 5 из 15

Статистическое великолепие

Каждый год кто-то становится лучшим – игрок, который забивает больше всего голов, или спортсмен, который бежит быстрее всех. Но время от времени появляется человек, который на голову превосходит остальных. В последние годы мы видели, как Лионель Месси и Криштиану Роналду уничтожают оборону и бьют рекорды по забитым мячам. Мы видели, как Усэйн Болт доминирует в беге на 100 и 200 метров, делая это мощно и непринужденно. Другие спортсмены, такие как сестры Уильямс в теннисе, занимали господствующее положение в течение столь длительного периода, что кажутся просто непобедимыми.

Когда мы думаем о проблемах, стоящих перед обществом сегодня, возникают такие вопросы: как часто, по нашим предположениям, будут происходить взлеты и падения мировой экономики и как мы планируем экстремальные погодные явления, такие как штормы или периоды аномальной жары? Для мировой экономики и глобального потепления такие вопросы являются очень важными – возможно, даже важней, чем сравнение Роналду и Месси. Чтобы ответить на них, нам понадобится статистика экстремумов.

Игра в угадайку

Из миллионов людей всего лишь Месси и Роналду – «предельные случаи», которые приходятся всего лишь раз на 132,5 миллиона человек.

Из миллионов людей всего лишь Месси и Роналду – «предельные случаи», которые приходятся всего лишь раз на 132,5 миллиона человек. В мире живут миллиарды людей, и лишь немногие из них достигают вершин. Согласно официальной статистике FIFA, 265 миллионов людей играют в футбол на постоянной основе[29]

Нечестно сравнивать Месси и Роналду с теми из нас, кто спотыкается о собственные ноги в парке воскресным утром. О Месси (как правило, наряду с Пеле и Марадоной) говорят как о лучшем футболисте всех времен. Вопрос, который нам нужно задать: как современных игроков можно сравнить с теми, кого мы видели в прошлом? Как часто мы ожидаем такое событие, как Месси? Один раз в десять лет? Раз в поколение? Или даже раз в сто лет?

Для измерения экстремумов нужны наблюдения. Нам нужно знать количество голов, забитых лучшим бомбардиром в конкретной лиге за сезон, или какой день был самым жарким в году в Лондоне. Анализ наблюдений за предыдущие десятилетия может дать нам некоторое представление о том, что произойдет в следующем году. Если в предыдущие сезоны никто не забивал больше 40 голов, то вряд ли кто-то сделает это в этом. Если в летний день в Лондоне температура не превышала 36 °C, мы не должны ожидать, что следующим летом будет намного жарче.

В Испании Трофей Пичичи каждый год вручается игроку, забившему наибольшее количество голов в Ла Лиге. Трофей присуждается с 1929 года, но в 1986 году Ла Лига установила нынешний формат с 20 командами. И теперь каждая команда играет по 38 игр в сезоне[30]. На рисунке 4.1 показана гистограмма количества голов, забитых обладателями трофея в период с сезона-1986/87 до 2009/10. Эта гистограмма похожа на гистограмму количества голов за игру из главы 1. Отличием является то, что теперь она показывает общее количество мячей, забитых за сезон самым успешным нападающим.

По состоянию на лето 2010 года ни один игрок в Ла Лиге не забивал 39 или более голов за один сезон. Также не казалось особенно вероятным, что кто-то побьет этот рекорд в предстоящем сезоне. В сезоне-2009/10 Месси забил 32 мяча, Роналду (26 голов) занял второе место. Чтобы превысить эту отметку, кому-то из них потребовалось бы показать нечто исключительное. Им бы пришлось побить рекорд, который держался на протяжении 23 лет.


Рисунок 4.1. Гистограмма количества голов, забитых победителями Трофея Пичичи (за наибольшее количество забитых мячей в испанской Ла Лиге) между сезонами 1986/87 и 2009/10 гг.


Но как рассчитать вероятность (в процентном соотношении) того, что один из них поставит новый рекорд в сезоне-2010/11? Один из способов – игра в угадайку. Взгляните на рисунок 4.1. Можете ли вы догадаться, в каком сезоне было забито рекордное количество голов? Вы думаете о Роналдо, или Рауле, или даже Руде ван Нистелрое? Если вы хорошо подкованы, то вспомните великого Уго Санчеса, который никому не отдавал Трофей Пичичи в конце 1980-х. В сезоне-1989/90 он забил 38 мячей в 35 матчах за «Реал Мадрид», что в среднем составляет больше гола за игру. Но, скорей всего, большинство из нас ответили бы неправильно. Без хорошего знания испанского футбола вероятность большинства угадать правильный год составит около 1 из 23, или 4,35 %. Все, что мы можем сделать, это выбрать год наугад.

Теперь давайте включим в нашу угадайку сезон-2010/11. Представьте себе, что сейчас лето 2010 года и вас спрашивают: «В каком сезоне игрок забьет наибольшее количество мячей, если считать и этот сезон?» Если вы не знаете ответа, вы просто должны поставить сезон-2010/11 наравне с предыдущими. Вероятность, что именно в этом сезоне рекорд будет побит, такая же, как и для остальных 23 лет: 1 из 24, или 4,17 %.

Игра в угадайку предлагает общее правило для определения того, насколько вероятен предельный случай. Если события не произошло ранее, то это не означает, что оно никогда не произойдет. Значение вероятности равна 1, поделенной на количество раз, когда событие не происходило, плюс один (за сезон, которым мы сейчас интересуемся). В нашем случае это 1/(23+1) = 1/24. В 2010 году казалось, что нужно нечто экстраординарное, чтобы обойти рекорд Уго Санчеса[31].

Раз в жизни

Итак, смог ли Месси забить больше 38 голов и побить рекорд Трофея Пичичи в ходе чудесного для «Барселоны» сезона-2010/11? Если вы еще не проверяли «Википедию», я могу вам сказать. Нет. Месси забил 31 мяч, на один меньше показателя предыдущего сезона. С другой стороны, Роналду улучшил свои результаты в Ла Лиге, забив 41 мяч, и получил Трофей Пичичи[32]. Оглядываясь назад, всегда трудно сказать: 23/1 – это хорошие шансы на успех или нет. Это безусловно было достижением, которое превзошло предыдущие рекорды. Успех Роналду мог показаться свершением, «которое бывает только раз в поколение».

То, что произошло дальше, полностью опровергло нашу модель угадывания. В сезоне-2011/12 года Роналду забил 46 мячей, спокойно обойдя все предыдущие рекорды. Но Месси отгрузил 50 в 37 матчах. Не один, а сразу два игрока превзошли прошлогодние показатели. В сезоне-2012/13 водопад голов продолжился: Месси закончил чемпионат с показателем в 46 мячей, а Роналду – 34. В следующем сезоне было небольшое падение: Месси выпал из гонки, а португалец набрал 31 забитый мяч. Но в сезоне-2014/15 Роналду вернулся, наколотив 48 голов.

50 голов Месси в одном сезоне действительно исключительны, но насколько они исключительны? Расчеты, которые мы совершили до этого, позволяют нам говорить о том, какова вероятность падения рекорда в следующем сезоне. Но они не показывают нам, насколько больше голов будет забито. Как часто мы предполагаем, что в одном сезоне Ла Лиги кто-то забьет 50 мячей? На этот вопрос мы можем ответить. Но для этого нам понадобится не игра в угадайку, а немного более продвинутая математика. Мы применим математическую модель, которая называется распределение экстремальных значений.

Распределение экстремальных значений является математической моделью всех типов экстремумов, будь то самые жаркие или дождливые дни, скорость ветра или голы в Испании. Для его применения должны выполняться два ограничения. Первое ограничение заключается в том, что количество голов, забитых за один сезон, не должно влиять на количество забитых голов в следующем сезоне. Это вполне логично: как мы видели в главе 1, время для одного гола мало или вообще не влияет на время для следующего. Суть второго ограничения в том, что голевые тенденции не должны сравниваться с тенденциями прошлого года. Это сложнее, потому что баланс между атакой и защитой может меняться от сезона к сезону. Мы вернемся ко второму условию позже, но пока допустим, что оно соблюдается. Давайте посмотрим, что говорит нам теория экстремальных значений.

На рисунке 4.2 показана гистограмма для главных бомбардиров от сезона-1986/87 до сезона-2013/14. Сплошная линия – это кривая для распределения экстремальных значений[33]. Используя модель с экстремальными значениями, теперь я могу разобраться, насколько 50 голов Месси были исключительными. В целом существует достаточно разумное совпадение между фактическими данными наблюдений, чтобы убедить нас в том, что теория экстремальных значений может быть полезна. Но если вы внимательно посмотрите на нижний правый угол рисунка 4.2, то увидите, что 50 голов Месси выше кривой, полученной из теории. Участок под кривой, соответствующий 50 и более забитым мячам, представляет собой небольшую заштрихованную область. Здесь кривая теории немного ниже гистограммы данных. Фактически область под этой частью составляет всего 1,36 % (или 1/73) от общей площади[34]. Таким образом, модель говорит, что мы должны ожидать такие показатели один раз в 73 года. Средняя продолжительность жизни в Аргентине составляет 75 лет. Исходя из этого, Месси – событие, происходящее один раз в жизни.


Рисунок 4.2. Гистограмма количества голов, забитых победителями Трофея Пичичи между 1986/87 и 2013/14 годами (столбцы), в сравнении с распределением экстремальных значений (сплошная линия).


Новые экстремумы?

В январе 2015-го Месси получил награду «Игрок года FIFA» в пятый раз, опередив Роналду, у которого их лишь три[35]. Однако Месси не был первым игроком, выигравшим награду пять раз. В 2007 году мне посчастливилось наблюдать за бразильским пятикратным победителем Лиги чемпионов. Матч проходил на поле менее чем в километре от места, где я жил в то время. На стадионе «Гаммлиаваллен» в шведском городе Умео я наблюдал за форвардом Мартой. Она поистине исключительный игрок. В сборной Бразилии она играет центрального нападающего в стиле своего соотечественника Роналдо.


Рисунок 4.3. Гистограмма количества голов, забитых лучшим бомбардиром сезона в женском чемпионате Швеции (столбцы), в сравнении с распределением экстремальных значений (сплошная линия) в интервале с 1982 по 2014 г.


В «Умео» она больше походила на Месси: на дриблинге проходила защитников, создавала шансы для своих одноклубниц и время от времени наносила неудержимые удары с левой.

Марта разделила звание лучшего бомбардира в женской лиге Швеции в 2004 и 2005 годах, забив 21 и 22 гола соответственно. В 2006-м и 2007-м она заняла второе место, на этот раз с 20 и 26 мячами. Это относительно небольшие показатели забитых за сезон голов в шведском женском футболе. Рекорд был установлен в 2002 году еще одной звездой из «Умео», Ханной Юнгберг. Она забила 39 мячей. Рисунок 4.3 показывает распределение голов, забитых с 1982 года. Как и в испанском мужском футболе, распределение экстремальных значений точно отражает голы, забитые самым успешным игроком. Сплошная линия теоретического распределения снова близка к реальным цифрам. Когда мы вычисляем вероятность того, что рекорд в 39 мячей будет повторен или даже побит, она оказывается равной 3,16 %. Это делает Юнгберг, которая выросла недалеко от «Гаммлиаваллен», лучшим бомбардиром Швеции на целое поколение.

Как и Месси, Марту стоит оценивать не только по голам. Ее способность приносить пользу команде делает ее действительно особенной. В сезоне-2005 четверо из пяти лучших бомбардиров играли за «Умео», включая Марту и Юнгберг. На четверых они забили 79 голов в 22 матчах. Эту цифру можно сравнить с 81 голом, забитыми в 38 матчах сезона-2014/15 троицей Месси – Суарес – Неймар. В 2000-х «Умео» был северной «Барселоной».

В шведском женском футболе есть Юнгберг, в испанском мужском есть Роналду. В женском есть Марта, в мужском – Месси.

У каждой страны есть свои проблемы, не говоря уже о различиях между мужским и женским футболом. Но мы можем заметить одинаковые статистические закономерности в разных лигах.

Теория экстремальных значений позволяет нам предсказать, как часто игроки будут бить предыдущие рекорды, и измерить, насколько особенны важные события.

Шторм раз в десять тысяч лет

Область вне футбола, где нам действительно необходимо понимать экстремумы, – это принятие политических решений о будущем. Они должны основываться на понимании развития в долгосрочной перспективе, а не на сиюминутных реакциях. В этом есть прямая необходимость. И иногда политики действительно думают намного вперед. В голландском законодательстве говорится, что «наиболее важные части системы защиты берега должны быть способны выдерживать уровень воды, который в среднем достигается только один раз в десять тысяч лет»[36]. Такое требование представляет собой серьезную проблему для ученых, которые имеют доступ к данным за последние 150 лет, но должны ответить, что может произойти в следующие десять тысяч.

Теория экстремальных значений позволяет нам ответить на такие вопросы. Крупнейшие штормовые волны в Северном море за последние 150 лет соответствуют той же кривой экстремальных значений, которую мы использовали для бомбардиров[37]. Посмотрев на область под кривой, мы можем предсказать частоту экстремальных событий. Например, в 1953 году Северное море вышло из берегов. Высота волн достигала четырех метров – такое событие происходит только один раз за 455 лет. Это не означает, что в следующий раз Северное море выйдет из берегов лишь в 2408 году. Теория предполагает, что вероятность наводнения масштаба 1953 года или сильнее в следующем году составляет 1/455.

Нынешняя защита берега в Нидерландах и барьер Темзы в Лондоне были спроектированы с учетом наводнения 1953 года. Задавая обратный вопрос – какая максимальная волна может появиться с вероятностью 1 к 10 000 или меньше? – ученые смогут соответствовать требованиям голландского законодательства. Именно такие расчеты и проводил Метеорологический институт Королевства Нидерландов. Они показали, что максимальная ожидаемая волна, вероятно, достигнет 5 метров, что на 25 % больше, чем в 1953 году. Мы не можем быть уверены в том, что метеорологи правы в своих расчетах. Но пока наводнение не наступило, их оценка – это лучшее, что у нас есть.

Гром среди ясного неба[38]

До сих пор я предполагал, что мир изменяется несильно. Мы наблюдаем самое большое наводнение, самый жаркий день или лучшего бомбардира каждый год, но мы предполагаем, что по сравнению с прошлым годом отсутствует какая-либо тенденция. В моделях, которые обсуждал до сих пор, допускал, что забивать голы одинаково сложно из года в год и что климат не изменяется. Это большие допущения, и есть веские доказательства того, что для климата эти допущения еще и неверны. Ученые признают, что климат меняется, и мы должны делать прогнозы с учетом этих изменений. Можем ли мы предсказывать будущее, когда мир постоянно меняется?

Чтобы лучше понять, как мы изучаем изменения, давайте посмотрим на спорт, в котором нет сомнений в лучшем представителе. До Усэйна Болта мировой рекорд в беге на 100 метров неуклонно снижался с 10,6 секунды в начале XX века до рекорда в 9,74 секунды, который покорился Ассафе Пауэллу в 2007 году. Эта прогрессия показана на рисунке 4.4. Время Бена Джонсона (9,79 секунды), показанное на Олимпийских играх 1988 года в Сеуле, подрывало бы эту тенденцию. Но оно было удалено из записей после того, как выяснилось, что Джонсон принимает препараты, повышающие эффективность. Как и в случае с Джонсоном, некоторые результаты были отменены из-за проваленных допинг-тестов. Но время Мориса Грина и Асафы Пауэлла остается в рамках общей тенденции.

До 2007 года наблюдалась явная тенденция постепенного улучшения в результатах. Среднее улучшение по сравнению с предыдущим годом показано на рисунке 4.4 в виде пунктирной линии: на протяжении предыдущих ста лет время уменьшалось на 74 миллисекунды за десятилетие. К 2007 году лучшие спринтеры все еще становились быстрее, но совсем незначительно.

В преддверии Олимпийских игр 2008 в Пекине вряд ли кто-то мог предсказать, что выступление Усэйна Болта будет столь эффектным. На рисунке 4.5 я продлил прямую линию прогнозируемых мировых рекордов до 2032 года. Время, показанное Болтом перед Олимпийскими играми в мае 2008 года, было превосходным, но вполне ожидаемым и располагалось немного ниже линии прогноза. Результат 9,69 секунды в финале Олимпиады в том же году был и блестящим и удивительным одновременно. Чтобы понять, насколько это удивительно, проследите за пунктирной линией, пока она не достигнет отметки 9,69 секунды. Это происходит в отметке между 2015 и 2016 годами. Мы предполагали, что придется дождаться Олимпиады в Рио-де-Жанейро, чтобы увидеть, как кто-то достигнет этого результата. Болт сделал это на восемь лет раньше.

В 2009 году на чемпионате мира в Берлине мы увидели, насколько Болт опережает время. Согласно нашему прогнозу, результат в 9,58 секунды должен был появиться к 2030 году. Это на 20 лет позже, чем в реальности Болт установил свой рекорд. Усэйн не просто потрясающий – он неожиданно потрясающий.

Черчение прямых по данным для прогнозирования будущего чревато опасностью. Если мы продлим эту линию в будущее, мы можем предсказать, что в 3318 году новый мировой рекорд составит удивительные ноль секунд! После этого наши потомки будут развивать способность путешествовать во времени и бежать стометровку за отрицательное время. Вам не обязательно быть Эйнштейном, чтобы понять, что это вздор. Должно существовать какое-то ограничение на то, как быстро человек может бежать (даже если это Усэйн Болт[39]).


Рисунок 4.4. Мировые рекорды в беге на 100 м среди мужчин до 2009 года. Кресты обозначают мировой рекорд. Пунктирная линия – линия общей тенденции. Время Джонсона на Олимпиаде в Сеуле (отмечено кругом) было позже дисквалифицировано.


Рисунок 4.5. Мировые рекорды в беге на 100 м среди мужчин с 1982 по 2015 год. Кресты обозначают мировые рекорды. Пунктирная линия – соответствующая им линия общей тенденции.


Во всяком случае прямая, в основе которой были бы данные до 2008 года включительно, могла показаться оптимистичной. Увеличение количества соревнований по всему миру в сочетании с улучшенными методами подготовки и модернизацией спортивных сооружений позволило спортсменам становиться быстрее и быстрее. Но, как правило, мы ожидаем убывающую отдачу, причем темпы улучшения замедляются со временем. Поэтому Болт опередил не просто модель, а нереалистично позитивную модель. Он побил не только рекорд, но и нашу способность делать надежные прогнозы о беге на 100 метров. Глядя на показанное им время, трудно понять, где брать начало для новых прогнозов.

Меняющие игру

Увеличение количества соревнований по всему миру в сочетании с улучшенными методами подготовки и модернизацией спортивных сооружений позволило спортсменам становиться быстрее и быстрее.

Я могу представить одну из двух возможных версий будущего после Болта. Одна заключается в том, что Усэйн – штучный экземпляр. Комбинация характера, формы, размера и манеры поведения делают его уникальным. Нам, возможно, придется долго ждать, когда мы увидим еще одного Болта. Вторая возможность заключается в том, что он изменил правила своего спорта. Болт выше других спринтеров, делает меньше шагов и выглядит более расслабленным во время подготовки. Подражая его подходу, другие юноши с подобным набором качеств могут перенять тот же стиль. Мы еще не видели ни одного из них, но 10-летнему мальчику, следившему за Олимпийскими играми в Пекине, в 2020 году будет 22. Представьте себе на Олимпиаде в Токио целый строй спринтеров, похожих на Болта.

Аналогичный вопрос можно задать и о Месси с Роналду. Не случайно они оба побили рекорд по забитым мячам в одном и том же сезоне. Они несомненно соревнуются друг с другом в течение сезона. Они могут даже возглавить новое возрождение атакующего футбола, похожее на то, что видели в 1960-х годах.

Рисунок 4.6 показывает число забитых голов за игру для обладателя Трофея Пичичи с начала вручения награды в 1929 году. Некоторые игроки (например, Тельмо Сарра в конце 1940-х – начале 1950-х) регулярно забивали больше одного гола за матч. Конечно, они играли в другое время, с меньшим количеством матчей и другими тактическими расстановками. Но это именно та точка, которую мы должны рассмотреть. Может быть, Роналду и Месси ведут нас в новую эру футбола?

Это не просто спорт, в котором меняются правила игры. Всякий раз, когда случается тайфун, засуха, аномальная жара или наводнение, мы задаемся вопросом, видим ли мы результаты изменения климата. Межправительственная группа экспертов по изменению климата (МГЭИК) с осторожностью относится к тому, чтобы приписать любое чрезвычайное событие к выбросам парниковых газов или другим видам человеческой деятельности[40]. Однако в последние десятилетия наблюдается устойчивое увеличение продолжительности потепления и числа чрезвычайно жарких дней. Увеличилось также количество очень дождливых дней, особенно в Северной Америке и Европе[41].


Рисунок 4.6. Среднее количество забитых за одну игру голов. Учитываются только победители Трофея Пичичи.


Эти спортивные и экологические изменения в правилах показывают нам фундаментальную ограниченность таких статистических данных, как распределение экстремальных значений. Ранее я упомянул об этой ограниченности, когда писал о допущении, что в забивании голов нет тенденции в годовом выражении. Но все сходится к тому, что такая тенденция существует и в климате, и в голах, и в спринте. Эти тенденции не аннулируют статистические модели. Вместо этого мы должны воспринимать статистические модели как то лучшее, что можем сделать с учетом всех знаний о прошлом. К сожалению, мы не всегда можем знать, что готовит нам будущее.

Объективный рейтинг

Футбол – это командный вид спорта, поэтому несправедливо судить игроков исключительно по количеству забитых мячей. Криштиану Роналду совершает ударов больше, чем кто-либо другой в профессиональном футболе. И если вы бьете много, то это обязательно повлечет за собой голы. Количество совершаемых им ударов – это не только мера его собственного мастерства, но и всей команды. Я уже показал, насколько Месси зависит от товарищей по игре. Может быть, такие защитники и полузащитники, как Марсело, Хамес Родригес и Иско, заслуживают большего внимания за вклад в серию Роналду в Ла Лиге?

Полузащитников и защитников нельзя судить исключительно с точки зрения забитых голов. Существует целый ряд статистических данных, которые могут быть использованы для их оценки: голевые передачи, количество ударов в створ и мимо, пройденное расстояние, количество обводок, перехваты, процент успешных отборов и перехватов, – и много других. Эти данные доступны для каждого игрока после каждого матча. Трудность заключается в превращении этих цифр в реальные показатели эффективности.

Приведение навыков к единому измерению – это цель индекса эффективности, который каждую неделю появляется на сайте Премьер-лиги. Тут вы можете найти Команду недели, состоящую из игроков, которые выступили лучше всех на прошлой неделе. Вы также можете взглянуть на кумулятивный рейтинг и узнать, кто наиболее стабилен на протяжении сезона. Согласно этим данным, плеймейкер «Челси» Эден Азар был лучшим игроком сезона-2014/15. Другие футболисты согласились с этим – в результате Азар был выбран Игроком года по версии футболистов ПФА.

В то время как игроки решают, за кого голосовать, на основании игр против них в сезоне индекс производительности Премьер-лиги является чисто статистической моделью. Его спонсор, EA Sports, утверждает, что это объективный индекс, призванный «решать споры, используя широкий спектр статистических данных»[42]. Часто игроки и индекс совпадают в выборе лучших. Обычно большинство игроков, номинированных на премию, входят в список лучших по версии индекса. Однако, хотя он и работает хорошо, индекс производительности не настолько «объективен», насколько утверждает его спонсор.

Любой индекс, каким бы объективным мы ни хотели его видеть, сначала должен быть разработан. Задача разработки индекса эффективности была поручена двум статистикам из Манчестера: Иэну Макхейлу и Филиппу Скарфу. Они столкнулись с серьезной проблемой.

Во-первых, сложно сравнить вратарей, защитников, полузащитников и форвардов. Даже внутри этих ролей есть подкатегории (например, вингер или опорный полузащитник) и различные установки на игру (такие, как опека и подача угловых). У каждого футболиста своя роль в команде, и успех оценивается по разным критериям.

Вторая трудность связана с командной работой. Защитник может почти ничего не сделать за матч, потому что команда держит мяч на половине поля соперника и постоянно атакует. В то же время вратарь слабой команды может спасти от гола множество раз – но только потому, что ему приходится это делать.

Иэн и Фил начали с подробного изучения того, какой вклад игроки делали в игру. Они начали с создания статистической модели того, как различные вклады создают голы. В каждом матче они подсчитывали, как часто игроки выполняли определенные действия, включая передачи, отборы, навесы, дриблинг, блокировки и выносы, а также как часто получали желтую или красную карточку. Затем они использовали статистическое соответствие, чтобы увидеть, насколько хорошо количество этих действий предсказывало, сколько ударов по воротам нанесет их команда и команда соперника. Статистическое соответствие дает измерение эффекта (положительного или отрицательного), оказанного на создание моментов. Они обнаружили, что чем больше команда совершает передач, тем больше моментов создает; навесы – один из наиболее перспективных способов забить. Приспособив свою модель к данным Премьер-лиги с 2003 по 2006 год, специалисты подсчитали, что каждый успешный навес в плане создания моментов равен десяти обычным передачам. Удаление было эквивалентно 41 несовершенному перехвату.

Их статистическая модель позволила количественно оценить эффект, который оборона и полузащита оказывают на построение атаки. Затем Иэн и Фил включили вероятность успешных ударов и спасений, что позволило им учесть влияние нападающих и вратарей на создание гола и его предотвращение. Метод «объективен» настолько, насколько способен быть, в том смысле что полностью основан на количестве различных действий, выполняемых на поле. Он использует действия каждого игрока, связывает их с шансами на победу и выясняет, какие игроки вносят наибольший вклад.

Когда Иэн и Фил создали модель из исторических данных, они опробовали ее в сезоне-2008/09, чтобы определить лучших игроков. Они проанализировали, сколько различного рода действий каждый игрок совершил в течение сезона, и подсчитали индекс для каждого из них. Это был последний сезон Криштиану Роналду в «Манчестер Юнайтед», где он стал лучшим бомбардиром. Рио Фердинанд, Неманья Видич и Райан Гиггз сыграли решающую роль в игре команды. «Ливерпуль», в основе которого играли Джейми Каррагер, Стивен Джеррард и Дирк Кейт, всерьез боролся за победу в чемпионате. Гарет Барри и Габби Агбонлахор помогли «Астон Вилле» квалифицироваться в еврокубки.

Как вы считаете, кто был лучшим игроком по этой модели? Это был вратарь «Фулхэма» Марк Шварцер. Он набрал 7,29 по индексу влияния на результат, на втором месте шел Барри с показателем 7,06, а за ним расположился Сол Кемпбелл из «Портсмута» с 6,86. Роналду даже не попал в топ-20, как и любой другой игрок «Юнайтед». Фактически в списке фигурировал только один нападающий, Николя Анелька из «Челси», и один полузащитник, Гарет Барри. Все остальные были вратарями и защитниками.

Не в обиду Шварцеру будет сказано. Он провел отличный сезон и был признан игроком года в «Фулхэме». Но 37-летний австралийский вратарь, возглавивший рейтинг, был не совсем тем, что хотел увидеть спонсор. Хотя его выступления были важны, было бы разумно, чтобы итоговая позиция команды в лиге также была частью рейтинга.

В своей научной статье об этой системе Иэн и Фил защищали свою модель вклада в матч[43]. Когда они начали исследовать, почему нападающие и атакующие полузащитники не занимали высокие позиции в рейтинге, они обнаружили причину: эти футболисты транжирили голевые моменты. В частности, Фрэнк Лэмпард оказался «крайне изменчивым» в своих ударах. Защитники были оценены выше, потому что их перехваты и блокировки препятствовали забитым голам. Игроки обороны предотвращают гораздо больше потенциальных голов, чем нападающие забивают, что делает их вклад более весомым.

Иэн и Фил представили результаты своих научных исследований. Поскольку они были прагматичными людьми, то после разговора с представителями Премьер-лиги они представили новый индекс, в котором добавили очки за победный матч и общее количество голов, а также за коэффициент результативности, голевые передачи и матчи на ноль. Эти поправки развернули индекс в пользу нападающих. И Анелька, который был высоко оценен и в прошлой версии, возглавил список.

Этот комбинированный индекс используется Премьер-лигой до сих пор[44]. В настоящее время там преобладают атакующие полузащитники и форварды, и они же, как правило, являются игроками, за которыми мы любим наблюдать. Но стоит помнить, что в рамках статистики, включающей действия, которые направлены на создание моментов или предотвращение голов оппонента, полузащитники и нападающие не обязательно являются лучшими игроками. Есть невоспетые вратари и герои обороны из «Кристал Пэлас», «Вест Бромвич Альбион» и «Сток Сити», которые никогда не попадают в первую десятку Премьер-лиги, но все же возглавляют список Иэна и Фила. Эти футболисты – настоящие звезды статистики.

ФК «Аналитика»

Тренеры не могут следить за каждым матчем и оценивать каждого игрока по всему миру. В идеале они хотели бы иметь доступ к конкретным цифрам, чтобы найти восходящих звезд как можно раньше. И такие данные действительно доступны. Команды могут просматривать массивные онлайн-базы данных ключевой статистики игроков. Хорошей отправной точкой является база данных в компьютерной игре Football Manager. Статистика игроков в реальном времени собирается любителями компьютерной игры, которые смотрят игры нижних дивизионов и молодежных команд и осуществляют классификацию. Недавно эта база данных была куплена спортивной компанией Prozone, которая теперь поставляет ее в клубы.

Вопрос только в том, как лучше всего использовать все эти данные? В бейсболе хорошо известно использование статистических данных. Американский бейсбол имеет долгую историю использования средних значений для отбивающих и подающих, времени пробега и индекса принимающих для оценки производительности игрока. Успешное использование этих характеристик при продаже и покупке игроков хорошо описано в книге (и фильме) «Человек, который изменил всё». Статистический подход теперь широко применяется во всем спорте[45].

В футболе наличие команды усложняет задачу статистики в гораздо большей степени, чем в бейсболе. Защитник может возглавить статистику возврата мяча из-за определенной роли, которую ему доверил тренер, или потому, что его товарищи по команде продолжают терять мяч, или даже потому, что он плохо расположен, чтобы сделать перехват в ранней фазе. Нападающий может совершить больше ударов, но команде было бы лучше, если бы он больше пасовал. Задача заключается в том, чтобы отделить одного игрока от целой команды. Защитники, играющие в клубах из нижней половины таблицы, сталкиваются с более сложными ситуациями, чем их коллеги из топ-команд. И у нападающих из сильнейших клубов больше шансов забить, чем у тех, чья команда находится в зоне вылета.

Отдельных игроков нельзя правильно оценить, если не принимать во внимание команду, в которой они играют. В своей книге «Игра чисел» Крис Андерсон и Дэвид Салли объясняют потенциальную неудачу или успех футбольной команды с точки зрения ее самой слабой связи[46]. Они используют аналогию между значимостью функции каждого из компонентов космического корабля и той важной ролью, которую играет каждый игрок в команде. Их совет футбольным клубам заключается в том, чтобы меньше сосредотачиваться на незначительных улучшениях – например, не тратить ресурсы на покупку форварда, чьи показатели конверсии чуть выше. Вместо этого необходимо искать игроков, которые подходят к структуре команды. Так клубы укрепляют состав в самом слабом месте.

Аналитические компании знают об ограничениях статистики игроков и прилагают все усилия, чтобы улучшить положение вещей. Компания Дэна Альтмана North Yard Analytics использует подробные данные передач от компании Opta, которая специализируется на анализе выступлений игроков, для оценки общего влияния игрока на поле. Дэн оценивает игроков с точки зрения того, как далеко они заходят с мячом в разных частях поля и как они влияют на удары по воротам. Например, он проанализировал выступления защитника Лейтона Бейнса в сезоне-2013/14 и показал, что в действиях англичанина явно преобладает фокус на половину поля соперника[47]. По сравнению со среднестатистическим левым защитником в Премьер-лиге Бейнс вносил гораздо больший вклад вдали от своих ворот, но при этом значительно меньший в ситуациях, когда мяч находился на своей половине. Любая команда, которая захочет подписать Лейтона, должна иметь в своем составе сильного левого центрального защитника, который будет страховать зону, в то время как Бейнс будет уходить вперед. Построение команды – это объединение всех кусочков воедино.

Статистическая разведка, вероятно, не так важна для богатейших клубов, в которых уже есть армия скаутов. Они ищут новые таланты и борются за подписание их в свои академии. Но небольшие клубы могут получить преимущество с помощью отслеживания цифр. В 2014 году датский клуб «Мидтьюлланн» был куплен Мэтью Бенхэмом, владельцем букмекерского сайта Matchbook и сервиса спортивного моделирования Smartodds. Бенхэм специализируется на использовании математических моделей для прогнозирования результатов. Им создана обширная база данных о производительности игроков и команд. Статистические методы помогли ему сколотить целое состояние на ставках. В «Мидтьюлланне» и в английском «Брэнтфорде», которым он также владеет, Бенхэм стремится интегрировать подход математического моделирования в работу футбольных клубов.

Спортивный директор «Мидтьюлланна» Клаус Штайнлейн сразу увидел преимущества такого владельца. «Раньше у нас был всего один скаут, при этом он половину времени был еще и тренером, – рассказал Штайнлейн журналисту Guardian Шону Инглу. – Теперь у нас есть команда в Лондоне, которая обрабатывает огромные объемы данных и предлагает подходящих игроков»[48]. «Мидтьюлланн» использует базу данных для поиска игроков, которые потенциально могут вписаться в состав команды, и лишь потом просматривает игрока и говорит с ним лицом к лицу. Статистика – это отправная точка для разведки, но не замена для нее.

Научный подход к футболу широко применяется в «Мидтьюлланне», и не только для разведки. У них есть тренер по ударам, который тщательно анализирует, как игрок подкручивает мяч при ударе. Благодаря основательному изучению стандартных положений команда значительно прибавила в количестве забитых голов со штрафных и угловых ударов. В перерыве главный тренер получает анализ шансов, созданных его командой и соперником, и может изменить тактику в соответствии с этими данными. Летом 2015 года такой подход окупился: «Мидтьюлланн» выиграл Суперлигу Дании впервые в своей истории.

Возможно, «Мидтьюлланн» представляет будущее футбола, где наука должным образом интегрирована в подход клуба. Но этот аналитический подход не будет основываться на наивных статистических показателях способностей игрока. Он будет сосредоточен на создании команды. Также аналитики не отрицают, что игроки время от времени добиваются абсолютно неожиданных и исключительных результатов. И ни одна команда не хочет упустить следующего Месси, потому что в это время смотрит в экраны мониторов. Интеграция математики и науки в футбол способствует выбору сбалансированного решения. Мы только в начале пути к правильному пониманию баланса.

Глава 5