[279] (как сразу же ответил Паскалю Ферма, а Паскаль раздраженно дал понять, что уже сообразил), что шансы Джеффа на разорение больше в тысячу с лишним раз! Небольшой сдвиг в случайном блуждании превращается в задаче о разорении игрока в колоссальное неравенство. Джеффу может повезти, и он пару раз выбросит 14 до того, как Акбар выбросит 11, однако его преимущество вряд ли будет длительным, не говоря уже о разорении соперника.
Самый простой способ посмотреть, как это работает на практике, – заменить задачу более простой (детским примером, как ее любят называть математики). Предположим, Акбар и Джефф играют в игру, где шансы Акбара на победу в одной партии равны 60 %, и побеждает игрок, который первым выиграет две партии. Вероятность того, что это сделает Акбар (и тем самым выиграет в целом), составляет 0,6 × 0,6 = 0,36, или 36 %. А вероятность, что Джефф выиграет первые две партии подряд (и тем самым игру в целом), равна всего 0,4 × 0,4 = 0,16, или 16 %. В оставшихся 48 % случаев игроки выиграют по одной партии и игра продолжится. Акбар выиграет следующую партию в 60 % от этих 48 % случаев, то есть в 28,8 % игр (0,6 × 0,48 = 0,288). В оставшихся 40 % от этих 48 % случаев, то есть в 19,2 % игр (0,4 × 0,48 = 0,192), победит Джефф. Следовательно, общие шансы Акбара на победу (со счетом 2:0 или 2:1) составляют 36 % + 28,8 % = 64,8 %. Это несколько выше, чем его шансы выиграть каждую отдельную партию. Если игра ведется до трех побед в отдельных партиях, то вы можете убедиться, что шансы Акбара на общую победу возрастают примерно до 68,3 %. Чем длительнее игра, тем выше шансы, что победит более умелый игрок[280].
Принцип разорения игрока лежит в основе спортивных турниров. Почему мы не определяем чемпиона мира по бейсболу в одной-единственной игре или победителя какого-нибудь теннисного турнира в одном гейме? Потому что это слишком ненадежно: в одном конкретном гейме более сильный теннисист вполне может проиграть, а цель турнира – определить действительно лучшего.
Вместо этого теннисный сет продолжатся до тех пор, пока один из игроков не выиграет шесть геймов с опережением как минимум на два гейма. Это трудно описать словами, поэтому давайте посмотрим на рисунок.
Вы можете представлять теннис как случайное блуждание по этой сетке; каждый раз после сыгранного гейма вы перемещаетесь вправо или вверх и останавливаетесь, когда ударяетесь об одну из границ, то есть «разоряете» одного из игроков (конец сета). Если игрок А чуть-чуть лучше, чем игрок В (то есть вероятность шага вверх больше, чем вправо), то шанс закончить матч на верхней границе выше, чем на нижней[281]. Поскольку длинный диагональный коридор на диаграмме бесконечен, для продолжительности сета не установлено никаких ограничений. Если игроки не будут одинаково сильны, то крайне маловероятно, чтобы блуждание зайдет очень далеко по коридору, не ударившись о его стенки. Тем не менее такое бывало. Например, матч Джона Изнера и Николя Маю 23 июня 2010 года на Уимблдоне[282]. Два игрока то выходили вперед, то сравнивали счет – гейм за геймом. Шли часы. Солнце стало садиться. Табло на корте выключилось при счете 47:47, поскольку это был максимум, на который оно запрограммировано. Примерно в 21:00 при счете 59:59 темнота помешала играть дальше. На следующий день Изнер и Маю ее возобновили, продолжая брать геймы на своей подаче. Наконец, очередной удар Изнера[283] принес ему выигрыш 138-го гейма и общую победу 70:68 в пятом сете (и в матче). Изнер сказал: «Ничего подобного больше не повторится. Никогда»[284].
Но могло бы! Такие правила могут показаться странными, но для меня это часть очарования тенниса. Ни часов, ни сирены, ни ограничения на количество геймов. Единственный итог – кто-то должен выиграть[285].
Большинство спортивных турниров проходят иначе[286]. Когда в финале Мировой серии играют две бейсбольные команды, победителем станет та, которая первой одержит четыре победы. Поэтому серия не может длиться дольше семи игр: при счете 3:3 следующая будет решающей. Нельзя, чтобы матчи превратились в ультрамарафон, как у Маю и Изнера[287]. Геометрия границ Мировой серии отличается.
Мы снова пришли к компромиссу между точностью и скоростью. Вы можете представлять теннисный сет как алгоритм, цель которого – выяснить, кто лучше играет в теннис, равно как Мировая серия – это алгоритм, позволяющий узнать, кто лучше играет в бейсбол. (Спортивное мероприятие – это не только данный алгоритм; оно предназначено для развлечения, получения налоговых поступлений, ослабления недовольства населения и т. д.; но такой алгоритм – один из его аспектов.) Сет в теннисе требует больше времени для вычислений и более точно выявляет мелкие различия между уровнем мастерства игроков; Мировая серия грубее, и здесь работа выполняется быстрее. Разница проистекает из геометрии границы: она квадратная и прямолинейная, как в Мировой серии, или длинная и вытянутая, как в случае теннисного сета? И эти варианты не единственные. Вы можете использовать другие схемы при поиске компромисса между точностью и скоростью с помощью выбора формы. Мне всегда нравилась такая:
В этой системе действует «правило милосердия»: вам засчитывается поражение в серии, если после трех игр вы проигрываете 3:0 (название означает, что аутсайдеру не приходится лишний раз унижаться). С другой стороны, если обе команды выиграли по три игры (что свидетельствует о равенстве сил), то для чемпионства требуется одержать пятую победу. Да, вы потеряете те редкие захватывающие моменты, когда команда отыгрывается после 0:3, как бейсболисты «Бостон Ред Сокс» против «Нью-Йорк Янкиз» в 2004 году, однако такие события случаются редко. И разве это будет слишком высокой ценой за возможность сыграть восьмые матчи и девятый матч «победитель получает все», когда команды одинаково сильны?
Вернемся к го. Мы видели, что исход случайного блуждания может подсказать, где находилась ваша исходная точка. Разумно предположить, что позиция, в которой Акбар с большой вероятностью выиграет при случайных ходах, сохранит это свойство, если он будет по-настоящему настроен на победу. Вы можете это проверить, играя в го с помощью описанной стратегии: на каждом этапе переходите в позицию, у которой самая высокая оценка в пьяном го. Если будете пользоваться этим правилом, то хоть и не обыграете опытного противника, но точно будете играть лучше любого новичка.
Еще выгоднее совместить пьяные спотыкания с анализом дерева вроде того, что мы использовали для игры «Ним». Это выглядит примерно так:
Думаю, пришло время рассказать кое-что о себе. Я не умею играть в го. Партия, в которой кузен Закари сокрушил меня, была последней в моей жизни. Я даже не помню правил. Однако это не имеет значения; я в любом случае могу написать этот раздел о го, потому что дерево сообщает вам, что делать, независимо от того, знаете вы правила или нет. Дерево может быть шашечным, шахматным, деревом «Ним» или го – вы анализируете его совершенно одинаково. Все, что имеет отношение к стратегии, заключено в структуре ветвей и числах на листьях. Важна только геометрия дерева.
Числа на листьях указывают пьяную оценку для соответствующей последовательности ходов. Если Акбар делает ход А, а Джефф отвечает ходом 1, после чего они ходят наугад, то в итоге Акбар выиграет 60 % партий. Таким образом, позиция А1 получает пьяную оценку 0,4.
Однако пьяная оценка самого хода А не настолько проста. Если мы предположим, что пьяный Джефф делает после него случайный ход из трех возможных, то с вероятностью 1/3 партия перейдет в положение А1, с вероятностью 1/3 – в положение А2 и с вероятностью 1/3 – в положение А3. Из 300 пьяных попыток 100[288] закончатся в А1, и пусть Акбар выиграет из них 60, в А2 – 50 игр из 100, а в А3 – 40 из 100. В общей сложности он выиграет 150 партий из 300, то есть ровно половину. Поэтому позиция А получает пьяную оценку 0,5. Аналогичным образом мы можем найти оценки для позиции B – это 0,4, и позиции C – 0,9. (Помните, что пьяная оценка для позиции, где ход Джеффа – это вероятность того, что пьяный Джефф победит пьяного Акбара, а не наоборот.)
То, как Акбар играет в эту игру, зависит от того, когда начинается пьянка (то есть случайная игра). Если он просматривает только одну ветвь ниже по дереву, считая ее далее случайной, он выберет ход В с наименьшей пьяной оценкой. Но если он продвинется по дереву дальше, то сможет рассуждать следующим образом. Что на самом деле произойдет, если он выберет ход В? Джефф, еще трезвый как стеклышко, выберет какой-нибудь ход В2, дающий Акбару 20-процентный шанс на победу. Это лучше, чем паршивый ход С, где шансы Акбара всего 10 %, что бы Джефф ни делал дальше. Однако ход А дает Джеффу меньше: его лучший ответ – перейти в А1, где у Акбара шанс 60 %. Поэтому Акбар, думающий на два хода вниз по дереву, а не на один, сможет увидеть, что ход А лучше, чем В.
Естественно, более глубокий анализ может улучшить результат. Позиция В2 заканчивается для Акбара очень плохо, если разыгрывается наугад. Возможно, это просто объективно неблагоприятный сценарий для Акбара. Однако может оказаться, что в этой позиции у Акбара есть один потрясающий ход и много дрянных. Для Акбара, играющего наугад, такая позиция – плохая, поскольку шансы выбрать этот хороший ход невелики, а вот для Акбара, умеющего смотреть на шаг вперед, она прекрасна.