Большинство игроков очень быстро понимают правила игры – в конце концов, они ведь руководители, – но это редко им помогает. Они не видят подвоха, производят те же расчеты, как и те, кто играет однократно, и приходят к выводу о том, что, независимо от действий другого игрока, их лучший выбор – карта «П». Они играют, теряют $18, потом еще $18, потом еще $18 и так далее – и понимают, что эта стратегия в корне неправильна! Ведь если они 50 раз потеряют по $18, они не только лишатся всех своих карманных денег (исходных $500), но и останутся должны $400 устроителю эксперимента! Именно на этой стадии, чаще всего после третьего раунда, мы впервые замечаем попытки сотрудничества. Игроки стратегически выбирают карту «М» и надеются на то, что их партнер поймет намек и поступит так же, что позволит им сохранить большую часть из их $500.
Видимо, Абба Эвен, государственный деятель Израиля, ныне покойный, был прав, когда сказал: «История учит нас тому, что и люди, и народы поступают разумно, лишь когда исчерпают все остальные альтернативы».
В итеративной версии «Дилеммы заключенного» есть подвох, когда мы близимся к последнему, 50-му, раунду. На этом этапе я мог бы сказать себе так: зачем сигналить о том, будто мне нужно содействие? Уже нет никаких причин! Что бы ни выбрал другой, если я предам, то потеряю меньше. Но, как только вы начнете так думать, вы рискуете попасть в «бесконечную петлю»: я уверен, что итог 50-го раунда неизбежен, значит, незачем сотрудничать и в 49-м, и, видимо, в нем мы и предадим друг друга, а потому предам-ка я первым! По такой логике то же соображение теперь применимо и к 48-му раунду! И у нас новый парадокс: если оба игрока столь рациональны, возможно, им следует предать друг друга с самого начала!
Видите? Обратный расчет может не принести должной выгоды. Он только все осложняет. Это «парадокс неожиданного экзамена» или «парадокс висельника», и вот в чем его суть. В пятницу, на последнем уроке, учитель объявляет, что на следующей неделе состоится неожиданный экзамен. Все ученики бледнеют от страха, но Джо просит слова. «Сэр! – говорит он. – Так не получится! У нас не может быть неожиданного экзамена на следующей неделе!» «Почему?» – спрашивает учитель. «Так ясно же, – отвечает Джо. – В пятницу его быть не может. Ведь если его не будет в четверг, тогда мы будем знать, что он пройдет в пятницу, и это уже не будет сюрприз. То же самое и в четверг – ведь если его не будет в понедельник, во вторник и в среду, а пятницу мы уже вычеркнули, то он должен пройти в четверг – и теперь мы о нем знаем, так что вы нас не удивите, сэр!»
Хотя не очень понятно, что такое «неожиданный экзамен», да и Джо был весьма убедителен, учитель все же удивил учеников, слишком поверивших в логику Джо, и устроил экзамен во вторник.
Та же логика применима к «Дилемме заключенного» с определенным числом раундов (на мастер-классах я обычно не разглашаю заранее их число), поскольку игроки начинают думать так же, как Джо о своем экзамене. Но этот перебор с возвратами только заводит в тупик.
Вышеупомянутый Роберт Аксельрод – профессор государственной политики в Мичиганском университете. Но он изучал и математику и прославился тем, что принял участие в разработке компьютеризованных вариантов «Дилеммы заключенного»; о них можно прочесть в его книге «Эволюция сотрудничества», вышедшей в 1984 г.[15]. Он просил многих людей, умных и мудрых, выслать ему искусные стратегии для итеративной версии «Дилеммы заключенного», определив правила игры так: если оба игрока хранят молчание, каждый получает 3 очка; если оба выбирают роль предателей, каждый получает 1 очко; если они совершают разный выбор, предатель получает 5 очков, а стойкий и молчаливый – 0. Аксельрод объявил, что для каждой игры отведено 200 раундов, и попросил предложить стратегию. Но что он имел в виду, говоря о «стратегии»?
В итеративной версии игр, основанных на «Дилемме заключенного», есть множество стратегических возможностей. «Всегда молчать» – одна из простейших стратегий, но она, несомненно, неразумна: предательство остается безнаказанным и второй игрок может легко сколотить капитал. «Всегда предавать» – гораздо более крутая стратегия. Можно выбирать всевозможные, даже самые странные стратегии: чередовать предательство с молчанием, подбрасывать монетку, выбирать случайным образом…
Вам, мой искушенный читатель, уже, наверное, ясно, что лучшая стратегия – отвечать на действия противника. И правда, на первых олимпиадах, где играли в компьютерные версии игр, основанных на «Дилемме заключенного», стратегия, приводящая к победе, была описана как «око за око». Кроме того, она была самой короткой: четыре строки на бейсике.
Создателем этой стратегии стал Анатолий Рапопорт (1911–2007), уроженец России, работавший в США. Его шаблон таков: в первом раунде вы храните молчание – иными словами, играете красиво. Потом и далее, начиная со второго раунда, вы просто повторяете предыдущий ход противника: если в первом раунде он промолчал, вы молчите во втором. Спрашивайте не о том, что вы можете сделать с противником, но о том, что он прежде сделал с вами, и поступайте так же. Стратегия «око за око» позволяла заработать в среднем 500 очков, а это довольно много. Не забывайте: если оба игрока решают молчать, они получают по 3 очка за раунд, а значит, 600 очков за игру – это и правда очень хороший результат. Эта стратегия получила высшие оценки.
Что интересно, самая сложная стратегия, с самым длинным описанием, получила низший балл. На второй олимпиаде появился подход «око за два»: если другой предает, вы даете ему возможность искупить грехи, и только если он снова выбирает предательство, вы отвечаете на это своим предательством. Эта стратегия еще «красивее», чем исходная «око за око», но ее красота может вам слишком дорого обойтись: стратегия заняла не слишком высокое место.
Услышав о стратегии «око за око», люди, не знающие ничего о теории игр, обычно протестуют: «И это великое открытие? Естественно, так все и делают!» В конце концов, стратегия «око за око» – это не какая-нибудь поразительная математическая находка, претендующая на Нобелевскую премию, а просто наблюдение за тем, как обычно ведут себя люди: ты ко мне с добром, и я к тебе с добром; ты ко мне со злом, и я тебе той же монетой; око за око, зуб за зуб, и все такое…
В дальнейшем Аксельрод выяснил, что для успеха стратегии «око за око» игроки должны следовать четырем правилам:
1. Будьте джентльменом. Никогда не предавайте первым.
2. Всегда отвечайте на предательства. Слепой оптимизм – плохая идея.
3. Умейте прощать. Как только соперник перестает предавать, прекращайте и вы.
4. Не завидуйте. В тех или иных раундах вам не выиграть, но в общем итоге вы одержите победу.
Еще в одну интересную версию «Дилеммы заключенного» играют несколько игроков зараз. Один из многих примеров такого варианта – охота на китов. Все страны, чья экономика широко полагается на китобойный промысел, мечтают возложить строгие ограничения на любую другую страну (стратегия молчания), а своим китобоям позволить бить китов сколько душа пожелает (стратегия предательства). Проблема здесь очевидна: если все китобойные страны будут «предателями», итог будет губительным для всех этих стран (не говоря уже о китах, которые так могут просто вымереть). Это случай игры, основанной на «Дилемме заключенного», только для многих игроков. То же можно сказать и о лесоразведении, и о климатических соглашениях (здесь есть искушение разорвать договор, загрязнить все что можно и получить прибыль, но каждому лучше, если все согласятся не вредить окружающей среде), и о более прозаических вопросах, той же ежемесячной плате на содержание кондоминиума (дома-совладения): платить иль не платить? Вот в чем вопрос! Конечно, каждый жилец был бы только рад, если бы все платили свои взносы – то есть все, кроме него. Тогда все было бы прекрасно: цвели бы сады, в фойе бы неизменно горел яркий свет, лифты работали бы без перебоев, а он бы не платил ничего! Проблемы начинаются тогда, когда все больше и больше жильцов (и наконец – все) начинают думать, что, возможно, им тоже не стоит платить взносы, – и прекращают это делать. Представьте себе, какие будут лифты и сады в таком кондоминиуме.
Кстати, если бы немецкий философ Иммануил Кант (1724–1804) мог сегодня сказать нам несколько слов, он бы предложил разрешить дилемму следующим категорическим императивом (который я адаптировал из слов самого Канта): Прежде чем действовать, подумайте вот над чем: желаете ли вы, чтобы ваше действие стало вселенским законом? Кант, видимо, ожидал бы от жильцов кондоминиума такого ответа: «Конечно, мы не хотим, чтобы все-все уклонялись от ежемесячной оплаты. Да, это может оказаться весьма неприятным, так что нам, скорее всего, стоит заплатить». Все это очень хорошо, но, вместо того чтобы ждать, пока все жильцы прочтут Канта, лучше бы ввести уставные нормы насчет таких оплат. В делах оплат и налогов люди, как правило, не платят добровольно… даже если они читали Канта.
О сходной проблеме испанский философ Хосе Ортега-и-Гассет (1883–1955) сказал: «Закон рожден отчаянием в природе человека».
Какой была бы лучшая стратегия для итеративной «Дилеммы заключенного», рассчитанной на нескольких игроков? Что же, здесь все сложнее. Например, стратегию «око за око» здесь не применить. Когда я играю против одного соперника, я знаю его ход и отвечаю соответственно; но, если играть против 20 жителей, восемь из которых не внесли оплату за месяц, а двенадцать внесли, – во что превратится такая стратегия? Как мне играть? Последовать за большинством? Платить лишь после того, как заплатили все остальные? А если заплатит только один, убедит ли это меня тоже внести свою плату? И математически, и интуитивно все это очень сложно, и пока что мы просто оставим этот вопрос в стороне.
7. Пингвинья математика
Эта глава посвящена животным – экспертам в умении играть и звездам кино под названием «Эволюционная теория игр». Мы обсудим то, как связано с альтруизмом странное поведение газели Томсона, и присоединимся к группе пингвинов, ищущих добровольца, а прекрасное понятие из эволюционной теории игр позволит нам шире взглянуть на равновесие Нэша.