Гладиаторы, пираты и игры на доверии. Как нами правят теория игр, стратегия и вероятности — страница 12 из 26


Как сказано выше, это симметричная игра: иными словами, оба игрока в равных условиях. Конечно же это означает, что Б в своей камере проводит такие же расчеты и приходит к тому же выводу, понимая, что предательство – это его лучший выбор. И что это нам дает? Оба игрока рационально оценили друг друга, и итог оказался плохим для каждого. Я даже могу представить, как годом позже А и Б прогуливаются по тюремному дворику, посматривают друг на друга, чешут затылки и гадают: «Как же так получилось? Так странно! Если бы мы только лучше понимали “Дилемму заключенного” и суть этой игры, уже бы вышли на свободу!»

В чем ошиблись А и Б? Да и ошиблись ли они? В конце концов, если мы последуем их логике, то покажется, что оба, вероятно, поступили правильно: решили сперва позаботиться о себе, и каждый понял, что ему лучше всего предать – вне зависимости от того, что выбирал другой. И потому каждый предал – и ни один из них ничего от этого шага не получил. По сути, оба проиграли.

Должно быть, мои умные читатели уже поняли, что этот итог – случай, когда игроки следуют стратегии «предательства» и платят ее цену (18, 18), – тоже является равновесием Нэша.

Равновесие Нэша – это набор стратегий, в соответствии с которыми ни один игрок не сожалеет о выбранной стратегии и ее результатах – постфактум. (Не забывайте, что игроки контролируют только свои собственные решения.)

Иными словами, логика такова: если другой выбрал предательство, значит, я, тоже предав, поступил верно. Исход (18, 18) – это равновесие Нэша, ведь как только игроки выбрали стратегию «предательства», один из них, решив в последнюю минуту хранить молчание, проведет 20 лет в тюрьме вместо 18, то есть проиграет и всю жизнь будет сожалеть о своем шаге. В то же время он не будет сожалеть, если выберет стратегию «предательства» – стратегию Нэша. Так что здесь вопрос не о победе или поражении, а о том, будут ли игроки сожалеть о сделанном выборе, узнав о решении другого игрока.

А вот молчание – это не стратегия Нэша. Ведь если вы знаете, что другой будет молчать, то вам лучше его предать. Так вы полностью избавите себя от опасности тюрьмы, и награда будет больше, чем за ваше молчание. Этот пример показывает, что, наряду с прочим, стратегия Нэша может быть неразумной: вас приговаривают к 18 годам тюрьмы, когда вы могли отсидеть всего год. По сути, в «Дилемме заключенного» скрыт конфликт двух логических обоснований – личного и группового. Каждый заключенный делает лучший выбор для себя самого, но как группа… страдают оба.


Когда каждый игрок совершает лучший для себя выбор и не думает о том, какими последствиями обернутся его действия для других игроков, исходом может стать всеобщая катастрофа. Во многих ситуациях эгоистичное поведение не только влечет проблемы с моралью, но и стратегически неразумно.

Так как нам решить эту головоломку?


Вот один вариант: предположим, что А и Б – не рядовые преступники, а члены серьезной криминальной группировки. В день, когда они давали клятву, крестный отец предупредил их: «Возможно, вы слышали кое-что о “Дилемме заключенного” или даже читали о ней научные статьи. И вот что я вам скажу: мы не терпим предателей. Если вы предадите кого-то из своих, – почти прошептал он, – вы умолкнете очень надолго… навечно. И не только вы: мои люди заставят навеки умолкнуть каждого, кто вам дорог. Вы ведь знаете, мне по душе тишина».

Теперь, когда мы знаем о таком, от дилеммы почти ничего не остается. Оба пленника прибегнут к Пятой поправке, откажутся говорить и даже выиграют на этом, ведь они отправятся в тюрьму только на год. Суть такова: если сократить число вариантов выбора, итог оказывается лучше – вопреки расхожему мнению о том, что все иначе. И, когда крестный отец велит своим арестованным приспешникам быть тише воды и ниже травы, итог хорош для обоих преступников… хотя вот о полиции и законопослушных гражданах этого не скажешь.

Еще один (юридический) пример возможного соглашения, способного разрешить «Дилемму заключенного», – это переводной вексель, орудие делового мира. Торговец А выписывает вексель, по которому приказывает банку заплатить торговцу Б указанную сумму, но только если товары, которые доставляет последний, в точности соответствуют коносаменту, который подписали А и Б. Так, торговец А позволяет банку осуществлять надзор и над собой, и над торговцем Б. Как только А отдает деньги на хранение в банк, он уже не может обмануть (предать) Б, поскольку только банк может решать, соответствуют ли товары Б коносаменту, и А уже не может это определять. Впрочем, если Б решит обмануть (предаст), он не получит ни гроша; а если Б останется верным соглашению (промолчит) и если его товары будут такими, о каких договорились А и Б, ему заплатят в полной мере.

В реальной жизни (если вообще существует реальная жизнь) таких дилемм немало, и оказывается, что и в делах, и в имитационных играх люди часто склонны предавать друг друга.

Даже в «То́ске» Джакомо Пуччини встречается классический случай «Дилеммы заключенного», который оканчивается двойным предательством. Скарпиа, злой шеф полиции, дает Тоске обещание: если та отдаст ему себя, он не убьет ее возлюбленного, приговоренного к расстрелу, и патроны будут холостыми. Тоска соглашается провести с ним ночь. Но оба друг друга обманывают: Тоска закалывает шефа полиции кинжалом, позже солдаты расстреливают ее любимого настоящими пулями – и сама она совершает самоубийство. Какой классический оперный финал! А какая музыка!

В «Дилемме заключенного», а может быть, и в «Тоске» несомненно одно: даже если игроки согласятся не предавать друг друга (ибо знакомы с дилеммой), возможно, им будет трудно исполнить обещанное. Предположим, что, перед тем как арестованных разводят по камерам, они соглашаются в том, что их случай – это как раз «Дилемма заключенного», и решают, что в жизни не станут свидетелями обвинения, даже если им предоставят шанс: они будут немы как могила и отбудут в тюрьме свой год. Впрочем, когда их разводят по разным камерам, оба не могут унять сомнений: а сдержит ли другой свое обещание? Итог здесь будет таким же: они снова решат, что лучше всего предать. Если А предаст Б, то получит свободу; но, если оба предадут друг друга, они сядут в тюрьму не на 20, а только на 18 лет. И даже если прежде они заключили сделку, теперь оба нарушают ее условия.

Может быть, это решение покажется абсолютно иррациональным, а его последствия – гибельными. И возможно, рационально мыслящий заключенный придет к иному выводу: если другой тоже понимает, что 18 лет в тюрьме – это намного хуже, чем год, то и ему лучше хранить молчание, и именно так он и поступит. Некоторые эксперты в теории игр истинно верят в то, что оба рационально мыслящих игрока будут молчать. Сам я не понимаю, в чем истоки этой уверенности. В конце концов, если бы я сам был в такой ситуации, я бы не стал делать небезопасных предположений о мыслях другого игрока, а еще я бы понял, что предательство – это мой лучший выбор. Да, я ненавижу это признавать, но я бы предал другого парня. А он бы предал меня, и мы бы на годы оказались за решеткой, пытаясь понять, что пошло не так.

Не означает ли «Дилемма заключенного», что люди вообще не способны к сотрудничеству – по крайней мере, не под угрозой тюрьмы? В чем смысл этой дилеммы? Может показаться, что этот вывод неизбежен. И в этой игре, и в сходных условиях люди склонны предавать друг друга. С другой стороны, мы знаем, что люди сотрудничают, причем не только после задушевной беседы с главным мафиози. Как сгладить это явное противоречие?

Когда я впервые об этом задумался, я не мог найти ответа до тех пор, пока не вспомнил, как служил в армии и как впервые сел за руль. В армейские годы я всегда мог попросить кого-нибудь о серьезном одолжении, и люди часто проявляли отзывчивость. Я мог попросить сослуживцев по роте подменить меня на заданиях, мог даже пойти в увольнительную взамен кого-то, кому подходил черед. Потом я отслужил и получил водительские права – довольно поздно, но как уж вышло. Помню, как я отправился в свою первую поездку и остановился на стоп-линии, стоял и ждал, пока хоть кто-то пропустит меня и даст влиться в поток транспорта, а потом… ничего не произошло! Ровным счетом ничего! Машины текли мимо, их проехал, наверное, миллион, и никто даже не сбавил скорость, чтобы пустить меня на дорогу. Как такое могло случиться? Почему люди с охотой помогали мне в серьезных, очень важных делах, но никто не мог всего лишь на пару мгновений сбавить скорость, чтобы я поехал дальше? Это же такая мелочь! Я не мог ответить на этот вопрос, пока не прочел о различиях «дилемм заключенного» в однократной игре и в ее итеративных версиях – и все встало на свои места.

Мы должны провести различие между теми игроками, которые играют в «Дилемму заключенного» один раз и больше никогда не встретятся, и теми, кто играет в нее не единожды. Первая версия неизбежно закончится обоюдным предательством. Но итеративная версия «Дилеммы заключенного» (то есть игра с повторами) отличается по самой своей сути. Когда я просил армейских друзей об одолжении, они понимали или подсознательно чувствовали, что мы сыграем в эту игру снова – и что я отвечу взаимностью на всю проявленную ко мне благосклонность. В повторяющихся играх игроки ожидают награды за то, что позволяют другим время от времени «победить». Когда кто-то уступает мне дорогу, у меня нет времени остановиться и записать номер его машины, чтобы вернуть должок в следующий раз, когда мы пересечемся на дороге. Это будет иррационально. Впрочем, люди склонны к сотрудничеству, когда сталкиваются с «тенью грядущего», как говорил Роберт Аксельрод, – иными словами, когда будущие встречи ожидаются как реальная возможность, мы мыслим по-другому.

На «Дилемме заключенного» основан популярный эксперимент, проведенный на многих мастер-классах для руководителей. Участники разбиваются попарно, каждому дают, скажем, по $500 и по несколько карточек, на которых написано «М» и «П» («молчание» и «предательство»), и говорят, что им предстоит сыграть в игру друг с другом 50 раз. Суть игры в том, чтобы потерять как можно меньше долларов, и ее правила скрывают тот факт, что сама она представляет собой «Дилемму заключенного», так сказать, «под карнавальной маской». Если оба игрока в паре выбирают карту «М» (и соглашаются молчать), у каждого из его $500 вычитается $1 (как один год в тюрьме); если оба выбирают «П» (и предают друг друга), они теряют по $18; а если один выбирает карту «М», а другой – карту «П», то последнему позволяют сохранить все $500, а от денег первого отнимают $20. Позвольте мне еще раз привлечь ваше внимание: каждая пара играет в игру 50 раз.