Намерения и последствия
Концептуальная структура теории игр многое проясняет. Помогает ли она объяснить поведение? Рассмотрим, как теория игр обосновывает сжигание за собой мостов или кораблей. Такое поведение может быть вызвано стратегическими соображениями, описанными в предыдущей главе, но не только ими. Оксфордский словарь английского языка приводит следующую цитату из книги Э. Р. Берроуза «Тарзан – приемыш обезьяны»: «Поскольку она боялась, что поддастся мольбам этого гиганта, она сожгла за собой мосты». Эту ситуацию нельзя считать примером стратегического рассуждения. Скорее эта женщина боится, что может уступить уговорам, если не лишит себя возможности сделать это. Даже в военной сфере такие нестратегические обоснования могут быть не менее важны, чем стратегические. Командующий может сжечь мосты, опасаясь, что страх перед врагом обратит его солдат в бегство. Он может захотеть отрезать путь к дезертирству себе самому, если боится поддаться слабости воли. Командующий А может сжечь мосты или корабли, сигнализируя командующему В, чтобы тот не рассчитывал на возможность его войска обратиться в бегство. Очевидно, именно так рассуждал Кортес, когда, сказав своим морякам (это была правдоподобная ложь), что его флот не в состоянии выйти в море, сжег все корабли, кроме одного (таким образом он мог пополнить пехоту моряками). Чтобы различать эти объяснения, необходимо определить намерения агентов. Реальные выгоды от сжигания мостов никогда не будут ни необходимыми, ни достаточными для того, чтобы дать объяснение с точки зрения ожидаемых выгод (глава III).
Хотя теория игр объясняет поведение, апеллируя к намерениям акторов вызвать определенные последствия, она может описывать ситуации, в которых действующие лица не думают о последствиях. Рассмотрим, например, взаимодействие между Европейским союзом и некоторыми его новыми членами из Восточной Европы. Старые участники могут поддаться соблазну выдвинуть такие условия членства, которые предполагают более низкие дотации сельскому хозяйству для новичков по сравнению со старыми членами такого же размера. В материальном отношении новым странам будет лучше в качестве членов ЕС второго сорта, чем если их туда не примут вовсе, хотя и хуже, чем если бы они стали полноправными партнерами. В психологическом отношении такое оскорбительное обращение может побудить их отвергнуть эти условия[263]. Предчувствуя такую реакцию, старые государства – члены ЕС могут предложить вступление на условиях полного равноправия. Вера в то, что новые страны руководствуются не только материальными интересами, может предоставить самим новичкам лучшие условия.
Поскольку я не был посвящен в ход переговоров о вступлении в Европейский союз, эти заметки являются гипотетическими. Но мы знаем, что аргументы такого рода приводились на Конституционном конвенте в Филадельфии в 1787 году в дебатах по поводу условий присоединения будущих западных штатов. Губернатор Моррис и остальные предлагали, чтобы те были приняты в качестве штатов второго сорта так, чтобы их голоса никогда не смогли отменить голосование первых тринадцати штатов. Оспаривая эти взгляды, Джордж Мейсон активно ратовал за прием новых штатов на равных с остальными условиях. Во-первых, он апеллировал к принципам: принимая западные штаты на равных, они бы сделали то, что, «как нам известно, правильно само по себе». Для тех, кто мог не принять этот аргумент, он добавлял, что новые штаты вряд ли примут такое унизительное предложение:
Если принимать западные штаты в союз, с ними следует обращаться как с равными и не подвергать унизительной дискриминации. У них такая же гордость и другие чувства, как у нас, и они либо не присоединятся к союзу, либо отвернутся от него, если во всех отношениях не будут на равных со своими собратьями.
Мейсон ссылается на «гордость и чувства» новых штатов, а не на их эгоистический интерес. Даже если странам выгоднее войти в союз на неравноправных условиях, чем не вступать в него, они могут из-за обиды остаться вне союза. В то же время он апеллирует к интересу более старых штатов, а не к их чувству справедливости. Если воспользоваться терминологией главы 4, он говорит им, что, поскольку новые штаты могут руководствоваться чувством, а не интересом, старым штатам выгодно вести себя так, как будто они руководствуются разумом, а не интересом.
Эта ситуация экспериментально изучалась при помощи игр «Ультиматум» и «Диктатор» (рис. XX.1). В игре «Ультиматум» одно лицо (Предлагающий) может предложить разделить (х: 10 – х) десять долларов между ним и другим лицом (Респондентом). Предложения принимаются только в целых долларах. Если Респондент принимает предложение, деньги делят. Если нет, никто ничего не получает. Хотя изучали многие варианты этой игры, я сосредоточусь на однократном взаимодействии в условиях анонимности. Поскольку участники взаимодействуют через компьютерные терминалы, они не знают, кто их партнер. Часто им дают понять, что экспериментатор не может определить, каков выбор каждого, тем самым препятствуя тому, чтобы на их решения повлияло желание вызвать его одобрение. Когда участники играют в эту игру многократно, они никогда не встречают одного и того же партнера, что позволяет обучаться, но не создавать себе репутацию. При таких условиях существуют максимальные возможности для того, чтобы решения отразили ничем не сдерживаемый эгоизм.
РИС. XX.1
Предположив, что оба агента рациональны, эгоистичны и владеют полной информацией о структуре выплат и что эти факты общеизвестны, Предлагающий озвучит (9: 1), а Респондент примет предложение. Если бы предложение можно было делать в центах, предлагающий предложил бы (9,99: 0,01), что было бы принято, поскольку лучше получить хоть что-то, чем ничего. В экспериментах предложения, как правило, вращаются вокруг (6: 4). Обычно Респонденты отвергают предложения, дающие им 2 или меньше[264]. Они готовы назло бабушке отморозить уши. Ясно, что одно из допущений нарушается. Благодаря условиям проведения эксперимента, мы можем исключить нехватку информации и нехватку общего знания о ней. Однако мы не можем устранить просчеты рациональности или неэгоистические мотивации.
Предлагающий может быть альтруистом, предпочитающим примерно равное разделение такому, в котором ему достается все. Хотя альтруизм в отношении совершенно незнакомых людей, которые не испытывают явной нужды, может показаться странным, это по крайней мере не противоречит рациональности. Мы, однако, можем отбросить эту гипотезу, сопоставив поведение в игре «Ультиматум» с поведением в игре «Диктатор». Последняя по сути не является игрой, поскольку в ней Предлагающий в одностороннем порядке делит деньги между собой и Респондентом, не оставляя последнему возможности ответить. Если предложения в игре «Ультиматум» были продиктованы только альтруизмом, распределение ресурсов в «Диктаторе» не должно ничем от них отличаться. Но в экспериментах поведение Предлагающего в игре «Диктатор» оказывается гораздо менее щедрым. Ясно, что поведение Предлагающего в игре «Ультиматум» определяется, по крайней мере частично, ожиданием того, что недостаточно щедрое предложение будет отвергнуто.
Чтобы объяснить этот отказ, мы должны предположить, что Респондентом будет мотивировать желание отвергнуть слишком скромные предложения и что эгоистичные Предлагающие, предвосхищая это, будут делать предложения, достаточно щедрые, чтобы их приняли. Если это объяснение верно, следует ожидать, что частота отказа при (8: 2) должна быть одинаковой, когда Предлагающий может выдвинуть любое разделение и когда он ограничен выбором (и знает об этом) между (8: 2) и (2: 8). Как показывают эксперименты, в последнем случае процент отказов меньше. Этот результат свидетельствует о том, что поведение Респондентов определяется соображениями честности. Потому что если Предлагающий выставил (8: 2), имея возможность предложить (5: 5), это рассматривается как менее честное поведение, чем когда его единственная альтернатива была в равной мере для него невыгодна. Именно намерения, а не исходы имеют значение.
Такую интерпретацию подтверждает важность взаимности в других играх, например в «Доверительном управлении» (глава XV). Иногда люди готовы наказать других за нечестное поведение, понеся некоторые издержки и не получив никакой выгоды. Такая практика, как представляется, нарушает один из канонов рациональности, перечисленных в главе XII: выбирая между совершением действия и бездействием, рациональный агент не будет действовать, если ожидаемые издержки превышают ожидаемые прибыли. Объяснения с точки зрения альтруизма или зависти не нарушают этот принцип. Для альтруиста исход может быть лучше, если он принесет выгоду другому при некоторых издержках для самого альтруиста, а для завистливого человека – если он нанесет другому вред при некоторых издержках для него самого. Такое поведение опровергает предположение об эгоистическом интересе, но не о рациональности. Напротив, объяснение с точки зрения честности противоречит допущению о рациональности. Сильная взаимность порождает поведение, подобное тому, как, споткнувшись о камень, мы в гневе пинаем его ногой: это не помогает и только усиливает боль[265].
Обратная индукция
В игре «Ультиматум» (рис. XIX.5) и других последовательных играх равновесие находят в обратной индукции. В игре «Ультиматум» Предлагающий предвосхищает реакцию Респондента на его предложение и приспосабливает к ней свое поведение. Сопутствующие этим примерам расчеты очень просты. В других экспериментах от участников могут потребоваться более сложные цепочки рассуждений. Например, двое из них проходят три раунда предложений и встречных предложений, чтобы поделить сумму денег, которая в каждом следующем раунде уменьшается на 50 %[266]. Каждый раз агент может либо принять предложение и пойти напрямую, либо сделать встречное предложение и снизить ставки. Рациональность, эгоистический интерес и общеизвестность приведут его к следующему рассуждению.
Человек, делающий первое предложение (игрок 1), должен будет учесть, предпочтет ли игрок 2 данное разделение такому, при котором он получит больший кусок от меньшего пирога. В то же время игрок 1 знает, что игрок 2 не сделает предложения, от принятия которого игроку 1 будет хуже, чем если бы он перешел к последнему раунду. На рис. XX.2 игрок 1 может получить по меньшей мере 1,25, забрав все, что осталось в третьем раунде. Таким образом, игрок 2 не может предложить ему менее 1,25 во втором раунде, оставив максимум 1,25 для себя. Зная об этом, игрок 1 предложит (3,75: 1,25), и игрок 2 примет предложение.
В экспериментах среднее предложение, сделанное игроком 1, составляет (2,89: 2,11), что значительно щедрее равновесного варианта. Очевидно, что нарушается одно или даже несколько допущений. (1) Первый игрок может быть альтруистом. (2) Он может опасаться, что другой игрок отвергнет равновесное предложение, потому что не способен понять логику обратной индукции. (3) Он сам не способен понять эту логику[267]. Первая и вторая гипотезы могут быть устранены, если сказать игрокам, что они играют с компьютером, запрограммированным на оптимальный ответ. В этом случае первое среднее предложение составляет (3,16: 1,84), то есть по-прежнему значительно больше равновесного. Поскольку участники, делающие щедрые предложения, едва ли могут испытывать альтруистические чувства к компьютеру или считать его некомпетентным, по-видимому, некомпетентны они сами.
РИС. XX.2
Проблема не в том, что это трудная задача. Как только участникам объясняют логику обратной индукции, в последующих играх они все проделывают безукоризненно. Скорее эксперимент показывает, что такого рода рассуждения людям несвойственны. Даже обычная предусмотрительность не всегда возникает спонтанно, как показывает проклятие победителя (глава XII). Нечто подобное есть и в синдроме младшего брата (глава XVIII). Не то чтобы люди, поразмыслив, не могли понять, что другие так же рациональны и способны к оценке последствий, как и они, просто у них есть стихийная склонность полагать, что другие сильнее укоренены в своих привычках и не способны приспосабливаться к обстоятельствам.
Некоторые сбои в теории игр, основанной на рациональном выборе
Из множества примеров неудач в предсказаниях, сделанных теорией игр, я хочу остановиться на «Дилемме заключенного» с конечным числом повторений, «парадоксе сетевого магазина», играх «Сороконожка», «Дилемма путешественника» и «Конкурс красоты».
Когда участники многократно играют друг с другом в «Дилемму заключенного» и знают, какой раунд будет последним, мы наблюдаем значительную долю выбора С, иногда превышающую 30 %. Интуитивно можно предположить, что игрок выберет С в одном раунде в надежде на то, что другой ответит ему взаимностью (услуга за услугу). Но если игроки применят обратную индукцию, то поймут, что в финале оба выберут D, поскольку в более поздней игре нет возможности влиять на поведение. В предпоследней игре игроки также выберут D, поскольку поведение в финале задается предшествующим рассуждением. Этот аргумент «отыгрывается назад» вплоть до первого раунда, мотивируя отказ от сотрудничества во всех играх.
Сетевой магазин имеет филиалы в 20 городах и в каждом из них сталкивается с потенциальным конкурентом. Конкурент должен решить: открывать ли магазин, чтобы разделить рынок с сетевым игроком, или отказаться от ведения дел в этом городе. Сетевой магазин имеет возможность отреагировать агрессивно, резко снизив цены, тем самым он разорит соперника, но и сам понесет убытки. Или же он может согласиться на раздел рынка. Выигрыши представлены на рис. XX.3; первое число в каждой паре – выигрыш для потенциального конкурента.
Обратная индукция в одной игре дает (5: 5) в качестве равновесного исхода: конкурент приходит на рынок, и сетевой магазин соглашаться на раздел. Но задумавшись о дальнейших проблемах, сетевой магазин может вести более агрессивную политику и уничтожить конкурента с некоторыми издержками для себя, чтобы предотвратить появление потенциальных соперников в других городах. Но если применить обратную индукцию, рассуждая с точки зрения последовательности из 20 игр, такая стратегия окажется нежизнеспособной. В 20-й игре агрессивное поведение уже не несет никаких выгод, так что фирме придется поделить рынок с конкурентом. Но отсюда следует, что нельзя получить выгоды от занижения цен и в 19-й игре и так далее, вплоть до первой. Хотя степень хищнического ценообразования на реальных рынках вызывает споры, на экспериментальных – оно не возникает.
РИС. XX.3
РИС. XX.4
Игра «Сороконожка» (буквально «стоножка». – Примеч. пер.)[268] показана на рис. XX.4 (выплата в долларах). Обратная индукция подсказывает, что игрок 1 должен выбрать в начале «стоп», оставив каждого из двоих соперников с 1⁄16 выигрыша, который они могли бы получить, играя до конца. В одном типичном эксперименте 22 % выбрали «стоп» на первом «узле» выбора, 41 % из оставшихся выбрали «стоп» на втором узле, после этого половина оставшихся выбрала «стоп» на четвертом узле, а еще половина выбрала «вперед». Отклонение от (кругового) равновесия, предсказываемое обратной индукцией, так же велико, как средний прирост прибыли для игроков.
Чтобы пояснить эти примеры внешне иррациональной кооперации и хищничества, можно предположить существование неопределенности некоторых аспектов игры. В реальной жизни игроки редко сталкиваются с конечным и известным количеством раундов. Часто они полагают, что взаимодействие будет повторяться бесконечное число раз, так что финальный раунд, от которого могла бы оттолкнуться обратная индукция, отсутствует. В таких случаях взаимное использование тактики «услуга за услугу» может стать равновесной в начатой «Дилемме заключенного». (Это равновесие не уникально, поскольку последовательный отказ обоих игроков от сотрудничества тоже представляет собой равновесие. Структурно это напоминает игру на доверие с одним хорошим равновесием и одним плохим.) Если реальная жизнь склоняет к поведению по модели «услуга за услугу», агенты могут применить его и в ситуации эксперимента, для которых оно не является оптимальным.
Вместе с тем агент может быть неуверен в том, с каким типом игрока он имеет дело. Предположим, общеизвестно, что в группе есть некоторые иррациональные индивиды. Известно, что некоторые агенты всегда будут сотрудничать, другие будут использовать стратегию «услуга за услугу» в количественно ограниченных «Дилеммах заключенного», а третьи будут демпинговать, чтобы отпугнуть конкурентов даже в двадцатом городе, и так далее. Однако неизвестно наверняка, кто эти индивиды. Каждый агент с некоторой положительной вероятностью может быть иррациональным. В «Парадоксе сетевого магазина» потенциального конкурента можно отпугнуть, заставив приписать достаточно большую вероятность тому, что менеджер сетевого магазина иррационален. Когда потенциальные конкуренты в других городах увидят подобное поведение, они воспользуются байесовым рассуждением (глава XI), приписав его иррациональности более высокую вероятность. Она может оказаться недостаточно высокой, чтобы их отпугнуть, но если он снова и снова будет вести себя иррационально, то, возможно, достигнет уровня, при котором для них будет рациональнее остаться за пределами рынка. Подобное рассуждение может объяснить сотрудничество в количественно ограниченной «Дилемме заключенного» и игре «Сороконожка».
Еще одна возможность заключается в том, что в многократно повторяемых «Дилемме заключенного» и «Сороконожке» кооперация имеет некоторые свойства точки координации. Хотя рациональные индивиды откажутся от сотрудничества в первом же раунде, разумные не сделают этого. Несмотря на некоторую неопределенность, это предположение (подробнее я обращусь к нему позднее) более верно, чем рассуждения, основанные на неопределенности типа другого игрока. С одной стороны, такие рассуждения требуют от игроков выполнения невероятно сложных расчетов, занимающих в учебниках многие страницы. С другой – интроспекция и бытовые наблюдения подсказывают, что, принимая решения в повседневной жизни, мы так о других не думаем. Когда я кому-то доверяю небольшую сумму денег, но не доверяю большую, это происходит не потому, что я сомневаюсь в безусловной надежности партнера, но потому что полагаю, что ему можно доверять, только когда ставки не очень высоки.
В «Дилемме путешественника» два игрока одновременно требуют от 80 до 200 долларов за потерянный багаж. Чтобы избежать чрезмерных требований, авиалинии выплачивают каждому пассажиру минимальную из двух заявленных сумм, доплачивая сумму R человеку, выдвинувшему самое низкое требование, и вычитая такую же у человека с более высоким требованием. Рассмотрим пару требований (100: 150), дающую выигрыш ((100 + R): (10 0 – R)). Эта пара не может быть равновесной, поскольку у первого игрока есть стимул требовать 149, тем самым получив выигрыш 149 + R, на что второй игрок ответит требованием 148 и так далее. Как подсказывает этот пример, такой исход в действительности наблюдается, когда сумма R высока. Когда же она невысока, участники могут запрашивать суммы, близкие к верхней границе 200. И снова я предполагаю, что здесь работает что-то вроде точки координации. Каждый пассажир знает, что, учитывая выгоды координации вокруг высокого требования, глупо применять стратегию равновесия, и предполагает, что другие тоже это знают.
Джон Мейнард Кейнс сравнивал биржевой рынок с «конкурсом красоты». Он имел в виду популярные в те времена в Англии конкурсы, в которых газета печатала 100 фотографий, а люди писали, какие 6 лиц понравились им больше всего. Каждый, кто выбирал самое популярное лицо, автоматически становился участником лотереи, в которой мог выиграть приз. Кейнс писал: «Вопрос не в том, чтобы выбрать те [лица], которые по самому здравому рассуждению являются самыми красивыми, и даже не те, которые среднестатистическое мнение искренне сочтет самыми красивыми. Мы достигли третьей степени, когда используем свой ум, чтобы угадать представления этого среднестатистического мнения о самом среднестатистическом мнении. И, я полагаю, есть те, кто практикует четвертую, пятую и более высокие степени».
В игре, возникшей из этого замечания Кейнса, участников просят выбрать числа между 0 и 100. Игрок, чье число ближе всего к двум третям от среднего из всех выбранных чисел, получает фиксированный приз. Среднее должно быть меньше или равно 100, соответственно две трети от него должны быть меньше или равны 67. Следовательно, какое бы среднее число ни стало результатом выбора других игроков, 67 будет ближе к двум третям от этого среднего, чем любая бо́льшая цифра. Но когда коридор ограничен значениями, меньшими или равными 67, две трети от среднего меньше или равны 44, и так далее, пока не будет достигнуто уникальное равновесие – 0. Лишь немногие участники экспериментов выбирали 0; среднее число вращалось вокруг 35. Выбравший это число должен думать, что большинство других выберет бо́льшие числа. Здесь проявляется синдром младшего брата. Тот факт, что это число представляет собой примерно две трети от среднего в целом ряду, 50, подсказывает, что типичный участник может считать, что другие выбирают числа произвольно, тогда как он имеет возможность оптимизировать выбор. Или, напротив, типичный участник может полагать, что другие проходят через два раунда исключения, оставляя ему свободу оптимизации, добавляя третий раунд.
Я хочу сказать, что, когда поведение людей расходится с предсказаниями теории игр, это, возможно, происходит, потому что люди менее чем рациональны или более чем рациональны. Синдром младшего брата, конечно же, является провалом рациональности, равно как неспособность проделать простую обратную индукцию. Быть рациональным – значит преодолевать ловушки рациональности, сосредоточиваться на факте, что оба игрока могут выиграть, игнорируя логику лучшей реакции. Как я отмечал, последняя идея напоминает точки координации, но лишь отчасти. Точки координации являются равновесием, тогда как кооперация в «Дилемме заключенного» с конечным числом повторений, высокое требование в «Дилемме путешественника» или выбор «вперед» в игре «Сороконожка» таковыми не являются. То общее, что есть у этих вариантов с выбором точки координации, с трудом поддается определению и сильно зависит от контекста, свойства очевидности и разумности.
Аргумент такого рода может показаться принадлежащим скорее к магическому мышлению (глава VII), чем к рассуждению, основанному на точке координации. Игнорировать зов сирен рациональности – значит следовать завету Джона Донна, приведенному в «Годовщине»:
Кто в большей безопасности, чем мы? Никто
Предать нас, кроме нас двоих, не может
Уймем же страхи, ложные иль нет.
Игнорирование настоящих страхов, возможно, иррационально или является примером магического мышления (то же относится к игнорированию реальных перспектив получения прибыли). Или же наоборот (и именно так я предпочитаю рассматривать это поведение), оно отражает более высокие стандарты, чем просто рациональность[269]. Это сложные вопросы, и я призываю читателей подумать над ними самостоятельно. Обсуждение некоторых из них будет продолжено в следующей главе.
Библиографические примечания
Источником большинства примеров в этой главе является «Поведенческая теория игр» К. Камерера (Camerer C. Behavioral Game Theory. New York: Russell Sage, 2004). Полезный анализ условий, при которых терпят неудачу предсказания стандартной теории игр, есть в работе Дж. К. Гоэри и Ч. А. Холта «Десять маленьких сокровищ теории игр и десять интуитивных противоречий» (Goeree J. K., Holt C. A. Ten little treasures of game theory and ten intuitive contradictions // American Economic Review. 2001. No. 91. P. 1402–1422). Как оказалось, внешне простая идея обратной индукции заключает в себе глубокие парадоксы; некоторые из них намечены во введении к моей книге «Цемент общества» (The Cement of Society. Cambridge University Press, 1989). Игра, приведенная на рис. XX.2, взята из работы Э. Джонсона и др. «Выявление неудач обратной индукции» (Detecting failures of backward induction // Journal of Economic Theory. 2002. No. 104. P. 16–47). «Дилемма путешественника» взята из статьи К. Басю «Дилемма путешественника: парадоксы рациональности в теории игр» (K. Basu. The traveler’s dilemma: Paradoxes of rationality in game theory // American Economic Review: Papers and Proceedings. 1994. No. 84. P. 391–395).