Объяснение социального поведения. Еще раз об основах социальных наук — Юн Эльстер

Стратегическое взаимодействие с одновременными выборами

Изобретение теории игр можно считать наиболее важным единичным достижением в социальных науках в ХХ веке. В некоторых случаях она позволяет нам объяснять поведение, которое до сих пор представлялось загадочным. Но что еще более важно, она проясняет структуру социального взаимодействия. Когда ты смотришь на мир через призму теории игр, или теории взаимосвязанных решений, как ее еще называют, все выглядит иначе.

Для начала рассмотрим игры, в которых агенты принимают решения одновременно. Цель в том, чтобы понять, могут ли, и если да, то каким образом, n агентов или игроков самостоятельно добиться координации своих стратегий. Особое внимание мы уделим специальному случаю – n = 2. Игроки могут общаться друг с другом, но не могут вступать в соглашения, накладывающие обязательства. Каждой из n-ого количества стратегий, по одной на каждого агента, соответствует свой исход. Агент ранжирует возможные исходы в соответствии со своим порядком предпочтений. При необходимости будем считать, что условия для представления предпочтений как количественных полезностей соблюдаются (глава XI). Структура награды – это функция, которая любому множеству стратегий приписывает множество полезностей. Хотя само слово «награда» может ассоциироваться с денежным вознаграждением, оно будет использоваться для обозначения психологических исходов (полезностей и, в конечном счете, предпочтений). Когда структуры денежных или материальных и психологических наград расходятся, релевантна только последняя.

Как было кратко упомянуто в предыдующей главе, у агента может быть доминирующая стратегия, дающая результат лучший, чем тот, который мог быть получен при выборе любой другой стратегии независимо от поведения остальных. Исход, но не сам выбор агента может зависеть от действий других. В иных случаях есть взаимозависимость выборов. Если все едут по левой стороне дороги, мне тоже лучше выбрать левую, если они едут по правой, мне тоже лучше так сделать.

Равновесие – это n-ое множество стратегий с тем свойством, что ни один игрок не может, отступив от своей равновесной стратегии, в одностороннем порядке получить исход, которой он наверняка предпочтет равновесному. Иначе говоря, при равновесии стратегия, выбранная каждым игроком, является наилучшим ответом на стратегии, выбранные другими игроками, в том смысле, что ему ничего не остается, как выбрать стратегию равновесия, если другие уже выбрали свои стратегии. Однако эта стратегия необязательно должна быть оптимальной в том смысле, что ему будет хуже, если он отступит от нее в одностороннем порядке. В общем случае в игре может быть несколько равновесий. Кратко остановимся на нескольких примерах. Допустим, есть только одно равновесие. Кроме того, предположим, что структура наград и рациональность игроков – общеизвестный факт[249]. При таком допущении мы можем предсказать, что все игроки выберут стратегию равновесия, так как это единственная стратегия, основанная на рациональных представлениях о том, что делают остальные.

Некоторые игры с уникальным равновесием вращаются вокруг существования доминирующих стратегий. Это может означать один из двух случаев, представленных на рис. XIX.1[250]. В аварии с участием двух автомобилей повреждены обе машины. В происшествии с участием пешехода и автомобиля пострадал только пешеход. Авария машина – машина происходит только, если по крайней мере один из водителей был неосторожен. Если оба были неосторожны, исход хуже. Происшествия с автомобилем и пешеходом возникают только при обоюдной неосторожности. Должная осторожность обходится дорого. Из этих предпосылок следует, что в авариях двух машин должная осторожность является доминирующей стратегией для обоих водителей. В аварии с машиной и пешеходом неосторожность – доминирующая стратегия для водителя.

РИС. XIX.1

У пешехода нет доминирующей стратегии, поскольку должная осторожность – лучший ответ на неосторожность, а неосторожность – на должную осторожность. Поскольку он знает, что у водителя доминирующая стратегия – неосторожность и что, будучи рациональным, он ее выберет, пешеход тем не менее выберет должную осторожность[251].

Игры, в которых у всех игроков есть доминирующие стратегии очень распространены. В теории они несколько тривиальны, за исключением периодически повторяющихся случаев. Игры, в которых только у некоторых игроков есть доминирующие стратегии, заставляющие других делать четкий выбор, распространены меньше, но тоже важны. Для них, однако, существуют более строгие информационные требования, поскольку пешеходы должны знать возможные исходы не только для себя, но и для водителя, тогда как двум водителям достаточно знать только свой исход. Часто мы приписываем доминирующие стратегии другим. Так, мы обычно не смотрим по сторонам, переходя дорогу с односторонним движением, потому что предполагаем, что боясь аварии, водители соблюдают правило односторонности.

Особый класс игр обладает координационным равновесием, часто называемым конвенцией, при котором у каждого игрока не только нет стимула отступать в одностороннем порядке, он предпочитает, чтобы этого не делали другие. При равновесии, когда все едут по правой стороне дороги, может произойти авария, если я отступлю от правила или это сделает кто-то еще. В этом случае равновесие не является уникальным, поскольку езда по левой стороне имеет те же особенности[252]. Часто не так важно, что мы делаем, пока мы все делаем одно и то же. Значения слов произвольны, но как только они зафиксированы, они становятся конвенцией. В других случаях неважно, что мы делаем, но важнее, чтобы все делали одно и то же. Ниже я вернусь к этим примерам.

Примеры дуополии

Некоторые игры обладают уникальным равновесием, не вращающимся вокруг доминирующих стратегий. Примером может служить поведение дуополии (рис. XIX.2). Когда на рынке доминируют две фирмы, снижение выпуска продукции одной компанией вызовет рост цен и рост выпуска продукции другой. Иными словами, у каждого игрока есть график наилучшей реакции, который диктует ему объемы выпуска продукции в зависимости от таковых у конкурента. При равновесии объем продукции одной фирмы – лучшая реакция на этот же показатель другой. Из этого положения не следует, что это единственное возможное для них решение. Если бы они образовали картель и ограничили выпуск продукции уровнем ниже равновесного, обе получили бы более высокую прибыль, хотя эти обоюдно оптимальные уровни производства не являются наилучшей взаимной реакцией. На самом деле компании сталкиваются с дилеммой заключенного (определенной на рис. XIX.3).

В качестве еще одного случая дуополии рассмотрим двух продавцов мороженого на пляже, которые пытаются найти лучшее место для своих прилавков, исходя из допущения, что покупатели (которые, как предполагается, равномерно распределены по берегу) подойдут к ближайшей из них. Доминирующая стратегия отсутствует. Если один поставит палатку на некотором расстоянии слева от центра пляжа, лучший ответ со стороны другого продавца будет встать справа, на что лучшим ответом со стороны первого продавца будет тоже сдвинуться вправо и так далее, пока палатки не окажутся рядом в центре пляжа. Это уникальное равновесие, очевидно, не самое лучшее для покупателей. Для них наилучшим решением было бы расположение палаток между центром и одним из концов пляжа. Хотя для продавцов такой исход ничуть не хуже равновесного, это расположение не является наилучшим ответом друг другу. Данная модель также применялась для объяснения тенденции политических партий (в двухпартийной системе) сдвигаться к середине политического спектра.

РИС. XIX.2

Предположим, что, когда палатки стоят в центре, покупатели на краях пляжа отказываются от покупки мороженного, потому что к тому моменту, как они вернутся назад, оно уже растает. Если покупатели готовы пройти пешком не более половины пляжа – четверть расстояния, чтобы дойти до палатки, и еще четверть, чтобы вернуться, оптимальным для них исходом будет уникальное равновесие, поскольку ни у кого нет стимула перемещаться. Предположим, что длина пляжа составляет 1000 метров. Если продавец на отметке 750 метров передвинется на отметку 700, он потеряет 50 покупателей между отметками 950 и 1000, которые не готовы идти пешком более 500 метров, и приобретет 25 покупателей между отметками 475 и 500, к которым его палатка теперь стала ближе, чем конкурирующая, что станет чистым убытком. Похожее рассуждение может объяснить, почему политические партии никогда не передвигаются в центр: экстремисты с обоих концов предпочитают воздерживаться и не голосовать за центристскую партию. Кроме того, как я отмечал в конце главы XVII, маловероятно, чтобы максимизация голосов была единственной целью политических партий.

Некоторые распространенные игры

Несколько простых структур взаимодействия с выигрышами, представленными на рис. XIX.3, очень часто встречаются в самых разных контекстах[253]. С и D означают кооперацию и отказ от кооперации. В игре «Телефон» игрок в колонке – тот, кто звонил первым. В игре «Координатор» А и В могут быть любой парой действий, которые оба игрока предпочтут скорее координировать, чем не координировать, но при этом им безразлично, каким из двух способов они будут это делать.

Игры иллюстрируют структуру двух центральных проблем социального взаимодействия – кооперацию и координацию. В обществе без взаимовыгодной кооперации жизнь будет «одинокой, бедной, неприятной, грубой и короткой» (Гоббс). То, что она будет предсказуемо плохой, – слабое утешение. Жизнь в обществе, в котором люди неспособны координировать свое поведение, будет полна непреднамеренных последствий, как «сказка, рассказанная идиотом, полная шума и ярости, но лишенная всякого смысла» («Макбет»). И кооперация, и координация иногда достигают успеха, но часто терпят неудачу. Теория игр может прояснить как их успех, так и неудачу.

«Дилемма заключенного», «Охота на оленя» и «Цыпленок» так или иначе предполагают выбрать кооперацию или отказаться от нее. «Дилемма заключенного» называется так, потому что первоначально для ее иллюстрации использовался следующий сюжет. Каждому из двоих преступников, замешанных в одном и том же преступлении, но находящихся в разных камерах, говорят, что если он донесет на другого, а тот не сделает того же, его выпустят на свободу, а его подельник сядет в тюрьму на десять лет. Если они оба не донесут друг на друга, оба отправятся в тюрьму на пять лет[254]. В таких обстоятельствах донос является доминирующей стратегий, хотя обоим преступникам будет лучше, если никто доносить не станет. Исход определяется комбинацией «соблазна безбилетника» (выйти на свободу) и «страхом, что тебя подставят» (десять лет тюрьмы).

Негативные экстерналии, обсуждавшиеся в предыдущей главе, могут рассматриваться как «Дилемма заключенного» со множеством игроков. Будут и другие примеры. Для каждого работника (с учетом его эгоистических мотиваций) лучше не быть членом профсоюза, даже если для всех лучше, чтобы все в него вступили и получили более высокую заработную плату. Для каждой компании в картеле лучше выйти из него и выпускать больше продукции, чтобы воспользоваться высокими ценами, вызванными ограничениями на выпуск продукции для других компаний, но когда все это сделают, цены упадут до конкурентного уровня; максимизация прибыли каждой компанией подрывает максимизацию общей прибыли. Организация стран – экспортеров нефти (ОПЕК) также уязвима в этом отношении. Ситуации, в которых нужно бежать как можно быстрее, чтобы удержаться на том же месте, как например, во время гонки вооружений между США и Советским Союзом, в политическом консультировании или в случае студентов, которые пишут работу для преподавателя, который «ставит оценки по восходящей».

РИС. XIX.3

Идею игры «Охота на оленя» часто приписывают Жану-Жаку Руссо, хотя его язык не всегда прозрачен[255]. В более условной форме она включает в себя двух игроков, которые могут выбирать – охотиться за оленем (С) или за зайцем (D). Зайца каждый может поймать сам, для того чтобы добыть оленя, необходимо (и достаточно) совместное усилие обоих. Пол-оленя лучше, чем целый заяц. Если к охоте на зайца подключатся оба охотника, на это уйдет больше времени и сил, потому что шум, который поднимают охотники, распугивает зайцев. Как и в «Дилемме заключенного» у охотника, который будет охотиться на оленя, есть риск потерпеть фиаско, пока другой добудет зайца. Однако соблазна «безбилетничества» здесь нет. У игры две точки равновесия, в верхней левой и нижней правой клетках.

Хотя первое равновесие лучше, оно может быть неосуществимо. Чтобы понять почему, мы можем выдвинуть предположение, что структура выигрышей общеизвестна и она позволяет агентам получить ошибочные представления о структуре выигрышей других агентов. Действия, основанные на такой вере, образуют равновесие в слабом смысле, если для каждого агента действия, предпринятые другими, подтверждают его убеждения. Предположим, что в «Охоте на оленя» каждый агент ошибочно полагает, что у других агентов предпочтения «Дилеммы заключенного». Учитывая это, рациональный агент должен уклониться от сотрудничества, тем самым подтвердив убеждения других о том, что у него предпочтения «Дилеммы заключенного». Такое общество может столкнуться с высоким уровнем уклонения от налогов и коррупции. Я вернусь к таким случаям плюралистического неведения в главе XXIII. В другом обществе, в котором люди справедливо полагают, что другие предпочтут «Охоту на оленя», возникнет хорошее равновесие, в котором люди платят налоги, не дают и не берут взятки. Культуры коррупции могут зависеть от убеждений, а не от мотиваций.

Международный контроль над инфекционными заболеваниями может иметь структуру «Охоты на оленя». Если хотя бы одна страна не сможет принять адекватных мер, остальные будут не в состоянии себя защитить[256]. В качестве другого примера рассмотрим контртеррористические меры. Если хотя бы одна из двух стран их финансирует, она приносит благо и другой стране, и себе. Если издержки превысят ее личную выгоду, она не будет заниматься односторонним финансированием. Если вкладывают обе страны, возможность разделить информацию может обеспечить каждой из них более высокий уровень безопасности, чем тот, которого она могла бы достичь, эксплуатируя ресурсы другой.

В этих примерах структура выигрышей связана с каузальной природой ситуации. В «Охоте на оленя» и в случае контроля над заболеваниями «пороговая технология» предполагает, что индивидуальные усилия бессмысленны. В случае борьбы с терроризмом в основании лежит своего рода экономика масштаба: десять единиц усилий приносят в два раза больший эффект, чем пять. В других случаях структура выигрыша связана с тем фактом, что агенты заботятся не только о своей материальной выгоде, но и о других вещах. Такие ситуации принято называть игрой на доверие (Assurance Game). Даже если структура материального выигрыша представляет собой «Дилемму заключенного», каждый индивид может согласиться сотрудничать, если удостоверится, что другие тоже сотрудничают. Желание быть честным, или нежелание быть «безбилетником», может помочь преодолеть соблазн наживаться на кооперации других. В противном случае «Дилемма заключенного» может превратиться в игру на доверие.

Рассмотрим выигрыши в «Дилемме заключенного» (рис. XIX.3) как материальные награды. Предположим, что полезность для каждого человека равна его материальной награде плюс половина материальной награды другого. В этом случае выигрыш в полезности будет соответствовать игре на доверие на рис. XIX.4. «Дилемма заключенного» может трансформироваться в игру на доверие при помощи третьего механизма, если третья сторона введет штраф за выбор некооперативной стратегии D. Если мы снова будем рассматривать выигрыши в «Дилемме заключенного» на рис. XIX.3 как денежные награды и предположим, что агентов волнуют только они, вычитание 1,25 из награды за отсутствие сотрудничества превратит ее в игру на доверие. Например, профсоюз может ввести формальные или неформальные санкции для работников, не оформивших свое членство. Наконец, можно превратить «Дилемму заключенного» в игру на доверие, награждая за сотрудничество, например, предложив бонус или взятку в размере 1,25 за сотрудничество. Обещание награды, однако, должно исполняться, тогда как санкции необязательно приводить в жизнь, если они действенны. Если выигрыш «безбилетника» очень высок, выгоды от сотрудничества могут быть недостаточны, чтобы вкладываться во взятки[257]. В некоторых случаях используются награды. Рабочие, вступающие в профсоюз, могут выиграть не только благодаря более высокой заработной плате, которая обычно в равной степени достается и нечленам, но и от пенсионных планов и дешевого отпуска, доступного только участникам.

РИС. XIX.4

Игра «Цыпленок» названа так в честь подросткового ритуала из фильма 1955 года «Бунтарь без причины». Лос-анджелесские подростки на краденых машинах едут на крутой обрыв. В этой игре двое из них одновременно направляют машины на край обрыва, останавливаясь в последнюю минуту. Тот, кто первым остановится, «Цыпленок», проиграл. В другом варианте две машины едут навстречу и проигрывает первый, свернувший в сторону. В каждой из двух точек равновесия каждый агент делает противоположное тому, что делает другой. Даже имея общее знание о структуре вознаграждения и рациональности агента, мы не можем предсказать, какое равновесие будет выбрано (если оно будет выбрано). С точки зрения рационального выбора ситуация является неопределенной. Во второй версии игры («Поворот») участник может попытаться разрушить неопределенность, надев себе повязку на глаза (которая видна другому), тем самым заставив другого игрока свернуть. Но это создает такое же затруднение с двумя вариантами – «надевание» и «ненадевание повязки», а не со «свернет» и «не свернет»[258]. Это глубоко фрустрирующая ситуация.

В каком-то отношении гонка вооружений представляет собой игру в «Цыпленка». Карибский кризис часто приводят в качестве примера, в котором две супердержавы оказались в ловушке конфронтации, и СССР «моргнул первым». Еще один пример. Двое фермеров используют одну и ту же систему ирригации для своих полей. Уход за системой может адекватно осуществляться и одним фермером, но она в равной степени выгодна обоим. Если один из двух не выполнит свою часть работы по уходу, второй заинтересован в том, чтобы выполнить свою. Случай Китти Дженовезе также может рассматриваться в этой перспективе, если мы предположим, что каждый сосед предпочел бы вмешаться тогда, и только тогда, когда больше никто не вмешался.

Обратившись теперь к вопросам координации, рассмотрим «Войну полов». В основе истории лежит следующий стереотип. Мужчина и его жена собираются сходить куда-нибудь вечером. Они решили после работы пойти или на балет, или на боксерский поединок и окончательно договориться по телефону. Его телефон сломался, поэтому им приходится координироваться молча. Они оба заинтересованы в том, чтобы побыть вместе, но в том, что касается места посещения, их интересы расходятся. Как и в игре «Цыпленок», в этой игре две точки равновесия – координация на балете или на матче по боксу. И так же, как в игре, общее представление о структуре выигрышей и рациональности не подскажут паре, где встретиться. Ситуация снова будет неопределенной.

Игры такого рода возникают, когда координация может принимать разные формы; любая из них лучше для всех агентов, но каждая для некоторых агентов предпочтительнее других[259]. В социальной и политической жизни это скорее исключение, чем правило. Все граждане могут предпочесть любую конституцию (внутри определенного набора режимов) ее полному отсутствию, потому что долгосрочная стабильность нужна им, чтобы иметь возможность планировать будущее. Когда закон зафиксирован и не меняется, можно регулировать свое поведение в соответствии с ним. При этом каждая заинтересованная группа может выбрать специфическую конституцию: лобби кредиторов предпочтет запрет на бумажные деньги, политическая партия предпочтет ту выборную систему, которая ей выгодна, те, у кого есть сильный кандидат в президенты, захотят, чтобы был предусмотрен сильный президентский пост и так далее.

Множественные точки равновесия при координации возникают и в том случае, когда в странах складываются разные стандарты веса, длины или объема, а позднее они открывают потенциальные выгоды общего решения. Континентальная Европа и англосаксонский мир сохранили в этой области разные стандарты. В отличие от множественных конституционных решений препятствием к достижению договоренности является не постоянное расхождение интересов, но краткосрочные издержки на переход. Кроме того, выбор стандарта может оказаться игрой в «Цыпленка». Сделаем малоправдоподобное предположение, что стандарт записан в конституции как статья, не подлежащая изменению. У каждой страны тогда будут стимулы принять на себя обязательства прежде, чем это сделают другие.

Игра «Телефон» определяется потребностью в правиле, которое подсказало бы сторонам, что делать, когда телефонный разговор прервался. Есть две точки равновесия координации: номер должен набрать человек, который звонил, или же тот, кто принял вызов. Любое правило лучше ситуации, в которой они оба будут набирать номер или его не будет набирать никто. Но в этом случае, в отличие от «Битвы полов», одно равновесие для обоих лучше, чем другое. Разумнее, если номер перенаберет первый, потому что он лучше знает, по какому номеру звонил. Рациональные, владеющие всей информацией агенты сойдутся на равновесии более высокой координации. Однако такое утверждение игнорирует стоимость нового вызова. Если стоимость высока, игра становится «Битвой полов».

Наконец игра «Точка координации», которая может восприниматься как вариант «Битвы полов». Супруги договорились посмотреть фильм, который идет в кинотеатрах А и В, но не договорились, куда именно пойти. Мы предполагаем, что ни один из кинотеатров не находится ближе, чем другой, и не обладает никакими другими дополнительными преимуществами. Как и в «Битве полов» ни общее знание, ни рациональность не подскажут им, куда идти. Однако в ситуации может присутствовать психологический сигнал, который послужит как бы фокусной точкой для координации. Если у пары в кинотеатре А было первое свидание, это может заставить их прийти именно туда. В этом случае сигнал является частным событием. В других случаях сигналы могут разделяться значительной частью населения. Так, нью-йоркский анекдот утверждает, что если вы с вашим спутником потеряли друг друга, нужно встречаться в полдень под главными часами на Большом центральном вокзале. И даже не зная этот анекдот, многие люди встречаются на вокзалах, поскольку во многих городах это самые важные здания, существующие в единственном экземпляре[260]. Уникальность делает их привлекательными в качестве точки координации. Полдень обладает тем же свойством[261].

Эффект точки координации легко продемонстрировать в экспериментах. Если попросить всех членов группы записать положительное целое число на клочке бумаги и сказать всем, что они получат награду, если все запишут одну и ту же цифру, они неизменно сойдутся на 1. Это уникальное наименьшее целое число, но не уникальное наибольшее. В других контекстах в качестве точки координации может выступать 0. В период холодной войны во время дебатов о том, могут ли США использовать тактическое ядерное оружие и не перевести при этом эскалацию в полномасштабную ядерную войну, предлагались разные идеи «яркой отметки», которая позволит ограничить его использование. В конце концов было решено, что единственной точкой координации может быть отсутствие его использования.

Сходное замечание о важности обычая сделал Паскаль: «Почему мы следуем старым законам и старым мнениям? Потому что они лучше? Нет, но они уникальные и устраняют источник различия». В другом месте он писал:

Самые неразумные вещи в мире становятся самыми разумными из-за расстройства ума. Что может быть более неразумного, чем выбирать для управления государством первого сына королевы? Мы же не выбираем для управления судном самого родовитого из его пассажиров. Подобный закон был бы смешон и несправедлив. Но поскольку люди таковы и всегда будут таковыми, каковы они есть, это становится разумным и справедливым, ибо кого еще избрать? Самого добродетельного и самого способного? И вот уже все хватаются за оружие, утверждая, что они самые добродетельные и самые способные. Тогда давайте наделим этим качеством нечто бесспорное. Это старший сын короля: это четко, здесь не о чем спорить. У разума нет другого выхода, потому что гражданская война – худшее из зол.

Подобное рассуждение действительно может повлиять на выбор короля, если есть несколько претендентов на престол. При выборе короля во время Реставрации во Франции Талейран успешно доказал, что законный наследник последнего короля Франции был единственной точкой координации, которая могла предотвратить распри. Как он писал в своих мемуарах: «Навязанный король был бы результатом силы или интриги; и то и другое было бы недостаточно. Для установления долговременной системы, которая будет принята, не встретив сопротивления, нужно действовать согласно принципу». Позднее Маркс утверждал, что Республика 1848 года обязана своим существованием тому факту, что для каждой из двух ветвей королевской семьи это была вторая наилучшая альтернатива. Похожее наблюдение сделал Токвиль, объясняя стабильность правления Наполеона III. Демократию тоже можно рассматривать в качестве точки координации. Когда существует множество конкурирующих между собой оснований для утверждения людьми своего превосходства – мудрость, богатство, добродетель, происхождение, уникальную значимость приобретает количественное решение по принципу большинства. Бывшие колонии, в которых племена говорят на разных языках, могут выбрать в качестве официального язык колонизатора. Конфликтующие стороны легко сходятся на предложении, стоящем у всех на втором месте.

В 1989 году перезахоронение останков Имре Надя стало точкой координации для 250 000 человек, прошедших маршем по улицам Будапешта, чтобы продемонстрировать свое недовольство режимом. Как и в предыдущих примерах, некая точка позволила осуществить координацию через кооперацию. В конфликтных ситуациях точки координации могут приносить совсем иной эффект. Во время Крымской войны французский генерал Пелиссье решил назначить вторую атаку на Севастополь на 18 июня 1855 года, чтобы доставить удовольствие Наполеону III тем, что одержит победу в годовщину битвы при Ватерлоо. Поскольку эта дата и ее значение для французов были прекрасно известны русским, они смогли предвидеть нападение и разгромить французов.

Один из уроков, которые нужно вынести из данной главы, заключается в том, что ситуации в реальном мире могут моделироваться в зависимости от принятых допущений. Гонка вооружений моделировалась как «Дилемма заключенного», как игра в «Цыпленка» и игра на доверие. Вступление в профсоюз может быть «Дилеммой заключенного» или игрой на доверие. Повторный набор телефонного номера рассматривался как «Битва полов» или как «Телефон». Координация мер и весов может быть игрой в «Цыпленка» или «Битвой полов». Тонкости структуры взаимодействия не всегда сразу заметны. Принуждая нас к откровенности по отношению к природе взаимодействия, теория игр может раскрыть тонкости или отклонения, о которых мы даже не подозревали.

Последовательные игры

Позвольте коротко остановиться на играх, в которых агенты принимают последовательные решения (более подробно я остановлюсь на них в следующей главе). Начну с простого примера, который показывает способность теории игр прояснять структуры взаимодействия, которые раньше находили лишь смутное понимание[262].

На рис. XIX.5 две армии противостоят друг другу на границе между своими странами. Генерал I может либо отступить, сохранив статус-кво (3,3), либо вторгнуться в чужую страну. Если он перейдет в наступление, генерал II может либо сражаться с исходом (1:1), либо уступить спорную территорию с исходом (4:2). Прежде чем генерал I примет решение, генерал II может сообщить о намерении сражаться в случае нападения, в надежде подвигнуть генерала I выбрать (3:3), а не (1:1). Однако такая угроза не заслуживает доверия. Генерал I знает, что как только он перейдет в наступление, в интересах II будет уступить, а не сражаться. Единственный равновесный исход – (4:2). Эта концепция равновесия – не статическая «лучшая реакция», которую мы до сих пор рассматривали. Скорее это динамическая концепция, начинающаяся с поздних стадий игры и постепенно возвращающаяся к более ранним (технический термин – «обратная индукция»). Сначала мы спрашиваем, какое поведение будет рациональным для II, если I нападет на его страну. Ответ «уступить» ведет к исходу (4:2). Таким образом, у I есть выбор между действиями, ведущими к (3:3) и к (4:2). Будучи рациональным, он выбирает последнее.

Как замечал Фукидид в «Пелопонесской войне», чтобы другая сторона основывала на них свое поведение, обещания должны быть правдоподобными:

Клятвы, принесенные в поддержку примирения, недолговечны, поскольку были сделаны каждой из сторон в отсутствие любого иного источника силы, позволяющего выйти из тупика; но тот, кто заставал противную сторону врасплох в данный момент и хватался за первую возможность нанести смелый удар, будет наслаждать местью тем более сладкой, потому что он воспользовался чужой доверчивостью, а не выиграл в открытой битве… Ибо нет такого слова, на которое можно целиком положиться, и нет такой клятвы, которая могла бы принести примирение, и все, кто находится в превосходящем положении, поняв, что на безопасность надеяться нельзя, приняли меры во избежание урона, а не позволили себе довериться другим.

РИС. XIX.5

Иначе говоря, человек, получивший обещание должен задаться вопросом, рационально ли для того, кто обещает, держать слово. Например, если в игре «Доверительное управление» игрокам позволено общаться, второй игрок может подтолкнуть первого сделать большой трансфер, пообещав ему большой обратный трансфер. Если его ничто не заставляет исполнять обещание, оно не заслуживает доверия. В «Демократии в Америке» Токвиль саркастически замечает о письме военного секретаря индейцам-чероки, в котором тот «утверждает, что они должны оставить надежду удержать занимаемую ими в данный момент территорию, но дает им положительные заверения на сей счет, если они пересекут реку Миссури, как будто тогда у него будут полномочия, которыми он сейчас не обладает». Экономическая реформа в Китае была сопряжена с подобной проблемой. Когда правительство начинало аграрную реформу, оно пообещало фермерам 15-летнюю аренду земли, чтобы стимулировать мелиорацию. Поскольку способа заставить автократическое правительство сдержать свои обещания не существует, многие фермеры ему не поверили и сразу же распорядились своей прибылью. Автократическое правительство не может лишить себя способности вмешиваться.

Понятие надежности является центральным для теории игр второго поколения, которое появилось приблизительно в 1975 году (первое поколение возникло около 1945 года). Как только мы принимаем эту идею всерьез, мы должны задать вопрос, как агенты могут инвестировать в надежность, чтобы придать действенность своим угрозам и обещаниям. Существует несколько механизмов. Один из них – зарабатывание репутации, например, когда приобретают репутацию частично или периодически иррационального человека. Известно, что президент Никсон, поощряемый Генри Киссинджером, сознательно поддерживал образ непредсказуемого, чтобы убедить Советы в способности действовать вопреки интересам Америки, если его спровоцировать. Кроме того, люди могут выполнять угрозы, когда это противоречит их интересам, чтобы приобрести репутацию жестких и крутых, которая заставит остальных поверить в их угрозы позднее.

Еще один механизм – предварительное связывание себя обязательствами, обсуждавшееся в главе XIII. В этом случае предварительное связывание себя обязательствами рассматривается как второй лучший рациональный ответ на склонность агента к иррациональному поведению. В стратегическом плане предварительное связывание себя обязательствами может быть полностью рациональным. В игре, изображенной на рис. 19.5, генерал II может построить «машину судного дня», которая автоматически инициирует ядерный удар по противнику, если тот начнет вторжение. Если существование этой машины и то, что страна II не контролирует ее действие, общеизвестны, это должно предотвратить вторжение. Наоборот, генерал II может использовать стратегию «сжигания мостов», то есть отрезать любые пути к отступлению. И снова это должно поспособствовать сдерживанию генерала I, если он знает, что у генерала II нет других альтернатив, кроме как дать отпор в случае нападения.

В некоторых случаях обе стороны могут использовать предварительное связывание себя обязательствами, чтобы получить преимущество перед другими. В трудовых переговорах с руководством угрозы забастовки и бойкота могут выглядеть неубедительными. Менеджмент знает, что, поскольку рабочие должны оплачивать ипотеку и содержать семью, они не могут позволить себе длительную забастовку. Профсоюз знает, что, так как фирма должна выполнять договора на поставку, она не может допустить остановки производства. Чтобы усилить убедительность своих угроз профсоюз может инвестировать в забастовочный фонд (возможно, вместе с другими профсоюзами), а менеджмент может инвестировать в крупную инвентаризацию. Или, наоборот, переговорщики могут публично огласить свои минимальные требования и максимальные предложения, сделав так, что их репутации будет нанесен значительный урон, если они пойдут на уступки. Такая игра предварительного связывания себя обязательствами может представать «Дилеммой заключенного» или игрой в «Цыпленка» в зависимости от структуры последовательной игры.

Библиографические примечания

Лучшее введение в теорию игр для начинающих дано в книге А. Диксита и С. Скета «Стратегические игры» (Dixit A., Skeath S. Games of Strategy. 2nd ed. New York: Norton, 2004). Для более углубленного изучения я бы предложил «Экономику и теорию игр стратегического взаимодействия» Ф. Вега-Редондо (Vega-Redondo F. Economics and the strategic interaction Theory of Games. Cambridge University Press, 2003). Энциклопедическим исследованием является «Учебник по теории игр и их применению в экономике» Р. Ауманна и С. Харта (Aumann R., Hart S. Handbook of Game Theory with Economic Applications. Vol. 1–3. Amsterdam: North-Holland, 1992, 1994, 2002). Применение этой теории к анализу определенных тем можно найти в книге Дж. Д. Морроу «Теория игр для политологов» (Morrow J. D. Game Theory for Political Scientists. Princeton, NJ: Princeton University Press, 1994) и в книге Д. Бейрда, Р. Гертнера и Р. Пикера «Теория игр и закон» (Baird D., Ger tner R., Picker R. Game Theory and the Law. Cambridge, MA: Harvard University Press, 1994). Классическое исследование конвенций – книга Д. Льюиса «Конвенция» (Lewis D. Convention. Cambridge, MA: Harvard University Press, 1969). Эта книга основана на другой классической работе – «Стратегии конфликта» Т. Шеллинга (Шеллинг Т. Стратегия конфликта. М.: ИРИСЭН, 2007), где впервые развивается идея точек координации. Работа Шеллинга стала интуитивным основанием для теории игр второго поколения, получившей формальное развитие в работе Р. Зелтена «Пересмотр концепции идеальности для точек равновесия в экстенсивных играх» (Selten R. Reexamination of the perfectness concept for equilibrium points in extensive games // International Journal of Game Theory. 1975. No. 4. P. 25–55). Касательно различной техники предварительного связывания себя обязательствами в политических играх см. Дж. Фирон «Внутренняя политическая аудитория и эскалация международных споров» (Fearon J. Domestic political audiences and the escalation of international disputes // American Political Science Review. 1994. No. 88. P. 577–592). Относительно его использования в переговорах о заработной плате см. мою книгу «Цемент общества» (The Cement of Society. Cambridge University Press, 1989).

XX. Игры и поведение

Предыдущая Стр. 21 из 29 Следующая