Объяснение социального поведения. Еще раз об основах социальных наук — Юн Эльстер

Структура рационального действия

Теоретики рационального выбора в качестве базового допущения при объяснении поведения выдвигают рациональность агентов. Это допущение включает гипотезу, что агенты формируют рациональные убеждения, включая представление о имеющихся у них вариантах выбора. Следовательно, нет необходимости различать субъективные (желания) и объективные (возможности) детерминанты поведения. Теория рационального выбора субъективна от начала до конца.

Структура объяснения при помощи рационального выбора представлена на рис. XI.1. Действие рационально, если оно отвечает трем требованиям оптимальности. Действие должно быть оптимальным, учитывая убеждения; убеждения должны быть как можно лучше обоснованны с опорой на факты; факты должны быть добыты в результате оптимальных вложений в сбор информации. Стрелки имеют двойное толкование с точки зрения как каузальности, так и оптимальности. Действие, например, должно быть вызвано желаниями и убеждениями, которые делают его рациональным; недостаточно совершить правильный поступок только благодаря счастливому стечению обстоятельств. Подобным образом убеждение не является рациональным, если оно является результатом двух противоположно направленных процессов, которые отменяют друг друга.

РИС. XI.1

Приведем пример: курильщики и те, кто не курит, обрабатывают информацию об опасностях курения таким образом, что полагают, что эти опасности выше, чем на самом деле. В то же время курильщики склонны к своекорыстной тенденциозности, заставляющей их дисконтировать риски. Если в результате у них сформируется такое же убеждение, как у непредвзятого наблюдателя[161], это не доказывает, что они рациональны. В одном из самых влиятельных обсуждений рациональности в социальных науках Макс Вебер ошибочно выводил процессуальную рациональность из результирующей оптимальности, когда писал:

Для типологического научного исследования все иррациональные, эмоционально обусловленные смысловые связи, определяющие отношение индивида к окружающему и влияющие на его поведение, наиболее обозримы, если изучать и изображать их в качестве отклонений от чисто целерационально сконструированного действия. Так, для объяснения «биржевой паники» целесообразно сначала установить, каким было бы рассматриваемое поведение без влияния иррациональных аффектов, а затем ввести эти иррациональные компоненты в качестве «помех». Равным образом и при исследовании какой-либо политической или военной акции целесообразно установить, каким было бы поведение участников события при знании ими всех обстоятельств дела, всех намерений и при строго целерационально (в соответствии со значимым для нас опытом) ориентированном выборе средств. Лишь в этом случае возможно свести отклонения от данной конструкции к обусловившим их иррациональным фактора.

Хотя Вебер был прав, когда полагал, что отклонение от рационального хода событий – достаточное условие для того, чтобы заработала иррациональность, он ошибался, утверждая (в фразе, которую я процитировал), что оно является необходимым. Похожую ошибку совершают те, кто утверждает, что реакции инстинктивного страха рациональны, тогда как можно только сказать, что они являются адаптивными. Когда я вижу на тропинке нечто похожее на змею или на палку, следует сразу убежать, а не заниматься сбором дополнительной информации. Кажется, что люди жестко запрограммированы на такие действия. Такой побег не является в строгом смысле слова рациональным, поскольку он не вызван механизмом рационального принятия решений, и все же он имитирует рациональность в том смысле, что, будь названный механизм задействован в данной ситуации, он привел бы к такому же действию. Когда издержки, связанные со сбором информации (глава XII), велики, рациональный агент не будет собирать ее в большом количестве. Однако тенденция убежать зачастую вызвана не этими расчетами, но предшествует им[162].

Предпочтения и порядковая полезность

При тщательном анализе становится ясно, что первое требование оптимальности заключается в том, что действие должно быть наилучшим средством удовлетворения желаний агента с учетом его представлений об имеющихся вариантах выбора и их последствиях. Что такое «наилучшее», определяется в категориях предпочтительности или предпочтения: наилучшее – то, лучше чего нет с точки зрения агента. Из этого не следует, что желания эгоистичны. Грубая ошибка – путать рациональность с эгоизмом, хотя этому способствует практика некоторых теоретиков рационального выбора. Точно так же нет необходимости в стабильности желаний, даже в минимальном смысле исключения изменений предпочтения во времени. Агент, который под влиянием эмоций или наркотиков выбирает А вместо В, действует рационально, выбрав А, даже если при других обстоятельствах он выберет В, а не А. Подобный случай (см. главу VI) происходит, когда значение, которое агент придает будущим последствиям настоящего выбора, в результате указанных влияний уменьшается.

Для начала следует дать хорошее определение «наилучшему». Его обеспечивают два условия[163]. Во-первых, предпочтения должны быть транзитивными (transitive). Предположим, что есть опции А, В и С. Если человек полагает, что А по меньшей мере не хуже, чем В, а В по меньшей мере не хуже, чем С, то он также должен полагать, что А не хуже, чем С. Если транзитивность не работает, например, если человек предпочитает строго А, но не В; В, но не С; С, но не А, у него может и не быть наилучшего выбора. Более того, другой человек может воспользоваться этим фактом, предложив агенту перейти от менее предпочтительного к более предпочтительному выбору в обмен на деньги. Поскольку предпочтения цикличны, эта операция может повторяться бесконечно, приведя человека к катастрофе путем пошаговых улучшений[164].

Такая ситуация может возникнуть, если агент ранжирует варианты путем подсчета параметров (counting aspects). Предположим, я предпочитаю одно яблоко другому, если оно лучше по крайней мере по двум из трех параметров, а именно цене, вкусу и склонности к порче. Если яблоко А превосходит В по цене и вкусу, яблоко В превосходит С по цене и склонности к порче, а яблоко С превосходит А по вкусу и склонности к порче, транзитивность нарушается. Хотя такая вероятность относительно неважна при индивидуальном выборе, где она отражает лишь несовершенство практического способа оценки, мы увидим (глава XXV), что она более значима при коллективном выборе.

Иная проблема возникает, когда безразличие не может стать транзитивным. Мне может быть безразлично, предпочесть А или В либо В или С, потому что различия в каждой паре слишком незаметны, но я могу остановить выбор на С, а не на А, так как разница между ними существенна. Есть вариант, который является наилучшим, а именно С, но агента все еще можно склонить к худшему выбору, сделав ему серию предложений (обменять С на В и В на А), от которых у него нет причин отказываться и которые он, соответственно, может принять. Применение к агенту с нетранзитивными предпочтениями определения иррациональный оправдывает не столько отсутствие наилучшего варианта, сколько тот факт, что он может принять предложения, которые ухудшат его положение.

Чтобы удостовериться в неизменной осмысленности идеи наилучшего выбора, можно также потребовать, чтобы предпочтения были полными (complete): для любых двух результатов агент должен иметь возможность определиться, предпочитает он первый или второй вариант, второй или первый либо они оба ему безразличны. Если он не в состоянии ответить ни на один из этих вопросов, он, возможно, не в состоянии определить, какой вариант является наилучшим. Я подробнее остановлюсь на неполноте в конце главы. Здесь я хочу отметить, что, в отличие от отсутствия транзитивности, отсутствие полноты не означает неудачу. Предположим, я хочу дать мороженое одному из двух детей, который получит от него наибольшее удовольствие. Чтобы сформировать мое предпочтение, мне нужно иметь возможность сравнить их уровни удовлетворенности, когда они получат мороженое. Однако часто это невыполнимая задача. Моя неспособность сделать это не является неудачей в том смысле, что я мог бы поступить правильнее, но просто отражает житейский факт.

Во многих случаях транзитивность и полнота предпочтений – это все, что нам требуется, чтобы определить рациональный выбор. Однако иногда удобно представить предпочтения численно, что часто называют значениями полезности (utility values), присваиваемыми вариантам выбора. Чтобы обеспечить такую возможность, мы налагаем на предпочтение еще одно условие – непрерывность (continuity). Если каждый вариант в последовательности А1, А2, А3, … предпочтительнее, чем В, а последовательность стремится к А, тогда А предпочтительнее, чем В. Если В предпочтительнее, чем любой вариант в последовательности, В предпочтительнее, чем А. Контрпримером может послужить лексико-графическое предпочтение: набор из благ А и В в количествах (А1, В1) предпочтительнее другого набора (А2, В2), тогда, и только тогда, когда либо A1 >A2 либо (A1 = A2 и B1 >B2). В таком ранжировании предпочтений наборы (1,1; 1), (1,01; 1), (1,001; 1) …, предпочтительнее (1; 2), который предпочтительнее (1; 1). Можно сказать, что первый компонент набора благ несравнимо важнее второго, потому что никакое дополнительное количество блага В не может компенсировать малейшую потерю блага А[165]. Проще говоря, компромисс невозможен. Таким образом, эти предпочтения не могут быть представлены кривыми безразличия. Если лексико-графические предпочтения редко применимы к обычным потребительским благам, они могут иметь значение при политическом выборе. Избиратель может предпочесть кандидата А кандидату В, потому что у первого более четкая позиция по вопросу о запрете абортов либо если у них одинаковая позиция по этому вопросу и А предлагает более низкие налоги, чем В. Для таких избирателей мирская ценность денег ничто в сравнении со священным даром жизни.

Если предпочтения агента полные, транзитивные и последовательные, мы можем представить их функцией непрерывной полезности u, которая присваивает число u (А) каждому варианту (А). Вме с то того что бы говорить, что рациональный агент выбирает наилучший осуществимый вариант, мы можем сказать, что агент максимизирует полезность. В данной фразе полезность – всего лишь условное обозначение для предпочтений с определенными свойствами. Чтобы это понять, можно отметить, что единственное требование для функции u, чтобы она могла представить порядок предпочтений, заключается в том, что А предпочтительнее В тогда, и только тогда, когда u (А) >u (B). Если u всегда положительно е, v = u2 также может представить тот же порядок предпочтений, хотя v присваивает бо́льшие или (для < 1) меньшие значения, чем u. Абсолютные числа значения не имеют, только их относительные или порядковые (ordinal) величины. Таким образом, идея максимизации полезности не предполагает, что агент занят добычей максимально возможного количества некоего психического вещества. Она, однако, исключает такие иерархии ценностей, которые воплощены в лексико-графических предпочтениях. Они не могут быть представлены функцией полезности.

Количественная полезность и отношение к риску

Часто агенты сталкиваются с рискованными альтернативами, то есть с выбором, который при известных вероятностях может иметь более одного возможного варианта исхода. Может показаться, что рациональный агент выберет вариант с наибольшей ожидаемой полезностью, включающей как выигрыш от каждого исхода, так и вероятность его выпадения. Сначала для каждого варианта агент проведет оценку полезности каждого следствия с точки зрения его вероятности, суммирует все результаты, а затем выберет вариант с максимальной суммой.

Однако порядковая полезность не позволяет нам разъяснить эту идею. Предположим, есть два варианта – А и В. А может произвести результат О1 или О2 с вероятностью ½ и ½, тогда как В может дать результат О3 или О4 с вероятностями ½ и ½. Возьмем теперь функцию полезности u, которая присваивает значения 3, 4, 1 и 5 для соответственно О1, О2, О3, О4. Ожидаемая порядковая полезность для А составляет 3,5, а для В – 3. Если мы вместо этого будем использовать функцию v = u², значения будут составлять 12,5 и 13. И та и другая функции представляют предпочтения, но они выделяют в качестве наилучших разные варианты. Ясно, что такой подход бесполезен.

Можно добиться лучшего результата, но с некоторыми концептуальными издержками. Подход, который связывают с именами Джона фон Неймана (John von Neumann) и Оскара Моргенштерна (Oskar Morgenstern), показывает, что вариантам можно присваивать значения полезности, которые имеют количественное (или кардинальное), а не только порядковое (или ординальное) значение. Примером присваивания количественных значений может служить температура. Меряем мы температуру в градусах по Цельсию или по Фаренгейту, это не влияет на истинность высказывания «Средняя температура в Париже выше, чем средняя температура в Нью-Йорке» (если бы температура измерялась порядковым образом, высказывание не имело бы смысла). Истинность же высказывания «В Париже в два раза жарче, чем в Нью-Йорке», напротив, зависит от выбора шкалы измерения. Однако хотя истинность конкретных высказываний об интенсивностях зависит от шкалы измерения, для других высказываний это не так. Истинность высказывания «Разница температур между Нью-Йорком и Парижем больше, чем между Парижем и Осло», например, не зависит от выборы системы измерения. Сходным образом мы можем сконструировать количественные меры полезности, которые отражают (помимо прочего, как мы увидим) интенсивность предпочтений, а не только порядковое ранжирование вариантов. Они дают нам возможность сравнить выигрыш (или проигрыш) в полезности при переходе от х к (х+1) и от (х+1) к (х+2), то есть позволяют говорить о возрастающей или снижающейся предельной полезности (marginal utility), лишенных смысла при измерении порядковой полезности.

Технические детали такого конструирования нас касаться не должны, поскольку для настоящих целей достаточно простой базовой идеи. Мы начнем с допущения, что у агентов есть предпочтения по отношению не только к вариантам выбора, но к лотереям (lotteries) вариантов, включая выродившуюся лотерею (degenerate lottery), состоящую в безусловном получении базового выигрыша. Для любого конкретного набора вариантов или призов лотерея определяет вероятность получения каждого из них с суммарной вероятностью, равной 1. Предполагается, что агенты в таких лотереях имеют полные и транзитивные предпочтения. Кроме того, считается, что для предпочтений действует аксиома независимости: на предпочтения, оказываемые лотереям p и q, не влияет их комбинирование одним и тем же образом с третьей лотереей r. Эффект определенности, о котором говорилось в главе VII и который будет еще обсуждаться в главе XII, нарушает эту аксиому.

Наконец, предполагается, что предпочтения демонстрируют форму непрерывности, определяемую следующим образом. Предположим, базовые варианты включают лучший элемент А и худший элемент В. Мы произвольно присваиваем им значения полезности 1 и 0. Непрерывность означает, что для любого промежуточного варианта С есть вероятность р (С), которая делает агента безразличным к тому, получить С наверняка или поучаствовать в лотерее, которая даст ему А с вероятностью р (С) и В с вероятностью 1 – р (С)[166]. Затем мы принимаем кардинальную полезность u (С) равной р (С). Это число является, конечно, произвольным, потому что такими же являются конечные полезности. Предположим, мы присвоим значения М и N соответственно элементам А и В (M>N). Определяем полезность С как ожидаемую полезность лотереи pM + (1 – p) N = Mp – N – N p = (M – N) p + N.

Полученный класс функций полезности гораздо меньше, чем класс функций порядковой полезности[167]. Легко видеть, что если вариант Х имеет бо́льшую ожидаемую полезность, чем Y, в соответствии с одной функцией, то это же он будет иметь и в соответствии с другой. Так, мы можем с уверенностью утверждать, что рациональный агент максимизирует ожидаемую полезность.

Функции количественной полезности имеют важное свойство линейности по вероятности. Давайте введем обозначение XpY, означающее лотерею, в которой предлагается вероятность р получения Х и (1 – р) получения Y. При использовании шкалы с конечной точкой 1–0 полезность u (X) равна вероятности q, при которой агент у безразлично, выбрать Х или лотерею A q B. Точно так же полезность u (Y) равна вероятности r, при которой агенту безразлично, выбрать Y или лотерею ArB. XpY, таким образом, предлагает полезность, эквивалентную шансу р на получение А с вероятностью q и шансу (1 – р) на получение А с вероятностью r. Таким образом, полезность XpY составляет pq + r (1 – p), то есть p раз полезность Х плюс (1 – р) раз полезность Y. Например, полезность вероятностной комбинации 3 шансов из 5 получить Х и 2 из 5 получить Y равна 3⁄5 q + 2⁄5 r.

Здесь возможны следующие возражения. Предположим, у фермера есть выбор между двумя культурами: традиционной разновидностью, которая с равной вероятностью может дать хороший или средний урожай в зависимости от погоды, и современной, которая с равной вероятностью может дать отличный или плохой урожай. Предположим, количественная полезность 3 и 2 для более старой культуры, 5 и 1 для более новой. Поскольку ожидаемая полезность новой культуры больше, то фермер должен выбрать ее. Но – и в этом суть возражения – разве при этом не упускается из виду то, что фермер может не иметь склонности к риску и неохотно примет любой вариант, допускающий настолько низкий уровень полезности, как 1? Возражение, однако, включает двойной счет, так как нежелание рисковать уже инкорпорировано в построение количественных полезностей. При допущении, что А, В и С получают значения 100, 0 и 60, u (C) вполне может составить 0,75 для человека, не склонного к риску, предполагая, что ему безразлично, получить 60 наверняка или участвовать в лотерее, в которой у него 25 %-й шанс ничего не получить и 75 %-й – получить 100. Подобный аргумент применим к присваиванию значений количественной полезности физическим объемам урожая.

В качестве еще одного примера рассмотрим получения разрешения опеки над ребенком (см. рис. XI.2). Горизонтальная ось может быть понята двояко – как предполагающая физическое разделение опеки (процент времени, проведенного с ребенком) либо вероятностное разделение (шансы получить по суду полную опеку). Количественная полезность равного разделения времени – AE, что больше, чем полезность AC 50 %-й вероятности полной опеки. (Здесь мы апеллируем к тому факту, что количественная полезность линейна по вероятности.) Причина в том, что большинство людей в подобной ситуации демонстрируют нежелание рисковать. Они соглашаются на совместную опеку, потому что 50 %-й риск не иметь возможности видеть ребенка слишком не приемлем. Только если родитель полагает, что его или ее шансы получить полную опеку выше, чем q процентов, судебное разбирательство становится предпочтительнее совместной опеки. Значительное число разбирательств об опеке в судах свидетельствует не о склонности родителей к риску, а о принятии ими желаемого за действительное, выражающемся в переоценке своих шансов на получение полной опеки над ребенком.

РИС. XI.2

Неприятие риска и убывающая предельная полезность

Несмотря на верность общего хода рассуждений, предшествующее изложение может направить по неверному пути. Некоторые работы на эти темы склонны стирать различие между неприятием риска и уменьшающейся предельной полезностью. Для развития этой идеи мне потребуется ввести концепцию, которая, как подсказывает интуиция, имеет смысл, хотя ее (до сих пор) было нелегко измерить. Это идея внутренней полезности (intrinsic utility) некоего блага, отражающая интенсивность предпочтений агента. Интроспекция со всей очевидностью показывает, что некоторые блага или навыки дают огромное наслаждение, другие – простое удовлетворение, еще одни вызывают легкое раздражение, а какие-то просто ужасны. Очевидно, что представлять различия между ними в категориях количественных предпочтений («Я предпочитаю рай аду точно так же, как я предпочитаю четыре яблока трем») – значит пользоваться крайне обедненным представлением о благополучии или пользе. Тот факт, что у нас нет надежного способа присваивания числовых значений внутренним уровням удовлетворенности или неудовлетворенности, не свидетельствует о безнадежности самой идеи. В равной мере наша неспособность квантифицировать и сравнивать уровни удовлетворенности разных индивидов не доказывает, что идея сравнения межличностного благополучия лишена смысла.

РИС. XI.3

В этой перспективе может быть понята идея убывающей предельной полезности многих благ. Для бедного человека первые доллары имеют бо́льшую полезность, но каждый следующий доллар становится менее ценным с субъективной точки зрения. Каждый курильщик знает, что самая лучшая сигарета – первая, утренняя, что от курения получаешь больше удовольствия, если сдерживаешь себя и не куришь слишком часто. По сути выкуривание сигареты имеет два эффекта: производство удовольствия в настоящем и уменьшение удовольствия от сигарет, которые будут выкурены в будущем.

Второй эффект, однако, необязательно должен быть негативным. Обратимся еще раз к случаю с опекой над ребенком. Полдня, проведенные с ребенком один раз в две недели, могут принести родителю не столько радость, сколько фрустрацию. Полдня каждые выходные приносят в два раза большее удовольствие, потому что укрепление эмоциональной связи, благодаря более частым встречам, делает их ценными для обеих сторон. На другом конце временно́го спектра сверхудовлетворение от пребывания с ребенком в течение семи дней в неделю превосходит соответствующее субъективное восприятие пребывания с ним шесть дней и т. д. за счет преимущества неограниченного планирования, которую обеспечивает полная опека. Фактически общение с ребенком имеет возрастающую предельную (действительную) полезность, как показано на рис. XI.3.

Горизонтальная ось интерпретируется как процент времени, проведенного с ребенком. По указанной выше причине каждый дополнительный час более ценен, чем предшествующий. Это утверждение прекрасно совместимо с анализом, на котором основан рис. XI.2. Предельная полезность времени, проведенного с ребенком, может снижаться, если понимается как количественная полезность, но возрастать – если понимается как действительная. Из факта, что только первая часть этого утверждения может быть измерена, не следует, что вторая его часть лишена смысла.

Хотя функции количественной полезности всегда порождаются двумя лежащими в их основе психологическими факторами – отношением к риску и действительной полезностью, их нельзя измерять раздельно. Строго говоря, мы не можем знать, является кривая OED на рис. XI.2 производной от нейтральности риска в сочетании со снижающейся предельной действительной полезностью времени, проведенного с ребенком, или от неприятия риска в сочетании с возрастающей предельной внутренней полезностью этого времени. В конкретном случае интуиция может подсказать нам, насколько та или иная интерпретация более правдоподобна. Некоторые родители относятся ко времени, проведенному с детьми, так же, как бабушки и дедушки, – небольшими дозами неплохо, но в больших количествах утомляет. В то же время такие родители могут не слишком беспокоиться о риске полного отсутствия общения с ребенком (нейтральное отношение к риску). Другие родители могут отличаться в обоих отношениях, порождая такие же функции количественной полезности. Повторю снова и снова: такие утверждения не могут быть строгими (пока), но очевидно, что они имеют смысл[168].

Рациональные убеждения

Мы заканчиваем обсуждение первого компонента рационального выбора – выбор наилучших средств для осуществления своих желаний с учетом убеждений. Ясно, что это только необходимое, но недостаточное условие для рациональности. Если я хочу убить соседа и считаю, что лучший способ кого-то убить – сделать его куклу и воткнуть в нее булавку, я буду действовать рационально (в том, что касается первого компонента), если сделаю куклу соседа и воткну в нее булавку. Но, за исключением особых обстоятельств, такое убеждение вряд ли рационально[169].

Рациональные убеждения формируются посредством обработки имеющихся данных с использованием процедур, которые в среднем должны с наибольшей вероятностью формировать истинные убеждения. Предположим, мы хотим получить представление о вероятности дождя 29 ноября, то есть ровно через неделю. Возможно, нам придется всего лишь просмотреть статистику выпадения осадков в предшествующие годы и предположить, что (ожидаемое) будущее будет похоже на прошлое. Но по мере приближения 29 ноября настоящая ситуация с осадками может заставить нас изменить ожидания. Если в ноябре часто идет дождь, а небо день за днем остается безоблачным, мы можем сделать вывод, что существует фронт высокого давления, который делает дождь 29 ноября менее вероятным.

Процесс пересмотра убеждений часто называют обучением Байесовым методом (названным так по имени священника XVIII века Томаса Байеса). Предположим, что мы имеем первоначальное (предварительное) субъективное распределение вероятностей, касающихся различных положений вещей. В приведенном примере предварительное распределение было выведено из частотности в прошлом. В других случаях это может быть просто догадка. На основании своей интуиции я, например, могу присвоить 60 %-ю вероятность тому, что премьер-министр компетентен. Мы можем наблюдать за действиями, которые он предпринимает на должности, и за их результатами, например коэффициентом роста экономики. Предположим, мы можем сформировать оценку вероятности этих наблюдений с учетом компетентности премьер-министра. При компетентном премьер-министре у нас 80 %-е ожидание хорошего результата, при некомпетентном – 20 %. Байес показал, как скорректировать наши первоначальные вероятности, касающиеся компетентности премьер-министра, с учетом наблюдений.

Предположим, что есть только два возможных исхода – хороший и плохой, и что мы наблюдаем хороший. Если мы присваиваем р (а) вероятности, что будет получено а, и р (а|b) условной вероятности (conditional probability) получения а, если будет получено b, мы предположили, что р (премьер-министр компетентен) = 60 %, р (премьер-министр некомпетентен) = 40 %, р (хороший исход | премьер-министр компетентен) = 80 % и р (плохой исход | премьер-министр некомпетентен) = 20 %. Мы пытаемся вычислить р (премьер-министр компетентен | хороший результат). Для обозначения мы используем буквы а и b, соответственно для компетентности и хорошего исхода. Тогда в начале мы можем отметить p (а|b) = p (a&b) / p (b) (*)

Условная вероятность p (а|b) равна вероятности получения а и b, поделенной на вероятность b. Это вытекает из интуитивного предположения, что p (a&b) равна p (b), у множенной на p (а|b). Разделив обе части этого уравнения на р (b), мы получаем уравнение (*).

Снова используя уравнение (*), поменяв местами a и b, мы имеем p (b|a) = p (a&b) / p (a), что равнозначно p (a&b) = p (b|a) p (a).

Подставляя последнее выражение в (*), мы получаем p (a|b) = p (b|a) p (a) / p (b). (**)

Есть два способа, которым может произойти b (хороший исход) с компетентным или некомпетентным премьер-министром. Вероятность того, что случится одно из двух взаимоисключающих событий, является суммой вероятностей каждого события. Мы, таким образом, можем записать p (b) = p (b&a) + p (b&не-а), которое, согласно рассуждению в абзаце, следующим за (*), равнозначно p (b|a) p (a) + p (b|не-а) p (не-а).

Если мы подставим это выражение для p (b) в (**), получим теорему Байеса p (a|b) = p (b|a) p (a) / [p (b|a) p (a) + p (b|не-а) p (не-а)].

Замещение числовых вероятностей в правой части этого уравнения показывает, что p (a|b) = 80 %, то есть наблюдение успешного исхода повышает вероятность того, что премьер-министр компетентен, с 60 до 80 %. Наблюдение второго и третьего положительного исхода поднимут его до 91 и 97 %[170]. Если, по первоначальным оценкам другого человека, р (а) = 0,3, а не 0,6, три последующих позитивных наблюдения поднимут его оценку сначала до 0,53, потом до 0,75 и, наконец, до 0,89. Таким образом, возможно, что не имеет значения, надежными или ненадежными были первоначальные предположения, поскольку по мере поступления новой информации откорректированные убеждения становятся все более достоверными. Со временем первоначальная разница во мнениях может быть нивелирована новыми данными[171]. Заметим (глава XXIII), что каждый новый фрагмент информации оказывает меньшее воздействие, чем предыдущий.

Оптимальное инвестирование в сбор информации

Третий компонент рационального действия – оптимальное инвестирование ресурсов (таких как время или деньги) в добывание новой информации. Как показано на рис. XI.1, есть несколько детерминант этого оптимума. Во-первых, какое количество информации рационально получить, зависит от желаний агента[172]. Например, агент, который не слишком заботится о наградах в отдаленном будущем, не будет много вкладывать в определение срока службы товара длительного пользования. Очевидно, что имеет смысл собирать больше информации при принятии важного решения, например при покупке дома, чем при выборе между двумя бутылками одинаково дорогого вина. В последнем случае можно просто подбросить монету, если предполагаемые издержки на определение того, что лучше, превосходят ожидаемую выгоду (основанную на предварительном знании качественного диапазона для вина в данной ценовой категории) от употребления вина более высокого качества.

Желания и предварительные представления совместно определяют выгоды, ожидаемые от новой информации. Иногда можно с высокой точностью сказать, сколько дополнительных человеческих жизней будет спасено благодаря определенному анализу на рак или, переводя все на уровень агента, насколько вероятно, что будет спасена его жизнь. Ценность жизни зависит от того, как ее обменивают на другие желаемые цели. Согласно одному расчету, для того чтобы подвигнуть человека, занятого на опасной работе (например, при добыче угля), принять один шанс гибели от несчастного случая из тысячи на протяжении года, потребуется премия около 200 долларов в год. Таким образом, в тот момент, когда был проведен этот расчет, ценность жизни составляла около 200 тысяч долларов[173]. Предполагаемые издержки на получение новой информации, определяемые предшествующими убеждениями, также иногда могут быть определены. Для того чтобы диагностировать рак прямой кишки, принято проводить шесть недорогих анализов кала. Выгоды от первых двух анализов велики. Однако для каждого из четырех последних анализов издержки на определение (даже не на лечение) дополнительных случаев рака, как выяснилось, составляют соответственно 49 150, 469 534, 4 724 695 и 47 107 214 долларов.

Оптимальный поиск информации может зависеть от результатов самого поиска (на рис. XI.1 на это указывает петля). Когда тестируется новый медицинский препарат, принимается предварительное решение давать его лишь одной из двух групп пациентов. Однако когда препарат за короткое время показывает хорошие результаты, становится неэтичным скрывать его от контрольной группы. Этот аргумент применим и к отдельному рациональному агенту. Представим: я в лесу собираю ягоды. Ягоды растут группами, поэтому я готов потратить некоторое время на поиски прежде, чем начать сбор. Если мне повезет и я сразу найду ягодное место, то с моей стороны будет глупо продолжать поиск.

Мы можем рассматривать сбор информации как теневое действие (shadow action), сопровождающее основное. Прежде чем что-то делать, мы должны решить, сколько информации нужно собрать. Иногда теневое и основное действия могут совпадать, по крайней мере частично. Предположим, лидеры государства оценивают целесообразность начала войны против другого государства. В качестве примера можно взять вторжение Германии во Францию в 1940 году. Информация имела ключевое значение при принятии окончательного решения. Руководители страны должны были знать объективные возможности предполагаемого противника, а также «организацию, обычаи и привычки вражеской армии» (из немецкой инструкции «Обязанности сотрудников Генерального штаба»). Большая часть такой информации может быть собрана традиционным методами, включая шпионаж. Однако чтобы определить моральное состояние врага, его боевой дух, единственное средство – сразиться с ним.

Неопределенность

Два последних примера – сбор ягод и подготовка к войне – также помогают нам обнаружить ограничения теории рационального выбора, а точнее, одно из двух ее ограничений. В качестве инструмента объяснения эта теория может потерпеть неудачу одним из двух способов. С одной стороны, она может не суметь предсказать, что будут делать люди в конкретной ситуации. С другой стороны, люди могут не оправдать эти прогнозы, вне зависимости от того, насколько четко они были сформулированы. Второй тип неудачи, иррациональность, станет темой следующей главы. Первый – неопределенность – является предметом следующих замечаний.

Агент может не суметь определить наилучший элемент в наборе осуществимых возможностей по одной из двух причин. Потребителю может быть безразличен выбор между двумя вариантами, которые в равной и наибольшей степени хороши. В обыденных ситуациях это происходит, когда потребитель сталкивается с выбором между двумя идентичными банками супа в супермаркете. В нетривиальных случаях варианты могут различаться по нескольким параметрам, так что эти различия в точности взаимно уравновешивают друг друга. Нетривиальные случаи редки, но все же существуют. Если мне предложено выбрать между двумя автомобилями, различающимися ценой, уровнем комфорта, внешним видом, скоростью и так далее, я, возможно, предпочту один, а не другой, будучи в действительности к ним безразличен. Если бы я не был безразличен, то 5 %-я скидка на одну машину должна была бы склонить в пользу этого варианта. Интуиция подсказывает, что такое вряд ли случится.

РИС. XI.4

Предпочтения потребителя могут быть неполными. Предположим, я осмотрел пять моделей автомобилей – А, В, С, D, E, расставив их, как показано на рис. XI.4 (стрелки обозначают отношения предпочтений). Моя неспособность сравнить С и D не имеет значения, потому что я ни один из них не выберу.

Невозможность сравнить А и В, напротив, ставит меня в затруднительное положение. Да, я могу попытаться собрать дополнительную информацию, но как я определю, что игра стоит свеч? Вскоре я вернусь к этой проблеме, однако прежде позвольте указать на другой и, может быть, более важный источник неполных предпочтений. Как правило, выбор того или иного варианта задан предпочтением определенного результата. Я склоняюсь к некоему варианту, потому что его итог, то есть его ожидаемая полезность в сравнении с другими вариантами, для меня предпочтителен. Если же это скорее неопределенная или неизвестная, а не рискованная ситуация (глава VII), я не имею возможности сравнить результаты[174]. Говоря бессмертными словами доктора Джонсона, «жизнь коротка, и не следует тратить слишком большую ее часть на размышления о том, как ее следует потратить: размышления, которые те, кто начинает их из благоразумия и продолжает с искусностью, должны после долгих затрат мысли закончить наугад. Чтобы предпочесть один будущий образ жизни другому на справедливых основаниях, требуются способности, которым Господь не соблаговолил нас наградить»[175].

Дальнейшая неопределенность возникает из-за сложности определения оптимальных затрат на сбор информации. Когда я собираю ягоды на незнакомой территории, сколько времени я должен искать самое ягодное место и когда именно должен начать их собирать? Если только я сразу не напал на ягодное место, имеет смысл какое-то время продолжать поиски. При этом я не хочу заниматься поисками до ночи, потому что тогда наверняка уйду домой с пустой корзиной. Между нижним и верхним пределом во времени, которое нужно потратить на поиски, лежит обширный интервал неопределенности.

Иная проблема возникает в случае подготовки к войне. Если основное и теневое решения совпадают, то сторона, занятая подготовкой, все равно обречена (по крайней мере частично) оставаться в состоянии неопределенности. Теория рационального выбора не может служить верным ориентиром в таких случаях, будучи эффективной в четко очерченных ситуациях, в которых многое известно (таких как анализы на рак, например), но гораздо менее полезна в незнакомой обстановке.

Тратить меньше времени, определенного нижней границей, и больше, чем допускает верхняя, было бы иррационально. Ни один акт выбора, который агент совершает внутри этого интервала, не может быть охарактеризован как иррациональный. Можно подумать о том, чтобы отказаться от идеи рациональности в пользу идеи не-иррациональности. Эта откорректированная версия данной теории позволила бы нам объяснять больший диапазон вариантов поведения при более скромных возможностях прогнозирования. Большинство сторонников этой теории, думаю, не захотели бы пересматривать ее в таком ключе. То, что их прежде всего привлекает к этой теории, – это именно открываемая ею перспектива получения однозначных предсказаний. Ей это удается благодаря элементарному математическому факту: любая удобная для анализа (well-behaved) функция полезности, определенная на удобном для анализа достижимом множестве, дает максимальное значение для единственного члена этого множества. Взаимодействие между достижимым множеством и кривыми безразличия на рис. IX.1 дает хорошее представление о простоте этой идеи, демонстрирующей все, на что она способна.

Самый важный источник неопределенности убеждений возникает при стратегическом взаимодействии, когда каждый агент формирует свои убеждения о том, что с наибольшей вероятностью будут делать другие на основании их убеждений, зная при этом, что аналогичным образом они рассуждают в отношении него самого. В некоторых случаях, рассматриваемых в главе XIX, структура вознаграждения не позволяет агентам сойтись на общем наборе убеждений.

Рациональность насквозь субъективна

Позвольте завершить обсуждение теории рационального выбора, снова подчеркнув ее радикально субъективную природу. Наверняка кто-то понимает слово рациональный в объективном смысле, подразумевая, что рациональный агент тот, кто принимает решения, которые делают его жизнь лучше в соответствии с объективными критериями, такими как долгая продолжительность жизни, здоровье и доход. Однако при таком понимании эта идея не будет иметь никакой объясняющей способности. Как я подчеркивал, последствия решения не могут его объяснить. Только ментальные состояния, которые предшествуют решению, позволяют нам объяснить действия как оптимальные с точки зрения агента, а не характеризовать их как полезные или благотворные с точки зрения постороннего наблюдателя (или того же агента в следующий момент времени).

Предположим, я страдаю от глубокой неспособности откладывать удовлетворение, то есть не в состоянии принимать в расчет будущие последствия настоящего поведения. Допустим также, что ученые изобрели таблетку дисконтирования, которая усилит вес будущих вознаграждений в настоящих решениях. Если я приму таблетку, моя жизнь улучшится. Мои родители будут рады, если я ее приму. Оглядываясь назад, я сам буду доволен тем, что принял ее. Но если у меня есть выбор – принимать таблетку или не принимать, я откажусь от нее, если я рационален. Любое поведение, которое может вызвать таблетка, уже находится для меня в зоне достижимости. Я мог бы бросить курить, начать заниматься зарядкой или откладывать деньги прямо сейчас, но я этого не делаю. Поскольку я не хочу это делать, я не захочу принять таблетку, которая заставит меня это делать. Точно так же эгоистичный человек откажется от «таблетки альтруизма», а альтруист откажется от «таблетки эгоизма». Если я люблю свою семью и отчасти готов пожертвовать ради нее своим гедонистическим образом жизни, я отказался бы от таблетки с двухступенчатым эффектом понижения их благополучия, как отказался бы от любого варианта (например, дорогого обеда для себя), который произвел бы тот же эффект в один этап.

Чтобы усилить этот аргумент, предположим, что человек потребляет х сегодня и y завтра и что его коэффициент дисконтирования за один период составляет 0,5 (ему безразлично, получить одну единицу полезности завтра или пол-единицы сегодня). Примем для простоты, что u (x) = x и u (y) = y. Дискон тированная настоящая ценность его потребительского потока составляет x + 0,5y. Предположим, человек узнает, что завтра он будет испытывать боль, которая снизит полезность его потребления на 0,5. Теперь дисконтированная настоящая ценность его потребления x + 0,25y. Если рациональному агенту предложат бесплатный аспирин, который снимет боль, он его, естественно, примет, тем самым восстановив первоначальную настоящую ценность. Если бы он принял таблетку, которая индуцирует коэффициент дисконтирования, равный 1 (но не принял бы аспирин), исход был бы тем же в том смысле, что агенту был бы безразличен выбор между двухвременным потоком и одновременной полезностью x + 0,5y. Если бы агент принял аспирин и если эффект был бы таким же, как от таблетки дисконтирования, то почему бы ему не принять эту таблетку? Причина в том, что выбор такого варианта сдерживается потребностью в том, чтобы потребление, обусловленное приемом таблетки, превосходило таковое без нее, оцененное с точки зрения первоначальных предпочтений. Для выбора аспирина такого ограничения не существует, потому что нет разницы между предпочтениями до его приема и после. Даже без аспирина я предпочитаю иметь завтра возможность избавиться от боли. Когда это положение войдет в мой поведенческий репертуар, я решу его реализовать. Между тем поток полезности, вызванный таблеткой дисконтирования, уже присутствует в репертуаре, но я решаю им не пользоваться[176].

Другими словами, на выбор нужно смотреть глазами агента. Близорукому человеку, потерявшему свои очки, близорукость может помешать их найти. Он попал в ловушку[177]. Похожим образом рациональный агент может оказаться в ловушке убеждений, в которой он застрянет с ложной верой в то, что предполагаемые издержи на проверку убеждения слишком высоки. Таким образом, женщины, практикующие обрезание, могут находиться в ловушке убеждений. Бамбара из Мали верят, что клитор убьет мужчину, если вступит в контакт с пенисом во время совокупления. В Нигерии некоторые племена считают, что если головка ребенка во время родов коснется клитора, ребенок умрет. В Польше существовало распространенное убеждение, что если кто-то, кому под кожу вшит дисульфирам, выпьет, он умрет. На самом деле дисульфирам фармакологически инертен. Ложное убеждение, тем не менее, удерживает людей от его проверки.

Рациональность верований и их истинность – это совершенно разные вещи. Если истина – это отношение между убеждением и миром, рациональность – это особенность отношения между убеждением и фактами, которыми обладает агент. Хотя рациональность требует от агента вложений в информацию, этот вклад всегда ограничен ожидаемыми (и предполагаемыми) затратами и прибылями. Если считается, что сбор дополнительной информации имеет слишком высокие альтернативные издержки (opportunity costs), как это бывает перед лицом неминуемой опасности, возможно, рациональнее воздержаться от такого инвестирования. Если считается, что это влечет высокие прямые издержки (direct costs), как в случае с проверкой веры в то, что с имплантированным дисульфирамом пить смертельно опасно, только иррациональный человек будет делать подобные вложения. Обобщенно говоря, многие убеждения следует принимать за чистую монету из вторых рук, поскольку если мы возьмемся их проверять, то нам будет некогда заниматься собственной жизнью.

Любое объяснение поведения, основанное на выборе, субъективно. Хотя не все субъективные объяснения предполагают прозрачность агентов для самих себя и неустанные поиски оптимальности, составляющие отличительную особенность объяснений посредством рационального выбора. В следующей главе я буду рассматривать некоторые объяснения, которые отступают от теории рационального выбора в том или ином аспекте.

Библиографические примечания

Отношения между разумом (в том смысле, в каком это слово употребляется в главе IV) и рациональностью я развиваю в моей инаугурационной лекции в «Коллеж де Франс» «Разум и доводы» (Raison et raisons. Paris: Fayard, 2006). Подробнее о Вебере и рациональности можно прочесть в моей статье «Рациональность, экономика и общество» (Rationality, economy, and society // Turner S. (ed.). T e Cambridge Companion to Weber. Cambridge University Press, 2000). Классическое изложение теории полезности можно найти в «Играх и решениях» Р. Д. Льюса и Х. Райффы (Льюс Р., Райффа Х. Игры и решения. М.: Иностранная литература, 1962). Стоит посмотреть и оригинальную работу Дж. фон Неймана и О. Могенштерна «Теория игр и экономическое поведение» (Нейман Дж. фон, Могенштерн О. Теория игр и экономическое поведение. М.: Наука, 1970). Выдающееся изложение теории рационального выбора (и ее проблем) есть в книге «Рациональный выбор в неопределенном мире» Р. Хести и Р. Доуза (Hastie R., Dawes R. Rational Choice in an Uncertain World. T ousand Oaks, CA: Sage, 2001). Я подробно обсуждаю опеку над детьми в главе 3 «Соломоновых решений» (Solomonic Judgments. Cambridge University Press, 1989). Отличное введение в теорию Байеса можно найти во «Введении в байесовский вывод и Байесово решение» Р. Винклера (Winkler R. An Introduction to Bayesian Inference and Decision. Gainesville, FL: Probabilistic Publishing, 2003). На мой аргумент о том, что рациональный человек не станет принимать таблетку дисконтирования, повлиял обмен мнениями с Гэри Бекером (Gary Becker) и Питером Даймондом (Peter Diamond); см. также «Рассуждения о формировании терпения. Необходимость концептуальных различений» О. Дж. Скога (Skog O. J. T eorizing about patience formation: T e necessity of conceptual distinctions // Economics and Philosophy. 2001. No. 17. P. 207–219). Идею убеждений как ловушки я взял из Дж. Макки «Пеленание ног и инфибуляция» (Mackie G. Ending footbinding and infibulation: A convention account // American Sociological Review. 1996. No. 61. P. 999 – 1017). Полезное исследование о важности шпионажа в подготовки к войне – книга «Странная победа. Завоевание Гитлером Франции» Э. Мея (Мэй Э. Странная победа. М.: АСТ, 2009). Информацию об имплантации дисульфирама в Польше я почерпнул из книги В. Осетински «Алкоголизм: грех или болезнь?» (Osiatynski W. Alcoholism: Sin or Disease? Warsaw: Stefan Batory Foundation, 1997), а данные о ее неэффективности из Дж. Йонсен и Дж. Мерленд «Препарат дисульфирама замедленного действия: экспериментальные и клинические результаты» (Johnsen J., Mørland J. Depot preparations of disulf ram: Experimental and clinical results // Acta Psychiatrica Scandinavica. 1992. No. 86. P. 27–30).

XII. Рациональность и поведение

Предыдущая Стр. 13 из 29 Следующая