Моральное животное — страница 44 из 87

После того как все программы встретились друг с другом двести раз, Аксельрод суммировал баллы и объявил победителя. Затем, исключив самые неудачные стратегии, он провел второе соревнование: каждая программа была представлена пропорционально ее успеху в первом соревновании; иными словами, выжили сильнейшие. Поколение за поколением игра продолжалась. Если теория реципрокного альтруизма верна, следует ожидать, что он «эволюционирует» внутри компьютера Аксельрода и со временем станет доминировать.

Так и произошло. Программа-победитель, разработанная канадским специалистом по теории игр Анатолем Рапопортом (когда-то написавшим книгу «Дилемма заключенного»), называлась «Око за око»[358]. «Око за око» управлялась простейшим из правил – в буквальном смысле: программа оказалась самой короткой из представленных и состояла всего из пяти строчек. (Если бы эти стратегии были созданы случайной компьютерной мутацией, а не программистами, она, вероятно, возникла бы одной из первых). «Око за око» полностью соответствовала своему названию. При первой встрече с любой программой она выбирала сотрудничество, а в дальнейшем поступала так, как поступила другая программа при предыдущей встрече, – одним словом, как аукнется, так и откликнется.

Достоинства этой стратегии так же просты, как и сама стратегия. Если некая программа демонстрирует тенденцию к сотрудничеству, «Око за око» немедленно завязывает дружбу и обе наслаждаются плодами сотрудничества. Если же программа проявляет склонность к обману, «Око за око» воздерживается от сотрудничества до тех пор, пока программа не исправится. Таким образом, «Око за око» никогда не становится жертвой повторно, в отличие от программ, всегда готовых к сотрудничеству. С другой стороны, «Око за око» избегает судьбы программ, которые не сотрудничают никогда. Последние стараются эксплуатировать другие программы и в итоге оказываются связанными дорогостоящими цепями взаимного предательства с программами, которые в противном случае были бы рады сотрудничеству. Разумеется, «Око за око» обычно отказывается от больших одномоментных выгод, которые могут быть получены путем эксплуатации. Однако стратегии, ориентированные на эксплуатацию посредством постоянного или периодического предательства, в итоге проигрывают. Со временем другие программы перестают относиться к ним по-доброму; как следствие, они лишаются и больших выгод эксплуатации, и более скромных выгод взаимного сотрудничества. В перспективе условная «Око за око» оказалась самой успешной – успешнее, чем неизменно подлые, неизменно милые и слишком «умные» программы, чьи мудреные правила трудно просчитать.

«Око за око»

Стратегия программы «Око за око» – поступать с другими так же, как они поступили с вами, – придает ей большое сходство с поведением среднестатистического человека. И все же у нее нет человеческой интуиции. Она не понимает ценности реципрокации. В этом смысле она больше похожа на австралопитеков – наших предков с маленьким мозгом.

Какие же чувства должен был внушить неумному австралопитеку естественный отбор, чтобы заставить его применять умную стратегию реципрокного альтруизма? Ответ выходит за рамки простой, неразборчивой «симпатии», которую подчеркивал Дарвин. Поначалу симпатия такого рода, безусловно, окажется как нельзя кстати: пусть окружающие знают, что изначально мы настроены доброжелательно. Но в дальнейшем симпатию следует проявлять выборочно и подкреплять другими чувствами. Одной из гарантий ответной любезности являются чувства благодарности и долга. Тенденция отказывать в щедрости подлым австралопитекам могла реализовываться через злость и неприязнь, а тенденция хорошо относиться к подлым австралопитекам, которые исправились, – исходить из способности к прощению: универсального «ластика» для контрпродуктивной враждебности. Все эти чувства обнаруживаются во всех человеческих культурах.

В реальной жизни сотрудничество – штука не однозначная. Вы не встречаетесь с товарищем и либо узнаете от него ценную информацию, либо нет. Гораздо чаще вы просто обмениваетесь разрозненными данными; каждый сообщает что-то потенциально ценное для другого, но эти вклады равнозначны не всегда. В результате человеческие правила реципрокного альтруизма менее бинарны, чем правила «Око за око». Если некто Д был раньше мил и приветлив, вы можете ослабить бдительность и впредь делать ему одолжения без постоянного мониторинга ответного поведения; фактически вы следите только за явными признаками подлости и лишь изредка сверяете общий счет (сознательно или бессознательно). Аналогичным образом, если некто В был подл месяцами, лучше сбросить его со счетов. Ощущения, которые поощряют вас выбирать такой экономный (с точки зрения и времени, и энергии) образ действий, – привязанность и доверие (лежащие в основе понятия «друг») и враждебность и недоверие (составляющие понятие «враг»).

Дружба, привязанность, доверие – вот вещи, которые удерживали людей вместе задолго до того, как они придумали контракты и написали законы. Даже сегодня эти силы – одна из причин, по которым человеческие общества значительно превосходят муравейники размером и сложностью, хотя степень родства между взаимодействующими в их рамках людьми обычно близка к нулю. Наблюдая, как добрая, но жесткая стратегия «Око за око» распространяется в популяции, вы видите, как из случайных генетических мутаций возникают социальные узы – уникальное связующее средство, присущее человеческому виду.

Примечательно, что эти случайные мутации процветают без «группового отбора». Именно об этом говорил Уильямс в 1966 году: альтруизм по отношению к неродственникам хоть и является ключевой составляющей сплоченности группы, необязательно создан ради «блага племени» и тем более «блага вида». Похоже, он возник из простого, повседневного соперничества среди индивидов. В 1966 году Уильямс писал: «Теоретически нет предела распространению и сложности группового поведения, которое может вызвать этот фактор; непосредственной целью такого поведения всегда будет благополучие некоего другого индивида, часто генетически неродственного. В конечном итоге, однако, это не будет адаптацией, служащей выгоде группы. Подобное поведение будет развиваться за счет дифференцированного выживания индивидов и будет направлено на сохранение генов индивида, оказывающего услуги другому»[359].

Одним из важнейших условий для возникновения макроскопической гармонии из микроскопической эгоистичности является обратная связь между макро и микро. Чем больше приверженцев стратегии «Око за око» – т. е. чем выше социальная гармония, – тем выше благосостояние каждого из них. В конце концов, идеальным соседом для приверженца «Око за око» является другой приверженец «Око за око». Эти двое быстро и безболезненно устанавливают длительные и плодотворные взаимоотношения. Ни тот ни другой не боится «погореть», и ни у одного не возникает потребности «разориться» на взаимно дорогостоящее наказание. Таким образом, чем выше социальная гармония, тем лучше живется «Око за око», а значит, социальная гармония будет только расти. Посредством естественного отбора простое сотрудничество может окупаться само по себе.

Человеком, положившим начало современным исследованиям данного типа социальной когерентности, а также применения теории игр к эволюции, стал Джон Мейнард Смит. С помощью идеи «частотно-зависимого» отбора он показал, как два типа представителей синежаберного солнечника – пройдохи и добропорядочные члены популяции – могут существовать в равновесии: если число пройдох растет, они становятся генетически менее плодовитыми и их численность возвращается к норме. Сторонники стратегии «Око за око» тоже подвержены частотно-зависимому отбору, однако здесь динамика работает в другом направлении, с положительной, а не отрицательной обратной связью. Чем больше индивидов применяют стратегию «Око за око», тем успешнее становится каждый из них. Если отрицательная обратная связь иногда порождает «эволюционно стабильное состояние» – равновесие между различными стратегиями, положительная обратная связь может порождать «эволюционно стабильную стратегию»: стратегию, которая, однажды распространившись в популяции, становится невосприимчивой к мелкомасштабному вторжению. Проанализировав успех стратегии «Око за око», Аксельрод пришел к выводу, что она эволюционно стабильна[360].

Сотрудничество может окупиться уже в начале игры. Даже если малая доля популяции применяет стратегию «Око за око», а все другие существа упорно не желают сотрудничать, расходящийся круг сотрудничества со временем охватит всю популяцию. Обратное невозможно. Даже несколько рьяных противников сотрудничества не в состоянии уничтожить популяцию «Око за око». Простое, условное сотрудничество гораздо заразительнее, чем неприкрытая подлость. В одной из глав книги «Эволюция сотрудничества» (1984) Роберт Аксельрод и Уильям Гамильтон пишут: «Возникшее однажды на основе принципа взаимности сотрудничество в состоянии теперь выдержать натиск менее кооперативных стратегий. Тем самым шестерни социальной эволюции обзаводятся храповиком»[361].

К сожалению, этот храповик не включается с самого начала. В том случае, если в атмосферу чистой подлости попадает только одно существо со стратегией «Око за око», оно обречено на вымирание. Очевидно, упорное нежелание сотрудничать само по себе является эволюционно стабильной стратегией; стоит ей закрепиться в популяции, как она даст отпор любому одинокому мутанту, придерживающемуся любой другой стратегии, хотя и не устоит перед маленькой группой сторонников условного сотрудничества.

В этом смысле турнир Аксельрода дал фору стратегии «Око за око». Хотя вначале точные клоны «Око за око» отсутствовали, большинство ее соседей были запрограммированы на сотрудничество (по крайней мере, при некоторых обстоятельствах), что повышало ценность добродушия как такового. Даже если бы «Око за око» оказалась в компании сорока девяти убежденных подлецов, в итоге было бы сорок девять кандидатов на первое место и только один явный проигравший. Каким бы неизбежным ни выглядел успех стратегии «Око за око» на мониторе компьютера, триумф реципрокного альтруизма отнюдь не казался неминуемым миллионы лет назад, когда в нашей эволюционной родословной появилась подлость.