Беда в том, что слово «удивительный» — это синоним выражения «с низкой априорной вероятностью», ну если мы согласны, что накопленное нами научное знание обладает хотя бы какой-то ценностью. А это, в свою очередь, означает, что при равном качестве доказательств нам стоит меньше доверять заявлениям, которые нас удивляют. Но масла в огонь подливают не одни только журналисты. В 2005 г. физик Джон Иоаннидис шокировал коллег предвосхитившей кризис воспроизводимости статьей «Почему большая часть опубликованных результатов исследований недостоверна». Проблема в том, что многие из феноменов, за которыми охотятся специалисты в области биомедицинских наук, сами по себе интересны и априори вряд ли истинны, так что избежать ложноположительных результатов тут можно, только используя крайне чувствительные методы, а вот многие истинные данные, в том числе нулевые результаты и сообщения об успешном воспроизведении прежних работ, считаются слишком скучными, чтобы заслуживать публикации.
Это не значит, конечно, что научные исследования — пустая трата времени. Предрассудки и суеверия ошибочны гораздо чаще нашей неидеальной науки, и в конце концов в шуме научных дискуссий рождается истина. Как заметил в 1978 г. физик Джон Займан, «физика университетских учебников верна на 90 %; первичные публикации в физических журналах — на 90 % ложь»[232]. Отсюда можно сделать вывод, что байесовское мышление не одобряет распространенную практику использования слова «хрестоматийный» в качестве оскорбления, а фразы «переворот в науке» в качестве комплимента.
Здравое уважение к скучному повысило бы и качество дискуссий о политике. Как мы убедились в главе 1, достижения многих известных прогнозистов иначе как смехотворными не назовешь. Причина в том, что их профессиональный успех оценивается объемом внимания, которое они привлекли своими прогнозами — такими увлекательными, то есть маловероятными априори, и потому (учитывая, что волшебным даром пророчества эти люди не обладают) такими же маловероятными апостериори. Филип Тетлок изучал «суперпрогнозистов», которые действительно успешно предсказывают различные экономические и политические исходы. Их объединяет то, что все они — последователи Байеса: начинают с априорных представлений и уточняют их на последующих этапах анализа. Если их просят, например, рассчитать вероятность террористической атаки в течение ближайшего года, они прежде всего выясняют базовую оценку, заглянув в «Википедию» и подсчитав число атак в регионе в предшествующие годы, — вряд ли вы обнаружите что-то подобное в свежей передовице, предсказывающей, что день грядущий нам готовит[233].
Запретная базовая оценка и байесовское табу
Пренебрежение базовой оценкой не всегда является симптомом эвристики репрезентативности. Иногда на нем настаивают целенаправленно. Феномен «запретной базовой оценки» входит в тройку выделенных Тетлоком светских табу наряду с запретными уступками и еретическими предположениями (глава 2)[234].
Почву под запрет базовой оценки подводит одна из социологических закономерностей. Измерьте любую социально значимую переменную — экзаменационные баллы, карьерные предпочтения, уровень социального доверия, доход, процент заключенных браков, особенности образа жизни, частоту различных типов насилия (уличная преступность, групповая преступность, домашнее насилие, организованная преступность, терроризм). Теперь разбейте результат по стандартным демографическим категориям: возраст, пол, раса, религия, национальность. Средние показатели по различным подгруппам никогда не совпадут, причем разница порой значительна. Неважно, что является ее причиной — природа, культура, дискриминация, история или какая-то их комбинация, — разница реальна, она существует.
Вряд ли такое положение дел кого-то удивит, но применить это знание можно так, что кровь стынет в жилах. Скажем, вы хотите получить максимально точный прогноз по поводу жизненных перспектив определенного человека: хорошо ли он будет учиться в колледже, каких успехов добьется в профессиональной деятельности, насколько высок в его случае риск неплатежа по кредиту, какова вероятность, что он совершит преступление, или скроется от правосудия, или нарушит закон повторно, или устроит теракт. Если вы истинный последователь Байеса, вы начнете с определения базовой оценки на основании его возраста, пола, классовой принадлежности, расы, национальности и вероисповедания, а затем станете вводить поправки с учетом личных особенностей этого человека. Другими словами, вам придется прибегнуть к профайлингу, то есть ваше мнение будет пристрастным не из-за невежества, ненависти, снобизма или какого-нибудь еще — изма или — фобии, но в результате продиктованной лучшими намерениями попытки сделать как можно более точный прогноз.
Разумеется, большинство из нас приходит в ужас даже от мысли о чем-то подобном. Тетлок просил испытуемых представить себе сотрудника страховой фирмы, которому нужно определять размер страховой премии для жителей различных районов города, учитывая, как часто в этих районах случаются пожары. С этим участники никаких проблем не имели. Но, если им говорили, что вышеупомянутые районы отличаются по расовому составу населения, они тут же передумывали и принимались осуждать того же сотрудника — по сути, просто за то, что тот хорошо делает свою работу. А если они сами играли роль этого сотрудника и узнавали ужасную правду о демографической статистике, они пытались смыть с себя позорное пятно, выражая желание принять участие в антирасистской кампании.
Может, это еще один пример человеческой нерациональности? Неужели расизм, сексизм, исламофобия, антисемитизм и прочие предубеждения «рациональны»? Конечно же, нет! Объяснение кроется в определении рациональности, данном в главе 2: рациональность — это способность использовать знание для достижения целей. Если точный страховой прогноз — наша единственная цель, то мы, вероятно, должны использовать любые крупицы информации, которые помогут как можно точнее рассчитать априорную вероятность. Но все дело в том, что это не единственная наша цель.
Есть и более высокая цель — справедливость. Нельзя формировать отношение к человеку, опираясь на его расу, гендер или национальность, нельзя судить о нем не по его личным качествам, а по цвету кожи или набору хромосом. Каждый из нас хочет к себе непредвзятого отношения, и согласно логике беспристрастности (глава 2) мы должны признавать это право и за всеми остальными.
Более того, только если общественное устройство воспринимается как справедливое — если люди знают, что получат равные возможности, что их не будут оценивать по биологическим или историческим характеристикам, над которыми они не властны, — только тогда оно завоюет доверие граждан. А иначе зачем играть по правилам, если общество все равно выбросит тебя на помойку, потому что ты не вышел цветом кожи, или полом, или вероисповеданием?
Еще одна наша цель — избежать самосбывающихся пророчеств. Если некая этническая группа или определенный пол в прошлом страдал от угнетения, в настоящем его представители могут столкнуться с препятствием в виде отличающихся средних показателей. Если эти базовые оценки подставлять в прогностические формулы, которые определяют судьбу таких людей в будущем, мы обречем их на вечное отставание. Сегодня, когда эти формулы спрятаны в недрах нейросетей глубокого обучения с их недоступными нашему пониманию промежуточными слоями (глава 3), проблема стоит еще острее. Желание общества остановить этот круговорот несправедливости, пусть и ценой точности прогнозов, вполне рационально.
И наконец, управленческие решения — это сигналы. Запрещая использование этнических, гендерных, расовых или религиозных базовых оценок, общество демонстрирует приверженность идеям равенства и справедливости, которая определяет отнюдь не только алгоритмы, допустимые при исполнении чиновниками своих обязанностей. Тем самым провозглашается, что немыслима любая предвзятость, а предвзятость, в основе которой лежат неприязнь и невежество, особенно предосудительна.
Таким образом, запрет на использование базовых оценок имеет солидное рациональное основание. Но теорема есть теорема, и если точностью прогнозов мы с охотой жертвуем ради равного отношения органов власти к отдельным гражданам, в других сферах эта жертва может оказаться неоправданной. Одна из таких сфер — страховое дело. Если страховая компания будет неверно оценивать риски для различных групп населения, выплаты по страховым случаям превысят страховые премии, и вся система обрушится. Страховая компания Liberty Mutual дискриминирует юношей, которые чаще становятся виновниками ДТП, рассчитывая им стоимость страховки по повышенной базовой оценке, потому что, если страховщики не будут этого делать, лихачество парней придется оплачивать законопослушным взрослым женщинам. Но даже здесь закон запрещает страховым компаниям использовать при расчете ставок определенные критерии, прежде всего расу и в некоторых случаях пол.
Вторая сфера, где неразумно запрещать базовые оценки, — это понимание природы общественных явлений. Если процентная доля мужчин и женщин в определенной области деятельности различается, доказывает ли это, что «стражи у ворот» не допускают в эту область женщин, или, быть может, все дело в базовой оценке числа женщин, которые пытаются в упомянутые ворота войти? Если ипотечные операторы чаще отклоняют заявки претендентов из числа меньшинств, они расисты? Или, может, они, подобно гипотетическому сотруднику страховой компании в исследовании Тетлока, учитывают базовые оценки неплатежей по кредитам в разных районах города, которые, так уж случилось, коррелируют с расовым составом населения этих районов? Усилия социологов, которые стараются найти ответы на эти вопросы, зачастую вознаграждаются лишь обвинениями в расизме и сексизме. Но, запрещая социологам и журналистам интересоваться базовыми оценками, мы только мешаем им выискивать сохраняющуюся дискриминацию и отличать ее от последствий имевших место в прошлом экономических, культурных или юридических различий между разными группами населения.