Рациональность. Что это, почему нам ее не хватает и чем она важна — страница 35 из 76

Раса, пол, национальность, религия и сексуальная ориентация превратились в зоны активных боевых действий на поле интеллектуальной жизни, и это несмотря на то, что открытая дискриминация всех сортов значительно сократилась[235]. По-моему, это во многом происходит из-за отсутствия четкого понимания базовых оценок — неумения определить, когда имеется веская причина запрещать их, а когда таких причин нет[236]. Но в том-то и беда с любым табу. Это похоже на запрет думать о белом медведе: само обсуждение табу — уже табу.

И все-таки мы — последователи Байеса

Но, несмотря на все эти табу, стереотипы и запреты, было бы ошибкой списать наш вид в утиль как безнадежно неспособный к байесовскому мышлению. (Представители племени сан, например, вполне себе последователи Байеса: прежде чем решить, что след оставлен животным редкого вида, они считают необходимым удостовериться, что аргументы в пользу этого неоспоримы.) Гигеренцер отмечает, что обычные люди, формально нарушающие правило Байеса, зачастую имеют на то серьезные математические основания[237]. Математики сами жалуются на социологов, которые нередко используют статистические формулы бездумно: подставляют числа, подбивают итог и считают, что получили верный результат. Но на самом деле любая статистическая формула хороша настолько, насколько хороши стоящие за ней предположения. Обычные люди могут чувствовать качество таких предположений, и порой, нарушая, на первый взгляд, правило Байеса, они как раз и проявляют ту самую осторожность, к которой призывают математики.

Начать с того, что априорная вероятность и базовая оценка — это не одно и то же, несмотря на то что в контрольных работах в качестве «верного» априорного предположения чаще всего предполагается использовать именно базовую оценку. Весь вопрос в том, какую базовую оценку. Допустим, я получил положительный результат анализа на простат-специфический антиген и хочу оценить апостериорную вероятность того, что у меня рак простаты. Какую базовую оценку распространенности рака простаты в популяции я должен взять в качестве априорной вероятности? Среди белых американцев? Евреев-ашкенази? Евреев-ашкенази старше 65 лет? Евреев-ашкенази старше 65 лет, которые занимаются спортом и не имеют семейной истории заболевания? Эти оценки могут сильно отличаться. Конечно, чем ýже референтная группа, тем лучше — но чем она ýже, тем меньше выборка, на которой основана оценка, и тем сильнее эта оценка искажена. Лучшая референтная группа та, которую составляют люди, в точности похожие на меня; а именно я один — максимально подходящий и максимально бесполезный образец для сравнения. Определяя подходящую априорную вероятность, мы вынуждены искать баланс между специфичностью и надежностью и не должны безоговорочно соглашаться на базовую оценку для населения в целом, которая подразумевается по умолчанию.

Использование базовой оценки в качестве априорной вероятности таит в себе и другую опасность: базовые оценки меняются, и порой быстро. Сорок лет назад девушки составляли около 10 % от числа студентов ветеринарных школ; сегодня их почти 90 %[238]. В последние несколько десятилетий, подставляя в формулу Байеса чуть ли не любую исторически сложившуюся базовую оценку, получаешь результат настолько далекий от реальности, что с тем же успехом эту оценку можно было вообще не учитывать. Для многих интересующих нас гипотез ни одно статистическое агентство никогда не высчитывало базовых оценок. (Знаем ли мы, сколько среди студентов ветеринарных школ евреев? А левшей? А трансгендеров?) И что ни говори, с неизвестностью базовых оценок человечеству приходилось мириться на протяжении большей части исторического и доисторического периодов, когда и формировалось наше байесовское чутье.

Так как в байесовской задаче не существует «верной» априорной вероятности, наше пренебрежение заданной экспериментатором базовой оценкой — не обязательно ошибка. Рассмотрим задачу про такси, где в качестве априорных вероятностей предлагалось использовать доли «синих» и «зеленых» таксомоторов в городе. Участники эксперимента вполне могли предположить, что этот простой показатель потонет в более специфических отличиях, например в уровне аварийности компаний или в относительном числе автомобилей, работающих в светлое и темное время суток, или в специфике районов, которые они обслуживают. В таком случае, не располагая этими принципиально важными данными, в качестве априорной вероятности они могли взять нейтральные 50 %. Дальнейшие исследования показали, что участники эксперимента приближаются к байесовскому идеалу, если им сообщают базовые оценки, которые лучше описывают шансы автомобиля попасть в аварию[239].

Кроме того, базовую оценку можно считать априорной вероятностью только при условии, что предъявляемые примеры отобраны в данной популяции случайным образом. Если их выбирали не вслепую, а исходя из наличия интересующей черты, например принадлежности к категории, в которой она проявляется с высокой частотой, — все прогнозы бессмысленны. Вспомним, как испытуемым подсовывали стереотип — Пенелопу, сочинительницу сонетов, или зануду из группы юристов и инженеров — и просили угадать, чему этот человек учится или кем работает. Если респондентов не поставили в известность, что упомянутую Пенелопу выбрали из числа студентов случайным образом (такой вопрос сам по себе звучал бы довольно странно), они могут предположить, что ее и выбрали-то только потому, что ее качества обеспечивают их необходимыми подсказками, что было бы вполне естественно. Более того, подобный подход лег в основу легендарной телеигры под названием What’s My Line? («Чем я занимаюсь?»), где игрокам приходилось угадывать профессию таинственного гостя, выбранного, естественно, не случайно, а потому, что занятие у него — необычное, вроде вышибалы в баре, охотника на крупную дичь, баскетболиста из команды Harlem Globetrotters или полковника Сандерса с эмблемы KFC. Если людей ткнуть носом в случайность выбора (например, на глазах у них вынуть из вазы листок с описанием персонажа), они дают оценки, более близкие к результатам применения формулы Байеса[240].

И наконец, люди чувствительны к разнице между вероятностью в смысле степени уверенности в единичном событии и вероятностью в смысле частоты подобных событий на длительном промежутке времени. Во множестве байесовских задач ставится немного мистический вопрос о вероятности единичного события: не подцепил ли Ирвин болезнь куру, не изучает ли Пенелопа искусствоведение, не синим ли было такси, попавшее в ДТП. Действительно, столкнувшись с подобной проблемой, люди почему-то не кидаются вычислять уровень субъективной уверенности, используя цифры, которые им предоставили. Но мне кажется, их не стоит в этом винить, учитывая, что статистики и сами спорят о смысле вероятности единичного события. И Гигеренцер, и Космидес с Туби считают, что люди не сопоставляют десятичные доли с единичным событием, потому что человеческий разум получает статистическую информацию о мире в иной форме. Мы сталкиваемся с событиями, а не с числами от нуля до единицы. Оперируя этой «естественной частотой», люди прекрасно умеют мыслить по-байесовски и без особого труда решают задачи, сформулированные в таких терминах.

Давайте вернемся к началу главы, к проблеме постановки медицинского диагноза, и переведем эти метафизические доли в конкретные частоты. Забудьте о «некой женщине», подумайте о выборке из тысячи женщин. Десять женщин из каждой тысячи болеют раком груди (это распространенность заболевания в популяции, она же базовая оценка). У девяти из этих десяти больных раком груди женщин результат анализа окажется положительным (это чувствительность анализа). Из тех 990 женщин, у которых рака груди нет, примерно у 89 результат все равно окажется положительным (это уровень ложноположительных результатов). Вот женщина с положительным результатом анализа. Каковы шансы, что у нее действительно рак груди? Несложно подсчитать: в сумме тест оказался положительным у 98 женщин, у девяти из которых действительно рак; делим 9 на 98 и получаем примерно 9 % — вот и весь ответ. Когда задачу ставят таким образом, с ней справляются уже 87 % врачей (сравните с 15 % в исходной формулировке), а также большинство десятилетних детей[241].

Что это за магия и как она работает? Гигеренцер замечает, что концепция условной вероятности уводит нас прочь от осязаемых, поддающихся подсчету вещей. Все эти доли — 90 % истинно положительных, 9 % ложноположительных, 91 % истинно отрицательных, 10 % ложноотрицательных — не дают в сумме 100 %, и поэтому, чтобы составить пропорцию и вычислить долю истинно положительных результатов от числа всех положительных (эту-то задачу нам и нужно решить), приходится трижды перемножать разные числа. И напротив, если думать о естественной частоте, нетрудно выделить и суммировать все положительные результаты: 9 истинно положительных плюс 89 ложноположительных — это в сумме 98 положительных тестов, а 9 истинно положительных составляют 9 % от этой суммы. (Что человеку делать с этим знанием, учитывая цену действия и бездействия, мы обсудим в следующих двух главах.)

Чтобы еще больше упростить задачу, мы можем задействовать визуальные наклонности нашего обезьяньего мозга и превратить цифры в фигуры. Этот прием делает байесовское рассуждение очевидным; с его помощью можно щелкать даже такие головоломки, как хрестоматийная задачка про такси, хотя она и максимально далека от нашего житейского опыта. Представьте себе весь парк городских такси в виде 100 квадратиков: один квадратик — один автомобиль (на рисунке слева). Закрасим 15 квадратиков в левом верхнем углу — это 15 %, базовая оценка принадлежности к «Синему такси». Чтобы показать четыре варианта показаний нашего свидетеля, которому можно верить на 80 % (на рисунке в центре), мы сделаем чуть светлее три квадратика из тех пятнадцати, что изображают синие такси (20 % от 15 синих такси, которые он сослепу мог спутать с зелеными) и затемним семнадцать квадратиков, изображающих зеленые такси (20 % от 85 зеленых такси, которые он мог ошибочно принять за синие). Свидетель утверждает, что видел синее такси, поэтому мы можем отбросить все такси, которые были опознаны — как верно, так и ошибочно — как зеленые, и у нас остается только самый правый рисунок: одни синие такси (как верно, так и ошибочно опознанные). Теперь с первого взгляда видно, что машины «Синего такси», опознанные как синие, занимают чуть меньше половины площади фигуры. Подсчитаем их для точности: 12 квадратиков из 29, то есть 41 %. Естественная частота и наглядное представление позволяют нам разобраться в имеющихся данных (положительных результатах анализа или такси, опознанных как синие) и разделить их на истинные и ложные.