< 0,05». (Может, кто-то и задумывался о необходимости учитывать и издержки ошибок второго рода, как это принято в теории обнаружения сигнала, но по некой туманной исторической причине этого так и не случилось.)
Вот что такое «статистическая значимость» — это способ ограничить долю ложных заявлений об открытиях произвольно выбранным верхним пределом. Предположим, вы получили статистически значимый результат при p < 0,05. Значит ли это, что вы вправе сделать перечисленные ниже выводы?
• Вероятность, что нулевая гипотеза верна, составляет менее 0,05.
• Вероятность, что эффект реален, превышает 0,95.
• Если вы опровергли нулевую гипотезу, шанс, что вы ошиблись, составляет менее 0,05.
• Если вы попытаетесь воспроизвести исследование, шанс, что вам это удастся, составляет более 0,95.
Девять из десяти профессоров психологии, включая 80 % тех, кто преподает статистику, так и думают[303]. Но они ошибаются, ошибаются и еще раз ошибаются! Если вы внимательно следили за рассуждениями в этой главе и в главе 5, вы понимаете почему. «Статистическая значимость» — это байесовское правдоподобие, вероятность получения определенных данных при условии, если гипотеза верна (в нашем случае нулевая гипотеза)[304]. Однако каждое из перечисленных выше утверждений представляет собой байесовскую апостериорную вероятность — вероятность, что гипотеза верна при условии получения определенных данных. Вот что нам нужно, вот зачем мы взялись за исследование — но проверка на статистическую значимость показывает совсем не это! Если вы помните, почему у Ирвина нет заболевания печени, почему дома не так уж опасно и почему папа римский не инопланетянин, вы знаете, что эти две условные вероятности нельзя менять местами. Наша исследовательница не может использовать тест на статистическую значимость в качестве оценки истинности или ложности нулевой гипотезы, если она не учтет априорную вероятность — ее наилучшее предположение о вероятности, что нулевая гипотеза истинна, сформулированное до эксперимента. Но в математике проверок на статистическую значимость эту самую априорную вероятность днем с огнем не сыщешь!
Специалисты по общественным наукам в массе своей настолько привыкли к ритуалу проверки на статистическую значимость, которой озабочены с младых ногтей, что позабыли логику, которая за ней стоит. Я понял это, сотрудничая с лингвистом-теоретиком Джейн Гримшоу, которая, поднаторев в статистике, однажды сказала мне: «Давай-ка разберемся: единственное, что эти тесты показывают, так это то, что, если эффекта не существует, один из двадцати ученых, которые его ищут, будет утверждать, что эффект есть. Почему ты так уверен, что это не ты?» Честный ответ: ни почему. За ее скептицизмом кроется еще одно объяснение кризиса воспроизводимости. Допустим, подобно кэрролловским охотникам на снарка, двадцать ученых гоняются за неким миражом. Девятнадцать прячут свои нулевые результаты поглубже в ящик стола, а тот единственный, кому повезло (или не повезло) совершить ошибку первого рода, публикует свое «открытие»[305]. В одном выпуске комикса XKCD пара ученых проверяет наличие корреляции между поеданием мармеладных драже и подростковыми угрями отдельно по двадцати цветам и пожинает лавры, увязав зеленые драже с прыщавостью с p < 0,05[306]. До ученых наконец дошла эта шутка: они приучаются публиковать нулевые результаты и разрабатывают методики, способные компенсировать проблему «ящика стола» при метаанализе литературы, то есть исследовании исследований. Отсутствие нулевых результатов бросается в глаза, и тот, кто проводит метаанализ, может зафиксировать не только то ничто, которое есть, но и то, которого нет[307].
Постыдное непонимание смысла проверки на статистическую значимость сообщает нам нечто важное о человеческих устремлениях. Философы, начиная с Юма, отмечали, что индукция — переход от отдельных наблюдений к общему выводу — по природе своей ненадежный вид логического рассуждения[308]. Через любое конечное множество точек можно провести бесконечное число кривых; любому набору данных может логически не противоречить бесконечное множество теорий. Инструменты рациональности, о которых я рассказал в этих главах, предлагают разные способы совладать с таким вселенским невезением. Теория статистических решений не позволяет отыскать истину, но позволяет ограничить ущерб от ошибок первого и второго рода. Байесовское мышление помогает устанавливать степень уверенности в истине, но начинать тут всегда нужно с вычисления априорной вероятности, при всей присущей этому процессу субъективности. Однако ни та ни другая теория не может дать нам того, чего мы все так жаждем, — готового алгоритма установления истины.
Глава 8. Я и другие (теория игр)
Ваша рожь поспела сегодня; моя будет готова завтра; для нас обоих выгодно, чтобы я работал с вами сегодня и чтобы вы помогли мне завтра. Но у меня нет расположения к вам, и я знаю, что вы также мало расположены ко мне. Поэтому ради вас я не возьму на себя лишней работы, а если бы я стал помогать вам ради себя самого в ожидании ответной услуги, то знаю, что меня постигло бы разочарование и что я напрасно стал бы рассчитывать на вашу благодарность. Итак, я предоставляю вам работать в одиночку; вы отвечаете мне тем же; погода меняется; и мы оба лишаемся урожая вследствие недостатка во взаимном доверии и невозможности рассчитывать друг на друга.
Недавно мы с коллегой поспорили о том, какое послание должен адресовать миру наш университет по вопросу глобального потепления. По мнению моего оппонента, нам просто нужно убеждать людей, что сокращение объема производимых ими парниковых газов отвечает их личным интересам, поскольку перегретая планета — это наводнения, ураганы, лесные пожары и другие бедствия, от которых они же и пострадают. Я же говорил, что разумное потребление отнюдь не отвечает личным интересам отдельного человека, поскольку никакая жертва с его стороны не предотвратит изменений климата; при этом сознательная гражданка будет потеть летом, дрожать от холода зимой и под проливным дождем ждать автобуса, в то время как ее несознательные соседи не перестанут наслаждаться комфортной температурой и сухим салоном своего автомобиля. Любой из нас выиграет лишь в том случае, если свой углеродный след минимизируют все, а выгодным для каждого в отдельности это будет, только если сделать чистую энергию дешевле (благодаря новым технологиям), а грязную — дороже (за счет тарифов на выбросы углерода). Мой коллега говорил вполне разумную вещь: с одной стороны, разрушать планету — нерационально. Но мне никак не удавалось убедить его, что, с другой стороны, это, увы, абсолютно рационально.
Тогда-то я и понял, что этот прекрасный специалист упускает из виду принципиально важную концепцию — теорию игр, подсказывающую, как делать рациональный выбор, когда размер твоего вознаграждения зависит от рационального выбора другого человека.
С теорией игр мир познакомили фон Нейман и Моргенштерн — в той же самой книге, где объясняли, что такое ожидаемая полезность и рациональный выбор[310]. Но в отличие от дилемм, в рамках которых мы испытываем судьбу, играя против безмозглого колеса фортуны, и где, как оказалось, наилучшие стратегии в целом интуитивны, теория игр имеет дело с дилеммами, сталкивающими нас с равно хитроумными игроками, и тут уж исходы выворачивают наши интуитивные догадки наизнанку и переворачивают их с ног на голову. Жизненные игры порой не оставляют рациональному агенту выбора: он вынужден совершать поступки, от которых пострадает и он сам, и все остальные, вести себя беспорядочно, капризно или неуправляемо, лелеять симпатии и копить обиды, с готовностью переносить наказания и подвергаться взысканиям или вовсе отказываться участвовать в игре. Теория игр проливает свет на парадоксальную рациональность, стоящую за многими странностями общественной и политической жизни, и, как станет понятно в одной из последующих глав, помогает ответить на центральный вопрос этой книги: как наш рациональный вид может быть таким нерациональным?
Игра с нулевой суммой: камень, ножницы, бумага
Классическая дилемма теории игр, где четко видно, как выгодность выбора одного участника зависит от выбора другого, — игра «Камень, ножницы, бумага»[311]. Два игрока одновременно показывают какой-то из жестов: либо два пальца (ножницы), либо открытую ладонь (бумага), либо кулак (камень), — а победитель определяется согласно правилу «ножницы режут бумагу, бумага обертывает камень, камень тупит ножницы». Правила можно представить в виде таблицы: выборы первого игрока, Аманды, записаны в строках, выборы второго игрока, Брэда, — в столбцах, а исходы — в ячейках: для Аманды в нижнем левом углу, для Брэда в верхнем правом. Давайте присвоим исходам численные значения: 1 — победа, –1 — проигрыш, 0 — ничья.
Сумма выигрышей Аманды и Брэда равна нулю в каждой ячейке, отсюда и термин, который проник из теории игр в разговорную речь: игра с нулевой суммой. Победа Аманды — это поражение Брэда, и наоборот. Игроки находятся в состоянии непримиримого конфликта и дерутся за один и тот же кусок пирога.
Какой ход (строку) должна выбрать Аманда? Основной алгоритм в теории игр (да и в жизни тоже) — взглянуть на ситуацию глазами другого игрока. Аманда должна изучить выборы Брэда (столбцы) один за другим. Проследим слева направо: если Брэд выбирает ножницы, Аманде нужно выбрать камень. Если он выбирает бумагу, ей нужно выбрать ножницы. Если он выбирает камень, ей нужно выбрать бумагу. У Аманды нет никакого «предпочтительного» выбора — наилучшего вне зависимости от того, что сделает Брэд; а Аманда, естественно, понятия не имеет, что он собирается делать.