Вернемся, однако, к нашему примеру. Каким образом тест с чувствительностью 99,99 процента может показать, что у человека с положительным результатом вероятность заболевания равна всего 50 процентам? Для человека из группы низкого риска вероятность заболеть СПИДом равна приблизительно 1:10 000. Теперь представьте себе, что 10 000 человек из этой группы низкого риска приходят сдавать анализ на ВИЧ. Один из них носитель ВИЧ, и результат его анализа практически наверняка окажется положительным. Но среди оставшихся, в связи с малой неточностью теста, один результат окажется ложноположительным. Таким образом, мы получим два положительных результата, лишь один из которых будет истинно положительным, – а это означает, что у пациента с положительным результатом вероятность заболевания равна именно 50 процентам.
Важно понимать, что такой удивительный результат не говорит о неадекватности самого анализа: в нашем примере тест отличается невероятной точностью. Главное заключается в том, что вследствие малой заболеваемости условная вероятность намного ниже той, какую мы ожидаем. На самом деле априорная вероятность того, что данный конкретный пациент инфицирован, неразрывно связана с достоверностью результата. Предположим, что тот же анализ делают людям из когорты высокого риска, например наркоманам, вводящим себе внутривенно героин. Частота инфицированности в этой группе равна приблизительно 1,5 процента. Снова представим себе, что анализ сдают 10 000 таких пациентов. В этой когорте у 150 человек тест окажется положительным ввиду истинной инфицированности. Из оставшихся 9 850 пациентов приблизительно у одного результат будет ложноположительным. Вероятность заражения при положительном результате в этой группе уже не равна 50/50 – в данном случае вероятность будет равна 150/151 или 99,34 процента, то есть намного больше, чем у пациента из когорты низкого риска.
Сценарии для случаев низкого и высокого риска можно для наглядности представить в виде частотного дерева, изображенного на рисунке. Разница между этими сценариями весьма велика, и на ней надо остановиться подробнее. Мы имеем полное право спросить: зачем нужна такая стратификация? Почему в одной группе тест дает вероятность, разительно отличающуюся от вероятности в результате того же теста в другой группе? Инстинктивно мы чувствуем, что здесь что-то не так, но мы ошибаемся: тест одинаков в обоих случаях, и его точность не может избирательно улучшаться или ухудшаться в зависимости от принадлежности пациента к той или иной группе. Реактивы не обладают ясновидением, и чувствительность теста остается равной 99,99 процента для любого пациента. Главное заключается в следующем: теорема Байеса показывает, что одной голой информации о результате недостаточно для правильного вывода – последний всегда зависит от других вероятностей. Вероятности часто оказываются условными, и голые численные данные, лишенные контекста, подлежат тщательному анализу.
Все это служит иллюстрацией того факта, что, несмотря на кажущуюся интуитивную природу вероятности и статистики, их мнимая простота скрывает многослойную сложность, которую легко упустить из виду. В итоге мы можем сделать абсолютно ошибочные выводы, а сомнительные выводы и неверная интерпретация статистических данных часто имеют катастрофические последствия. Рассуждения, приводящие к неверным заключениям, любопытны не только своей бессодержательностью с точки зрения науки или тем, что демонстрируют “математическую ловкость рук”: мы живем в эпоху, когда статистическая информация служит основой принятия решений во всех вообразимых сферах деятельности – от науки до политики, экономики и всего, что располагается между ними. Такое повсеместное проникновение статистики и вероятности в нашу действительность означает, что они часто причастны к вопросам жизни и смерти, будь то лечение болезней или работа правительства.
Следовательно, само наше существование может зависеть от вывода верных заключений из вероятностной информации. Если при этом люди – особенно те, кто должен разбираться в этих вопросах, – делают ошибки, то цена их может оказаться очень высокой. В первые месяцы кризиса, связанного со СПИДом, до изобретения антиретровирусных лекарств, положительный результат анализа на носительство ВИЧ считался равнозначным смертному приговору. Безоглядная вера в достоверность анализов на ВИЧ вызывала у многих врачей чувство ложной уверенности, и едва ли не всем пациентам говорили, что они наверняка больны, хотя это было неправдой. Немудрено, что многие впадали из-за этого в депрессию или пускались во все тяжкие – из-за ложноположительного результата, вероятность которого была достаточно высока!
Есть и еще одна сфера, в которой вероятность может решить судьбу человека: юриспруденция. Долг жюри и судей – определить степень виновности подсудимого. Для того чтобы прийти к верному выводу, судьям и присяжным приходится разбираться с массой статистической информации, которой их заваливают обвинители и защитники. В любом состязательном процессе обе стороны имеют закрепленное законом право в интересах клиента предоставлять суду статистическую информацию. С помощью этой информации присяжных пытаются склонить в ту или иную сторону. Однако как мы видели на примере с анализами на ВИЧ-инфекцию, представленные числовые данные сами по себе практически ни о чем не говорят и могут не только натолкнуть присяжных на неверные выводы, но и заставить их вынести вердикт, полностью противоречащий реальности. От статистики есть огромная польза, но в отсутствие поясняющей информации она способна не помочь, а, наоборот, запутать.
Для того чтобы показать, к каким трагическим последствиям может привести такая некомпетентность, мы рассмотрим скандал, связанный с профессором, сэром Роем Мидоу. Мидоу – выдающийся британский педиатр, прославившийся знаменитой статьей о синдроме Мюнхгаузена. Этот человек, посвященный в рыцари за вклад в педиатрию, одно время оказывал сильное влияние на социальных работников и на Национальное общество по противодействию жестокому обращению с детьми. Его знают также как автора максимы, получившей название “закона Мидоу”: “Одна внезапная детская смерть – это трагедия; две детские смерти вызывают подозрение; три смерти должны считаться убийством до тех пор, пока не будет доказано противоположное”.
Однако склонность Мидоу искать во всем игру темных сил была результатом его статистической некомпетентности, и его математическая безграмотность рушила чужие жизни. Нигде это не проявилось так очевидно, как в чудовищном испытании, которое в конце девяностых годов пришлось пережить Салли Кларк. Салли и ее мужа Стива (оба супруга были адвокатами) постигло страшное несчастье – в результате синдрома внезапной детской смерти они лишились двоих маленьких сыновей. Первый сын, Кристофер, потерял сознание и умер, когда ему было одиннадцать недель. Второй сын, Гарри, скончался при похожих обстоятельствах в возрасте восьми недель. В обоих случаях Салли была с детьми одна. На телах Кристофера и Гарри обнаружились следы травм, вызванных, вероятно, отчаянными попытками Салли реанимировать мальчиков. Для зарождения подозрения этого оказалось достаточно.
Невероятное горе семьи Кларк было усугублено предъявлением обоим супругам обвинения в убийстве. Со Стива – в связи с отсутствием улик – обвинения были сняты, но судебное преследование Салли государственный обвинитель прекратить отказался. Мидоу – который в то время считался ведущим специалистом Великобритании по жестокому обращению с детьми – был вызван в суд в качестве свидетеля обвинения. Ввиду отсутствия прямых улик Мидоу использовал статистические данные о том, что в семье среднего класса, в которой супруги не курят, вероятность внезапной детской смерти составляет один случай на 8 543 ребенка. Мидоу подсчитал, что вероятность такого совпадения, как смерть обоих детей, составляла 1 на 73 миллиона. Выступая перед присяжными, Мидоу пояснил свою позицию на примере малой вероятности повторных побед на скачках:
Есть определенный шанс выиграть, если поставить на откровенного аутсайдера на Больших национальных скачках; скажем, его шанс равен 1 к 80, но вы поставили на него в прошлом году, и он выиграл; на следующий год вы ставите на другую лошадь при тех же шансах – 80 к 1, да, вы снова ставите – и снова выигрываете. Допустим, вы ставите в течение четырех лет при тех же шансах, и вероятность выигрыша уже равна 1 к 73 миллионам. Надо сказать, что вам очень сильно везло, но вероятность выигрыша, как я уже сказал, – весьма и весьма мала. То же самое можно сказать и об этих смертях. Каждое из этих событий маловероятно, а вместе они практически невозможны.
Сказано это было уверенно, цифры были недвусмысленны, доводы убедительны – казалось, Салли уличена. Неудивительно, что СМИ ухватились за этот пассаж обвинительной речи, посчитав утверждения Мидоу неопровержимым доказательством вины несчастной женщины. На основании свидетельства Мидоу Салли Кларк стала объектом всеобщей ненависти – пресса выставила ее отпетой злодейкой, безжалостной детоубийцей. Присяжные поддались общему настроению, и в результате Салли Кларк была признана виновной в двойном детоубийстве.
Тем не менее этот приговор возмутил профессиональных статистиков, и тому были веские причины: чтобы выдать вероятность, равную 1 к 73 миллионам, Мидоу просто перемножил вероятности двух якобы независимых событий. Такой подход оправдан, когда речь идет о подбрасывании монеты или вращении рулетки, где каждый следующий исход действительно не зависит от предыдущего. Но этот подход в корне неверен, если события не являются независимыми. Даже в конце девяностых годов из эпидемиологических исследований уже было известно, что синдром внезапной детской смерти связан с генетической предрасположенностью или с какими-то факторами окружающей среды. Это соображение делает смехотворное допущение о том, что эти две смерти независимы, попросту абсурдным; вероятности, на которых основывалось обвинение Кларк, были крайне сомнительными.