Математика жизни и смерти. 7 математических принципов, формирующих нашу жизнь — страница 21 из 54


Табл. 6. При распределении испытуемых по половой принадлежности выясняется, что вне зависимости от пола эффект от приема плацебо выше, чем от приема «Фантастикола»


Отвечает за эту путаницу так называемая смешанная переменная, она же – искажающий фактор. В нашем случае такой переменной величиной является пол. Оказывается, что пол очень важен для результата. В ходе исследования давление у женщин улучшалось по естественным причинам чаще, чем у мужчин. Поскольку разделение по половому признаку в группах было разным (800 женщин и 200 мужчин в группе А и 200 женщин и 800 мужчин в группе Б), на общий результат группы А значительное положительное влияние оказало естественное улучшение давления у женщин, в результате чего «Фантастикол» показался более эффективным, чем плацебо. Несмотря на то что в исследовании принимало участие равное количество мужчин и женщин, неравномерность их распределения по группам привела к тому, что первоначальный высокий результат применения «Фантастикола» в 56 %, взятый по среднему значению в группе А и отраженный в таб. 5, при сопоставлении с результатом его применения с учетом пола (20 % улучшений для мужчин и 65 % для женщин) не подтвердился. Нельзя просто брать и выводить среднеарифметическое из разнородных средних значений[97].


Табл. 7. При равномерном распределении мужчин и женщин по группам пропорции благотворного воздействия различных препаратов на мужчин и женщин остаются теми же, что и в табл. 6


Выведение среднеарифметического из средних значений допустимо только в том случае, если мы уверены, что учли все возможное влияние смешанных переменных. Знай мы заранее, что пол является одной из таких переменных, то мы понимали бы, что результаты необходимо разделять по половой принадлежности, чтобы получить истинную картину эффективности «Фантастикола». Мы могли пойти и другим путем – собрав в группах равное количество мужчин и женщин, как показано в табл. 7. Показатели улучшения для мужчин и женщин, принимающих «Фантастикол» или плацебо, остаются такими же, как и в табл. 6. Однако, когда результаты объединены в табл. 8 и мы смотрим на показатели улучшения для «Фантастикола» (42,5 % улучшения), становится ясно, что препарат не лучше, а хуже, чем плацебо (50 % улучшения). Конечно, в нашем случае на результат могут влиять и другие смешанные переменные, которые мы не учли, – возраст, например, или иные социально-демографические факторы.


Табл. 8. Теперь, когда мы учли (и устранили) влияние смешанной переменной в виде пола, очевидно, что «Фантастикол» оказывается менее эффективен, чем плацебо


Экологические ошибки и проблема контроля смешанных переменных серьезно затрудняют задачу тех, кто разрабатывает и проводит клинические испытания (мы видели это во второй главе и еще увидим в четвертой – но по иной причине), но их негативное влияние проявляется и в других областях медицины. В 1960-х и 1970-х годах у детей, матери которых курили во время беременности, наблюдалось любопытное явление. Дети от курящих матерей, рожденные с низким весом, имели значительно меньше шансов умереть в первый год жизни, чем дети, рожденные некурящими матерями. Низкий вес при рождении долгое время ассоциировался с более высокой младенческой смертностью, но было похоже, что курение во время беременности обеспечивает некоторую защиту младенцам, рожденным с низким весом [98]. На самом деле это было совсем не так [99]. Парадокс возник из-за смешанной переменной.

Хотя более низкий вес при рождении и связан с повышенной младенческой смертностью, он не является ее причиной. Как правило, оба этих явления вызваны каким-то иным неблагоприятным состоянием, которое и является смешанной переменной. Как курение, так и другие нездоровые привычки, и неблагоприятные условия жизни могут повлиять на вес ребенка при рождении и привести к росту младенческой смертности, но они делают это в разной степени. Курение родителей приводит к тому, что многие дети, в остальном совершенно здоровые, рождаются с пониженным весом. Другие причины недовеса при рождении, как правило, несут более серьезную угрозу для здоровья ребенка, что приводит к более высоким показателям младенческой смертности в этих случаях. В итоге комбинация того, что у курящих матерей дети с недовесом рождаются гораздо чаще, и того, что смертность у таких детей лишь незначительно выше, приводит к тому, что в первый год жизни эти дети умирают реже, чем те, что родились с низким весом из-за некоторых более опасных для жизни заболеваний.

Экологическая ошибка Мидоу, своевольно зачислившего Кларков в категорию семей, где риск развития СВДС низок, сделала смерть их двух детей в глазах присяжных гораздо более подозрительной, чем она выглядела бы, если бы присяжные исходили из других, более высоких показателей этого риска. Даже отсылка к значению общего уровня СВДС в данном случае была бы экологической ошибкой. Конечно, общепопуляционный показатель менее предвзят, и поэтому использование его в ситуации, когда на карту была поставлена свобода женщины, можно допустить. Но положение усугубило ошибочное допущение, что серийные смерти от СВДС – статистически независимые события.

Ошибка прокурора

Мидоу, однако, продолжал блуждать в лабиринтах статистики. Ему позволили допустить еще более грубую ошибку. Впрочем, огрехи такого рода встречаются в судопроизводстве настолько часто, что заслужили собственное имя – ошибка прокурора. Доводы строятся на допущении, что если подозреваемый действительно невиновен, то появление определенных доказательств или свидетельств против него крайне маловероятно. Из чего прокурор делает заключение – неоправданное – о том, что наличие таких свидетельств или обстоятельств делает вину подозреваемого весьма вероятной.

Для Салли Кларк таким допущением стало утверждение, что вероятность двух детских смертей подряд составляет всего 1 на 73 миллиона. Но этот логический конструкт не принимает во внимание иные возможные альтернативные сценарии, в которых подозреваемая невиновна – например, смерть детей Салли по естественным причинам. В рамках этой логики игнорируется и возможность того, что версия обвинения (двойное убийство младенца в случае Салли), может оказаться столь же – если не более – маловероятной, как и версия невиновности подозреваемого.

Чтобы объяснить проблемы, возникающие вследствие ошибки прокурора, давайте представим, что мы расследуем преступление. Единственное доказательство, которое у нас есть, – это часть регистрационного номера автомобиля, принадлежащего – возможно – преступнику, которого видели уезжающим с места преступления. Для целей нашего расследования примем, что все номера автомобилей состоят из семи цифр в диапазоне от 0 до 9. Каждая из цифр этого диапазона может оказаться на любой позиции в номере автомобиля, что дает всего 10 × 10 × 10 × 10 × 10 × 10 × 10 × 10, то есть 107, или 10 миллионов) таких номерных знаков. Очевидец, сообщивший о номере автомобиля, запомнил первые пять цифр в нем, но не смог разобрать последние две. Зная эти первые пять цифр, мы можем сузить круг поиска, поскольку нам придется выбирать из гораздо меньшего количества автомобилей. Для каждой из этих двух неизвестных цифр существует десять вариантов, что дает всего 100 (10 × 10) возможных номеров с известными первыми пятью цифрами.

Найден подозреваемый, первые пять цифр номерного знака машины которого совпадают с пятью цифрами, которые запомнил свидетель. Если подозреваемый невиновен, то из десяти миллионов автомобилей остаются лишь 99 тех, первые пять цифр номера которых совпадают с нужной нам комбинацией. Таким образом, вероятность, что замеченный свидетелем номерной знак принадлежал невиновному, составляет 99/10 000 000 (чуть меньше ста к десяти миллионам), то есть меньше одного к ста тысячам (1/100 000). Такая низкая вероятность того, что свидетель увидел бы именно этот номерной знак, если подозреваемый невиновен, в подавляющем большинстве случаев свидетельствует о виновности подозреваемого. Однако, приняв этот довод, мы совершаем ошибку прокурора.

Вероятность того, что найденная улика (увиденный набор цифр номера) указывает все же на невиновного человека, не равна вероятности того, что подозреваемый невиновен, несмотря на имеющиеся против него свидетельства (тот самый набор цифр). Напомним, что 99 из 100 автомобилей, которые соответствуют описанию свидетеля, не принадлежат подозреваемому. Подозреваемый – всего лишь 1 из 100 человек, которые ездят на такой машине. Таким образом, вероятность вины подозреваемого, учитывая его номерной знак, составляет всего 1/100, что совсем немного. Разумеется, наличие других улик, связывающих подозреваемого с районом преступления или исключающих другие автомобили из рассмотрения, повысит вероятность его вины. Однако, исходя из одного-единственного доказательства, наиболее вероятный вывод должен состоять в том, что подозреваемый невиновен.

Ошибка прокурора эффективна только тогда, когда шансы на признание невиновности крайне малы, в противном случае некорректная логика легко опровергается. Например, представьте себе расследование кражи со взломом в Лондоне. Группа крови подозреваемого соответствует группе крови преступника, обнаруженной на месте преступления, но других улик не имеется. Такую группу крови имеет лишь 10 % населения. Таким образом, вероятность найти кровь этой группы на месте преступления, если обвиняемый невиновен (то есть преступление совершил кто-то другой с той же группой крови), составляет 10 %. Ошибкой прокурора в данном случае является вывод, что в свете «доказательств крови» вероятность невиновности подозреваемого также составляет лишь 10 % – иными словами, что вероятность вины составляет 90 %. Очевидно, в десятимиллионном Лондоне примерно миллион других людей (10 % от общего числа населения) с той же группой крови, что найдена на месте преступления. Получается, что вероятность вины подозреваемого, определяемая исключительно на основании «кровавых улик», составляет буквально один на миллион. Несмотря на то, что обладатели этой группы крови встречаются достаточно редко (ее имеет лишь каждый десятый), общее количество людей с такой группой крови настолько велик