Математика жизни и смерти. 7 математических принципов, формирующих нашу жизнь — страница 30 из 54

Конечно, в этих двух утверждениях одна и та же статистика обрамляется двумя противоположными способами: в первом случае используются показатели смертности, а во втором – выживаемости. Участники с низкими навыками счета посчитали, что уровень риска, описанного в позитивных тонах (показатель выживаемости пациентов), почти на целый пункт ниже. Даже люди с более высокими навыками счета считали риск, описанный в негативных тонах, более высоким.

При изучении результатов медицинских испытаний положительные результаты нередко преподносят в относительном выражении, чтобы максимизировать их предполагаемую пользу, в то время как побочные эффекты сообщаются в абсолютном выражении, чтобы свести к минимуму видимость их риска. Эту очень распространенную практику (анализ показал, что примеры ее использования встречаются примерно в трети статей о вреде и пользе медицинского лечения, опубликованных в трех ведущих медицинских журналах мира [129]) называют некорректным фреймингом [130].

Что еще более тревожно, этот прием широко применяется и в литературе для пациентов. В конце 1990-х годов Национальный институт рака США (NCI) создал «Пособие по оценке риска развития рака груди», чтобы просвещать общественность о возможности появления заболевания. В числе другой справочной информации на сайте сообщалось о результатах недавнего клинического исследования с участием более 13 тысяч женщин с повышенным риском развития рака груди, в ходе которого были оценены преимущества и потенциальные побочные эффекты препарата тамоксифен [131]. В ходе исследования женщин разделили на две примерно равные группы. Первой группе вводили тамоксифен, а второй, контрольной, – плацебо.

В конце пятилетнего исследования для оценки воздействия препарата организаторы сравнили количество женщин с инвазивным раком груди в каждой группе, а также количество женщин с другими видами рака. В своем «Пособии» NCI сообщил о снижении относительного риска: «У женщин [принимавших тамоксифен] инвазивный рак груди диагностировался примерно на 49 % реже». Цифра в 49 % кажется очень серьезной. Однако количественный показатель возможных побочных эффектов был представлен как абсолютный риск: «…ежегодный уровень развития рака матки в группе, принимавшей тамоксифен, составил 23 на 10 000 по сравнению с 9,1 на 10 000 в группе, принимавшей плацебо». Эти крошечные доли, похоже, должны были указывать на то, что риск развития рака матки при лечении тамоксифеном практически не меняется. Сознательно или нет, собирая данные для предоставления их в интернете, исследователи NCI подчеркивали преимущества тамоксифена для снижения заболеваемости раком груди, одновременно отвлекая внимание от повышения риска развития рака матки. Если бы авторы отчета описывали риски, оперируя статистическими данными одного типа, им пришлось бы указать, что, снижая риск развития рака молочной железы на 49 %, их препарат увеличивает риск развития рака матки на 153 %.

Даже в аннотации к статье степень снижения риска развития рака груди дана как процентная величина (49 %), а степень увеличения риска развития рака матки – как относительный коэффициент риска (2,53). Использование процентного соотношения вместо десятичных цифр, чтобы подчеркнуть воспринимаемую выгоду, – еще один трюк, известный как смещение соотношения [132]. Люди очень восприимчивы к такому когнитивному искажению, что прекрасно иллюстрирует серия простых экспериментов, в которых испытуемых с завязанными глазами просят наугад выбрать мармеладку из лотка [133]. Если испытуемому удается вытащить красную мармеладку, он выигрывает символический доллар. Для начала испытуемому предлагают выбрать лоток – с девятью белыми мармеладками и одной красной или с 91 белой и девятью красными. Второй лоток выбирают чаще, несмотря на то что математически с этим лотком у испытуемого меньше шансов на выигрыш. Считается, что, видя больше красных мармеладок, человек инстинктивно решает, что вероятность выбрать одну из них все же больше – независимо от количества других мармеладок. Один из участников эксперимента прокомментировал это так: «Я выбрал те лотки, где было больше красных мармеладок, потому что мне казалось, что там больше возможностей вытащить призовую мармеладку».

Абсолютные цифры исследования тамоксифена показали, что случаи инвазивного рака молочной железы сократились с 261 на 10 000 без лечения до 133 на 10 000 с ним. Откажись создатели «Пособия» от смещения соотношения и некорректного фрейминга в пользу абсолютных цифр, пользователи этого инструмента легко заметили бы, что общее число предотвращенных случаев рака молочной железы (128 на 10 000) значительно выше числа случаев возникновения рака матки, вызванных лечением (14 на 10 000). Так что в этом случае манипулировать исходными клиническими данными не было вообще никакой необходимости.

Регрессивное отношение

Вполне возможно, что большинство статистических искажений в медицинском контексте возникает неосознанно – просто исследователи не знают о некоторых распространенных статистических ловушках. Характерная особенность клинических исследований, в частности, – проверка перспективного способа лечения на группе нездоровых людей с параллельным мониторингом их состояния для оценки воздействия медикамента. Если симптоматика спадает и пациенты идут на поправку, то положительная оценка препарата представляется вполне естественной.

Представим, например, что вы собрали большую группу людей, страдающих от боли в суставах, и попросили их сидеть спокойно, пока их будут жалить пчелы. Звучит абсурдно, но это реальный вид альтернативной терапии – апипунктура. Лечение укусами пчел в последнее время набирает популярность, отчасти благодаря той рекламе, которую ей делает Гвинет Пэлтроу, пропагандируя апипунктуру на своем сайте о стиле жизни Goop. Теперь представим, что боль в суставах у некоторых страдальцев чудесным образом проходит и они после сеансов начинают чувствовать себя в целом лучше. Можно ли сделать вывод, что апипунктура на самом деле является эффективным способом лечения боли в суставах? Скорее всего, нет. Никаких научных доказательств эффективности апипунктуры для лечения какого бы то ни было расстройства не существует. Более того, известно, что лечение пчелиным ядом часто вызывает отрицательные последствия, – зафиксирован по меньшей мере один летальный исход. Как же тогда объяснить положительные результаты нашего гипотетического исследования? Что вызывает улучшение состояния пациентов?

Острота таких расстройств, как боль в суставах, с течением времени колеблется. Вполне вероятно, что на участие в испытаниях – особенно в таких экстремальных и нестандартных, как апипунктура, – соглашаются те, кто находится в самом тяжелом положении и отчаянно нуждается хоть в каком-то облегчении своего недуга. Если сеанс лечения проводится на фоне острой боли, то через некоторое время они весьма вероятно почувствуют себя лучше – вне зависимости от результативности лечения. Это явление называют регрессией к среднему значению. Оно проявляется во многих исследованиях, в которых присутствует элемент случайного разброса результатов.

Чтобы лучше понять, как работает регрессия к среднему, рассмотрим результаты экзамена. Возьмем крайний случай, когда студентам предлагается ответить на 50 вопросов с ответами «да» или «нет» по предмету, о котором они ничего не знают. Если студенты будут выбирать ответы исключительно наугад, результаты теста будут варьироваться от нуля до 50, но тех, кто угадает почти все правильно, будет совсем немного – как и тех, кто не угадает почти ничего. Из распределения баллов, приведенного на рис. 20, видно, что средний балл большинства экзаменуемых будет ближе к среднему арифметическому значению 25. Если проанализировать баллы тех, кто попал в 10 % лучших, то они по определению будут значительно выше, чем в среднем по всей группе. Но покажут ли они результаты значительно выше среднего, если их протестировать повторно, со свежими вопросами? Конечно, нет. Мы будем вновь ожидать, что их оценки равномерно распределятся вокруг среднего балла 25. То же самое будет верно и при перепроверке нижних 10 %. Набравшие экстремально высокие и экстремально низкие баллы в первом тесте во втором, как правило, вернутся к среднему показателю.


Рис. 20. Распределение баллов при прохождении теста из 50 вопросов с многовариантными ответами «да/нет». При повторном тестировании тех, кто набрал наивысшие 10 % баллов (заштрихованная область справа), их средний балл совпадает со средним общим баллом. То же самое относится к низшим 10 % (заштрихованная область слева). Группы, получившие как высшие, так и низшие баллы, регрессировали в сторону среднего значения


Результат реальных экзаменов в значительной степени будет определяться навыками и трудовой этикой, однако нельзя исключать и элемент везения, который проявляется как в наборе вопросов, выпадающих на экзамене, так и в приоритетности предметов для повторного экзамена. Регрессия к среднему способна выявить такой эффект – если он имел место. Элемент случайности особенно заметен на экзаменах с многовариантным набором ответов, из которых даже студент, не обладающий необходимыми знаниями, может угадать правильный. В одном исследовании, проведенном в 1987 году, 25 подверженных «экзаменационной панике» американских студентов, которые неожиданно плохо справились с тестом на проверку академических способностей (SAT), прошли повторное тестирование, предварительно приняв пропранолол – лекарство от гипертонии [134]. Газета New York Times сообщала о результатах исследования так: «Препарат, используемый для лечения высокого кровяного давления, резко улучшил результаты теста на проверку академических способностей у студентов, страдающих от необычайно сильной тревожности…». Студенты, принимавшие пропранолол, значительно повысили свои оценки – в среднем на 130 баллов по шкале от 400 до 1600. Поначалу кажется, что пропранолол – невероятно действенное средство. Оказывается, однако, что даже ученики, которые не нервничали перед тестом, при повторной сдаче улучшают свои оценки примерно на 40 баллов. Если учесть, что студенты, отобранные для исследования, были выбраны именно потому, что они показали результаты хуже, чем предполагалось по их IQ или другим академическим показателям, они вполне могли бы и без пропранолола значительно повысить свои баллы в результате регрессии к среднему.