вируем механизм, по которому действует курение, и, таким образом, истинное влияние курения окажется недооцененным.
Игра 2 — более сложная версия, в которой курение разделено между двумя разными переменными: X показывает, курит ли беременная сейчас (в начале второй беременности), а A — курила ли она во время первой беременности. B и E — скрытые (ненаблюдаемые) нарушения развития, вызываемые курением, D — физиологические причины этих нарушений. Обратите внимание, что эта диаграмма допускает вариант, при котором женщина изменила свое поведение между беременностями, начав или бросив курить, но другие физиологические причины нарушений остаются прежними. Многие эпидемиологи захотят ввести поправки по предшествовавшим случаям выкидышей, но это плохая идея, если одновременно не ввести поправки по курению в предыдущей беременности (A).
Игры 4 и 5 взяты из статьи, опубликованной в 2014 году Эндрю Форбсом, биостатистиком из Университета Монаша в Австралии, вместе с несколькими соавторами. Он интересовался влиянием курения на развитие астмы у взрослых. В игре 4 переменная X — это отношение индивида к курению, Y — болел ли он астмой во взрослом возрасте. Фактор B обозначает заболевание астмой в детском возрасте, и это фактор-коллайдер, потому что на него влияют одновременно A, курение родителей и C — скрытая (и ненаблюдаемая) предрасположенность к астме. В игре 5 у переменных те же значения, но Форбс добавил две стрелки для пущего реализма (смысл игры 4 был только в том, чтобы представить читателям М-образный граф).
На самом деле в полной модели Форбса было еще несколько переменных и она выглядела так, как на рис. 27. Обратите внимание, что игра 5 «погружена» в эту модель, в том смысле, что у переменных A, B, C, X и Y ровно те же взаимоотношения. Следовательно, наши рассуждения остаются верными и в этом случае, и нам следует ввести поправки по A и B или по C, но C — ненаблюдаемая и, следовательно, невыравниваемая переменная. Вдобавок к этому у нас появляются еще четыре вмешивающиеся переменные: D — астма у родителей, E — хронический бронхит, F — пол и G — социально-экономический статус. Читатель для своего удовольствия может самостоятельно вывести, что нам нужно вводить поправки по E, F и G, но не нужно по D. Таким образом, достаточный набор переменных для устранения смещения оценки — это A, B, E, F и G.
Рис. 27. Модель связи курения (X) и астмы (Y), созданная Эндрю Форбсом
В конце концов Форбс обнаружил, что в необработанных данных у курения есть небольшая и статистически незначимая ассоциация с астмой среди взрослых, а после введения поправок по конфаундерам этот эффект становился еще незаметнее и менее достоверным. Нулевой результат не должен, однако, уводить внимание от того факта, что его статья — модельная работа по «искусному допросу Природы».
И последний комментарий по поводу этих игр: когда переменными становятся такие явления, как курение, выкидыши и т. д., это уже совершенно определенно не игры, а серьезное дело. Я назвал их играми, потому что радость от возможности получить их решение быстро и осмысленно очень похожа на удовольствие, которое ребенок получает, обнаружив, что щелкает как орехи те задачи, что раньше вводили его в ступор.
Мало какие моменты в научной карьере приносят столько удовлетворения, как удачное сведение проблемы, озадачивавшей и путавшей целые поколения предшественников, к прямолинейной игре или алгоритму. Я полагаю окончательное решение вопроса конфаундеров одним из важнейших событий Революции Причинности, потому что оно положило конец эпохе заблуждений, приводивших, вероятно, к множеству неверных решений в прошлом. Это была тихая революция, баррикады которой располагались в основном в исследовательских лабораториях и конференц-залах. Однако, вооружившись новыми инструментами и идеями, научное сообщество сегодня берется за более сложные задачи, как теоретические, так и практические, о чем расскажут последующие главы.
Глава 5. Дымные дебаты: на свежий воздух
И сказали друг другу: «пойдем бросим жребии, чтобы узнать, за кого постигает нас эта беда».
В конце 50-х — начале 60-х годов ХХ века статистика и медицина бились над одним из самых важных вопросов столетия в области здравоохранения: вызывает ли курение рак легких? Спустя полстолетия мы воспринимаем ответ на этот вопрос как само собой разумеющееся, но в те времена он был совершенно неочевиден. Ученые и даже члены одной семьи часто имели по этому вопросу противоположные мнения.
Семья Якоба Ерушалми (1904–1973) была одной из таких. Биостатистик Калифорнийского университета в Беркли Ерушалми был одной из последних цитаделей одобрения курения в академическом мире. «Ерушалми возражал против мнения, что сигареты вызывают рак, вплоть до своего последнего дня», — писал его племянник Дэвид Лилиенфельд спустя много лет. Отец Дэвида Эйб Лилиенфельд был эпидемиологом в Университете Джонса Хопкинса и одним из самых ярых сторонников теории, что курение рак все-таки вызывает. Лилиенфельд вспоминает, как дядя Як (сокращенно от Якоб) с его отцом сидели и спорили о последствиях курения, окутанные «облаками дыма от сигарет Яка и трубки Эйба» (см. иллюстрацию в начале главы). Ах, если бы Революция Причинности могла привнести в их спор глоток свежего воздуха! Как будет видно из этой главы, одним из самых серьезных аргументов против гипотезы, что курение вызывает рак, было вероятное наличие неизвестных факторов, которые обусловливают одновременно тягу к никотину и рак легких. Мы только что обсудили подобные осложняющие схемы и отметили, что современные каузальные диаграммы извели проклятье конфаундеров под корень. Но сейчас мы с вами в 1950-х и 1960-х, за два десятилетия до Сандера Гренланда и Джейми Робинса и за 30 лет до того, как хоть что-нибудь будет известно об операторе do. Поэтому интересно посмотреть, как ученые той эпохи справились с этой проблемой и доказали, что аргумент осложнения непрочен как дым.
Нет сомнений, что темой многих споров Эйба и Яка в курилке был не табак и не рак, а это несносное слово «причина». Не в первый раз в истории врачи сталкивались со сложными каузальными вопросами: многие великие вехи в истории медицины — это обнаружение истинных каузативных агентов. В середине XVIII века Джеймс Линд открыл, что плоды цитрусовых способны предотвращать цингу, а в середине XIX-го Джон Сноу выяснил, что вода, загрязненная испражнениями, вызывает холеру (позже исследования более точно идентифицировали в каждом случае каузативные агенты: дефицит витамина С для цинги, холерный вибрион для холеры). Эти два примера блестящего расследования объединяет то, что соотношение между причиной и следствием в обоих случаях однозначно. Холерный вибрион — единственная причина холеры или, как мы сказали бы сегодня, ее необходимое и достаточное условие. Если вы не подверглись его воздействию, вы не заболеете холерой. Точно так же недостаток витамина С — необходимое условие для развития цинги, а по прошествии некоторого времени — и достаточное.
Спор о курении и раке поставил под сомнение эту монолитную концепцию причинности. Многие люди курят всю свою жизнь и не заболевают раком легких. И наоборот, этим недугом страдают те, кто за всю жизнь не сделал ни одной затяжки. У одних он развивается из-за наследственной предрасположенности, у других — под воздействием вызывающих рак веществ, у третьих — по обеим причинам.
Конечно, к этому времени статистике уже был известен превосходный способ установления причинности в более широком смысле: рандомизированное контролируемое исследование. Но такое исследование в случае курения и невозможно, и неэтично. Как прикажете предписать случайно выбранным людям курить в течение десятилетий, вероятно нанеся ущерб их здоровью, только для того, чтобы посмотреть, будет ли у них в итоге рак легких? Нельзя себе представить, чтобы хоть где-нибудь, кроме Северной Кореи, кто-то «добровольно вызвался» быть испытуемым в подобном исследовании.
Без РКИ не было шансов убедить скептиков, таких как Ерушалми или Р. Э. Фишер, которые были приверженцами идеи, что наблюдаемая ассоциация между курением и раком легких ложная. По их мнению, ассоциацию порождал некий скрытый третий фактор. Например, мог существовать «ген курильщика», благодаря которому у людей была бы тяга к табаку и одновременно бóльшая вероятность заболеть раком легких (скорее всего, в результате других особенностей в выборе образа жизни). Предлагаемые ими конфаундеры были в лучшем случае неправдоподобны. Однако именно на противников курения возлагалось бремя доказательств, что конфаундеров в этом случае нет, т. е. доказать отсутствие чего-либо, что практически невозможно, Фишер и Ерушалми хорошо знали об этом.
Финальный прорыв из сложившейся патовой ситуации — история одновременно и о великом триумфе, и об упущенной возможности. Это был триумф для здравоохранения, потому что в конце концов эпидемиологи докопались до истины. Отчет начальника медицинской службы Соединенных Штатов Америки в 1964 году недвусмысленно гласил: «Курение является причиной рака легких у взрослых мужчин». Это утверждение навсегда уничтожило аргумент, что влияние курения на заболеваемость раком легких не доказано. Доля курящих мужчин в США уже на следующий год начала снижаться, и к настоящему времени составляет меньше половины той, которая была в 1964 году. Нет сомнений в том, что в результате миллионы жизней удалось спасти, а продолжительность жизни выросла.
Однако триумф был неполным. Промежуток времени, потребовавшийся для того, чтобы прийти к вышеупомянутому заключению, примерно с 1950 по 1964 годы, мог бы быть значительно короче, если бы ученые воспользовались более строгой теорией причинности. И, что особенно важно с точки зрения этой книги, исследователи 60-х годов ХХ века так и не сумели собрать такую теорию воедино. Чтобы подтвердить мнение о том, что курение вызывает рак, комитет начальника медицинской службы воспользовался серией неформальных руководящих принципов, известных как критерии Хилла, названные по имени статистика из Лондонского университета Остина Бредфорда Хилла. У каждого из этих критериев есть исключения, хотя все вместе они весьма убедительны, апеллируют к здравому смыслу и даже мудрости. Из избыточно методологичного мира Фишера принципы Хилла переносят нас в противоположную реальность — мир без методологии, где причинность выявляется на основе количественных паттернов статистических тенденций. Революция Причинности выстраивает мост между двумя этими крайностями, вооружая наше интуитивное чувство причинно-следственных связей мощью математического аппарата. Но проделать эту работу предстояло уже следующему поколению.