Вам кажется, что это все сбивает с толку? Так оно и есть. Насколько проще было бы, если бы он мог просто нарисовать каузальную диаграмму, вроде той, что на рис. 26, и сказать «Y ассоциирована с Z через пути, не проходящие через X». Но у него не было этого инструмента, и он не мог говорить о путях, концепция которых была тогда под запретом.
У «классического эпидемиологического определения» конфаундеров есть и другие недостатки, как показывают следующие два примера:
1) X → Z → Y
и
2) X → M → Y
↓
Z
В первом примере Z удовлетворяет условиям (1) и (2), но это не конфаундер. Такие переменные называют медиаторами или опосредующими переменными: они объясняют каузальное воздействие X на Y. Если вы пытаетесь определить каузальное воздействие X на Y, попытка вводить поправки по фактору Z приведет к неудаче. Если брать только тех индивидов как в контрольной, так и в опытной группе, для которых Z = 0, вы полностью блокируете воздействие X, потому что оно работает посредством изменения Z. Из этого вы делаете неверный вывод, что X не влияет на Y. Именно это имел в виду Эзра Кляйн, когда говорил: «Иногда в итоге вы выравниваете выборку как раз по тому фактору, который хотите измерить».
Во втором примере Z — это опосредованная переменная для медиатора M. Статистики очень часто используют опосредованные переменные, когда истинная каузальная переменная не поддается измерению: так, принадлежность к политической партии может быть использована как опосредованная переменная для политических взглядов. Поскольку Z не является точной мерой M, некоторая часть влияния X на Y способна просочиться, если вы вводите поправки по Z. Тем не менее это все еще ошибочно; хотя смещение будет меньшим, чем если вы вводите поправки по M, оно никуда не денется.
По этой причине позднее статистики, среди которых стоит отметить Дэвида Кокса с его учебником «Планирование исследований» (1958), предупреждали, что вводить поправки по Z стоит только в том случае, если вы «заранее имеете серьезные причины предполагать», что на Z не влияет X. Эти «заранее известные серьезные причины» — не что иное, как каузальное допущение. Он добавляет: «Выдвигать такие гипотезы совершенно нормально, однако ученый должен четко осознавать, когда именно к ним апеллировать». Напомню, что это 1958 год, разгар запрета на обсуждение причинности. Кокс открыто говорит, что при введении поправок по конфаундерам вполне допустимо украдкой глотнуть запретного — главное, не говорить об этом святошам. Дерзкое предложение! Я никогда не упускаю случая отдать должное его храбрости.
К 1980 году условия Симпсона и Кокса были объединены в трехчастную проверку на конфаундеры, упомянутую выше. Она примерно настолько же надежна, как лодка, которая течет всего в трех местах. Хотя она и обращается нерешительно к причинности в третьей части, несложно показать, что каждая из первых двух и не нужна, и недостаточна. Гренланд и Робинс вынесли это вердикт в своей эпохальной статье 1986 года. Они сформировали совершенно новый подход к проблеме конфаундеров, который назвали взаимозаменяемостью. Они вернулись к исходной идее о том, что контрольная группа (X = 0) должна быть сравнима с опытной группой (X = 1). Однако они добавили к ней контрфактивный выверт (вспомним из главы 1, что контрфактивные высказывания находятся на третьей ступени Лестницы Причинности и поэтому обладают достаточной мощностью, для того чтобы распознавать конфаундеры). Взаимозаменяемость требует от исследователя рассмотреть опытную группу, вообразить, что стало бы с составляющими ее объектами, если бы изучаемое воздействие не применялось, и затем решить, будет ли результат таким же, как и для тех, кто не подвергался (в реальности) этому воздействию. Только в случае положительного ответа мы можем сказать, что в исследовании нет конфаундеров.
В 1986 году говорить с эпидемиологической аудиторией о контрфактивных высказываниях было достаточно смело, потому что они в значительной степени оставались под влиянием классической статистики, полагающей, что все ответы уже находятся в данных, а не в том, что могло произойти и навеки останется ненаблюдаемым.
Однако статистическое сообщество было частично подготовлено к подобной ереси, за что стоит благодарить пионерскую работу другого статистика из Гарварда, Дональда Рубина. В рубинской схеме потенциальных исходов, предложенной в 1974 году, контрфактивные переменные вроде «артериальное давление испытуемого X, если бы он получал препарат П» и «артериальное давление испытуемого X, если бы он не получал препарата П» столь же легитимны, как традиционные переменные вроде артериального давления — несмотря на тот факт, что наблюдения за одной из этих переменных не состоятся никогда.
Робинс и Гренланд решили выразить свою концепцию конфаундеров в терминах потенциальных исходов. Они разделили выборку на четыре типа испытуемых: обреченных, каузативных, превентивных и иммунных. Давайте представим, что экспериментальное воздействие X — это вакцина от гриппа, а исход Y — заболевание гриппом. Обреченные — это те, кому вакцина не помогает, они заболеют гриппом вне зависимости от того, получат вакцину или нет. Каузативная группа (которой в реальности может не быть вовсе) включает тех, у кого вакцина вызывает настоящий грипп. Превентивная группа состоит из тех, для кого вакцина предотвращает заболевание: они заболеют гриппом, если не привьются, и не заболеют, если сделают прививку. Наконец, иммунная группа — это те, кто не заболеет гриппом ни в каком случае. Табл. 4 суммирует эти соображения.
Таблица 4
В идеале у каждого человека на лбу должна быть этикета, сообщающая, к какой группе он принадлежит. Взаимозаменяемость предполагает, что процент людей с каждым типом этикетки (процент О, процент К, процент П и процент И соответственно) должен быть одинаков и в контрольной, и в опытной группе. Равенство этих пропорций гарантирует, что исход будет тем же самым, если мы поменяем местами опыт и контроль. В противном случае опытная и контрольная группа неодинаковы и наши оценки эффективности вакцины окажутся смещенными. Обратите внимание, что две группы могут различаться по самым разным параметрам: по возрасту, полу, состоянию здоровья и ряду других характеристик. Только наличие равенства по процентному соотношению О, К, П и И определяет, взаимозаменяемы они или нет. Таким образом, взаимозаменяемость сводится к равенству между двумя наборами из четырех пропорций, что намного проще альтернативы — учета бесчисленных факторов, по которым популяции могут различаться.
Используя это определение конфаундеров, опирающееся на здравый смысл, Гренланд и Робинс показали, что статистические определения, как декларативные, так и процедурные, дают неверные ответы. Переменная может удовлетворять трехчастному тесту эпидемиологов и все-таки усиливать смещение оценки, если вносить в нее поправку.
Определение Гренланда и Робинса было огромным достижением, потому что оно позволило им привести ясные примеры, наглядно демонстрирующие, что предыдущие определения были неадекватны. Тем не менее эту дефиницию нельзя перевести в практическую плоскость. Проще говоря, таких удобных этикеток на лбу не бывает. Мы даже не можем подсчитать процент О, К, П и И. Это как раз та информация, которую хит-рый джинн природы прячет от всех внутри своей волшебной лампы. Без этой информации исследователю остается только полагаться на интуицию, решая, взаимозаменяемы опытная и контрольная группа или нет.
Надеюсь, к этому моменту мне удалось разжечь ваше любопытство. Каким образом каузальные диаграммы превращают головную боль конфаундеров в веселую игру? Секрет лежит в операционном тесте на конфаундеры, называемом критерием черного хода. Этот критерий превращает проблему определения конфаундеров, их поиска и ввода поправок по ним в рутинную задачу, ничуть не более сложную, чем решение журнальной головоломки. Он привел столетнюю, упорную проблему к благополучному разрешению.
Оператор Do и критерий черного хода
Чтобы понять, как работает критерий черного хода, лучше сначала интуитивно представить себе, как двигается информация в каузальной диаграмме. Мне нравится представлять связи как трубы, по которым информация распространяется от стартовой точки X до финиша Y. Не забывайте, что распространение информации идет одновременно по двум направлениям — по каузальному и некаузальному, как мы видели в главе 3.
На самом деле некаузальные пути как раз и являются источником конфаундеров. Вспомним, что я определяю их как все, что вынуждает P (Y | do (X)) отличаться от P (Y | X). Оператор do стирает все стрелки, которые входят в X и предотвращает движение информации от X в некаузальном направлении. Таким же эффектом обладает рандомизация. Наконец, к тому же самому приводит введение статистических поправок, если правильно выбрать переменные, по которым эти поправки следует вводить.
В предыдущей главе мы рассмотрели три правила, которые рассказывают нам, как остановить поток информации по любому отдельно взятому соединению. Я повторю их, чтобы подчеркнуть:
а) в соединении типа «цепочка» A → B → C введение поправок по B предотвращает движение информации об А к C и наоборот;
б) в вилке, или вмешивающемся соединении A ← B → C поправки по B также предотвращают движение информации об А к C и наоборот;
в) в коллайдере A → B ← C действуют прямо противоположные правила. Переменные A и C