образование + 3 × навык. Обратите внимание, что функции, определяющие навык и зарплату, все еще предполагаются линейными, но отношение жалованья к итогу нелинейно, потому что у него есть пороговый эффект.
Давайте подсчитаем для этой модели суммарное, прямое и непрямое воздействия, ассоциированные с увеличением образования на 1 единицу. Суммарное воздействие определенно равно 1, поскольку когда образование меняется с 0 на 1, зарплата поднимается с 0 до (7 ∙ 1) + (3 ∙ 2) = 13, что больше порогового значения в 10, и таким образом итог меняется с 0 на 1.
Рис. 60. Опосредование, совмещенное с пороговым эффектом
Вспомним, что натуральное непрямое воздействие — это ожидаемое изменение итога, при учете, что мы не меняем образование, но устанавливаем навык на тот уровень, который он бы принял, если мы увеличили бы образование на 1. Легко увидеть, что в этом случае зарплата увеличивается с 0 до 2 ∙ 3 = 6. Это ниже, чем пороговое значение 10, поэтому податель заявления откажется и ННВ = 0.
Что же насчет прямого воздействия? Как упоминалось выше, вопрос в том, на каком уровне нам следует удерживать опосредующую переменную. Если навык оставить на том уровне, который был до того, как мы изменили образование, тогда зарплата изменится с 0 до 7 и итог = 0. Таким образом, КПВ (0) = 0. Однако, если мы придадим навыку то значение, которое он получает после изменения образования (а именно 2), зарплата изменится с 6 до 13. Это меняет итог с 0 на 1, потому что 13 выше порогового значения для подателя заявления, и он согласится на работу. Итак, КПВ (2) = 1.
Следовательно, прямое воздействие равно 0 или 1 в зависимости от постоянного значения, которое мы придаем опосредующей переменной. В отличие от Линейной Страны Чудес выбор значения медиатора играет огромную роль, и у нас возникает дилемма. Если мы желаем сохранить аддитивный принцип, суммарное воздействие = прямое воздействие + непрямое воздействие, нам придется использовать КПВ (2) в качестве определения каузального воздействия. Но это выглядит слишком произвольно и в чем-то даже ненатурально. Если мы предполагаем изменить переменную образование и хотим узнать ее прямое воздействие, мы, скорее всего, оставим переменную навык на том уровне, который у нее был. Другими словами, интуитивно кажется более оправданным использовать в качестве прямого воздействия КПВ (0). Более того, это согласуется с натуральным прямым воздействием в этом примере. Однако тогда мы теряем аддитивность: суммарное воздействие не равно сумме прямого и непрямого воздействий.
Тем не менее — вопреки ожидаемому — несколько видоизмененная разновидность аддитивности сохраняется, не только здесь, но и вообще. Читателям, которые не испугаются небольших подсчетов, возможно, будет интересно сосчитать ННВ для возврата от X = 1 до X = 0. В этом случае зарплата падает с 13 до 7 и итог меняется с 1 на 0 (т. е. податель заявления отказывается от предложения). Подсчитанное в обратном направлении ННВ = –1.0 Восхищение вызывает тот факт, что суммарное воздействие (X = 0 → X = 1) = НПВ (X = 0 → X = 1) — ННВ (X = 1 → X = 0), или в этом случае 1 = 0 — (–1). Вы видите версию аддитивного принципа для натуральных воздействий, только в данном случае это оказывается субстрактивный (вычитательный) принцип! Я был невероятно счастлив, когда из анализа стал вырисовываться такой вариант аддитивности, несмотря на нелинейность уравнений.
Немало чернил ушло на споры о самом «правильном» способе обобщения прямых и непрямых воздействий при переходе от линейных к нелинейным моделям. К сожалению, большая часть статей подходит к проблеме с конца. Вместо того чтобы заново, с нуля решить, что мы имеем в виду под прямым и непрямым воздействиями, они начинают с предположения, что нам всего-то нужно немного подправить определения для линейных моделей. Например, в Линейной Стране Чудес мы видели, что непрямое воздействие подается как произведение двух путевых коэффициентов. Поэтому некоторые исследователи попытались определить непрямое воздействие как произведение двух численных выражений, из которых одно измеряет воздействие X на M, а второе — воздействие M на Y. Этот подход стал известен как метод произведения коэффициентов. Однако мы также видели, что в Линейной Стране Чудес непрямое воздействие задается разницей между суммарным воздействием и прямым воздействием. Поэтому другая, не менее самоотверженная группа исследователей определяла непрямое воздействие как разницу двух численных показателей, один из которых отражал суммарное воздействие, а другой — прямое воздействие. Этот метод стал называться методом разницы коэффициентов.
Какой же из них верен? Ни тот ни другой! Обе группы исследователей спутали процедуру и смысл. Процедура здесь математическая: смысл каузальный. На самом деле проблема еще глубже: исследователи, занимающиеся регрессионным анализом, никогда не рассматривали смысл непрямого воздействия за рамками пузыря линейных моделей. Единственным значением понятия непрямого воздействия был результат алгебраической процедуры (перемножить путевые коэффициенты). Когда эту процедуру у них отобрали, их стало носить ветром, как лодку без якоря.
Один из читателей моей книги «Причинность» в своем письме ко мне прекрасно описывает это чувство растерянности. Мелани Уолл (Колумбийский университет) в свое время преподавала курс математического моделирования биостатистикам и медикам. Однажды она, как обычно, объясняла студентам, как вычислять непрямое воздействие, перемножая прямые путевые коэффициенты. Некий студент спросил ее, что именно имеется в виду под непрямым воздействием. «Я ответила ему то, что отвечала всегда, что непрямое воздействие — это воздействие, которое изменение в X производит на Y через его взаимоотношения с опосредующей переменной Z», — написала мне Уолл. Однако студент оказался очень настойчивым. Он вспомнил, как преподаватель объяснял прямое воздействие как воздействие, которое остается, если мы будем поддерживать опосредующую переменную на постоянном уровне, и спросил: «Тогда что мы удерживаем на постоянном уровне, когда говорим о непрямом воздействии?»
Уолл не знала, что сказать. «Я не уверена, что у меня сейчас есть хороший ответ на этот вопрос, — ответила она. — Как насчет того, что я выясню, что смогу, и сообщу вам?»
Это было в октябре 2001 года, всего через четыре месяца после того, как я представил статью по каузальному опосредованию на конференции «Неопределенность в искусственном интеллекте» в Сиэтле. Стоит ли говорить, что мне очень хотелось поразить Мелани своим свежим решением ее задачи, и я написал ей то же, что пишу здесь сейчас для вас: «Непрямое воздействие X на Y — это изменение в Y, которое мы наблюдаем, если удерживаем X на постоянном уровне и в то же время изменяем M до такого уровня, который M приняло бы при изменении X на единицу».
Я не уверен, что Мелани впечатлилась моим ответом, но ее любознательный студент заставил меня серьезно задуматься о том, как прогрессирует наука в наши времена. Вот сейчас, думал я, прошло 40 лет с тех пор, как Блалок и Дункан ввели путевой анализ в общественные науки. Десятки учебников и сотни научных публикаций по прямым и непрямым воздействиям выходят из печати каждый год, некоторые из них — с заголовками-оксюморонами вроде «Регрессионный подход к опосредованию». Каждое поколение передает следующему из рук в руки мудрость о том, что непрямое воздействие — это всего лишь произведение двух других воздействий, или же разница между суммарным и прямым воздействиями. Никто не осмеливается задать простой вопрос: но что это самое непрямое воздействие означает? Чтобы задать его, вдребезги разбив нашу веру в пророческую роль научного консенсуса, понадобился невинный студент с беззастенчивым нахальством мальчишки из андерсеновского «Нового платья короля».
Знакомьтесь с «если бы»
Далее я расскажу вам историю своего собственного обращения, потому что достаточно долго мне не давал покоя тот же самый вопрос, который озадачил студента Мелани Уолл.
В главе 4 я писал о Джейми Робинсе, пионере статистики и эпидемиологии в Гарвардском университете, который вместе с Сандером Гренландом из Калифорнийского университета в Лос-Анджелесе ввел широкое употребление графических моделей в современной эпидемиологии. Мы сотрудничали несколько лет, с 1993 по 1995 год, и он навел меня на мысли о проблеме последовательных схем интервенции, что было одним из его главных научных интересов.
За много лет до этого Робинса, как эксперта по производственному здравоохранению и безопасности, попросили выступить в суде с мнением о вероятности того, что воздействие химических веществ на рабочем месте привело к смерти рабочего. Робинс был обескуражен, обнаружив, что в статистике и эпидемиологии совершенно нет инструментов для ответов на подобные вопросы. Это по-прежнему была эра почти полного табу на причинность в статистике. Говорить о ней дозволялось только в случае рандомизированных контролируемых исследований, а по этическим соображениям провести подобный эксперимент на людях, чтобы выяснить последствия воздействия формальдегида, было совершенно невозможно.
Обычно рабочие на фабрике подвергаются воздействию токсичных веществ не однократно, а в течение долгого времени. По этой причине Робинс стал интересоваться всеми случаями, когда уровень воздействия химических веществ менялся с течением времени. Иногда такие воздействия бывают и благотворными, например, при СПИДе препараты применяются в течение многих лет, при этом схемы лечения меняются в зависимости от того, как на них реагирует уровень гликопротеина CD4 у пациента. Как вычленить каузальное воздействие курса лечения, если он состоит из множества стадий и промежуточные переменные (которые используются в качестве контроля) зависят от более ранних стадий лечения? Эти вопросы определили направление карьеры Робинса.