Думай «почему?». Причина и следствие как ключ к мышлению — страница 65 из 82

X = 0)) — P (YM = M0 = 1 | do (X = 0)). (9.3)

Первое P — результат эксперимента с Дэйзи: вероятность того, что приучение к порядку окажется успешным (Y = 1), при условии, что мы не заводим других животных в доме (X = 0), но придаем опосредующей переменной такое значение, какое она имела бы, если бы они были (M = M1). Мы противопоставляем это вероятности успешного приучения к порядку в «нормальных» условиях, без других животных в доме. Обратите внимание, что контрфактивная величина M1 должна вычисляться для каждого экспериментального животного отдельно: другим собакам для воспитания могут быть необходимы другие значения переменной запирание/надзор. Это выводит непрямое воздействие из области применимости do-исчисления. Этот момент также делает эксперимент невыполнимым, потому что экспериментатор не знает M1 (u) для конкретной собаки u. Тем не менее, приняв, что между M и Y нет осложнителей, натуральное непрямое воздействие все-таки можно подсчитать. Уберем все контрфактивные переменные из ННВ и получим для него Формулу Опосредования, как мы уже делали для НПВ. Это численное выражение, требующее информации с третьей ступени Лестницы Причинности, сокращается тем не менее до выражения, исчисляемого с использованием данных только первой ступени. Такая редукция возможна только благодаря нашему предположению об отсутствии осложнителей, которое, благодаря определяющему свойству уравнений в структурной каузальной модели, находится на третьей ступени.

Чтобы закончить историю с Дэйзи, сообщу, что результаты эксперимента оказались противоречивы. Неизвестно, следили ли Дана с женой за Дэйзи так же тщательно, как если бы приходилось не пускать ее к котятам (поэтому неясно, было ли переменной M действительно придано значение M1). Потребовалось терпение и время — несколько месяцев, — и Дэйзи все-таки научилась делать все свои дела на улице.

Но даже и в этом случае в истории с Дэйзи есть несколько важных уроков. Будучи готовым к возможности столкнуться с опосредующей переменной, Дана смог предположить другой каузальный механизм. Из него было выведено важное практическое следствие: ему и жене не пришлось держать в доме дополнительных животных, составляющих стаю, в течение всей жизни Дэйзи.

Опосредование в линейной стране чудес

Когда вы впервые сталкиваетесь с контрфактивными величинами, вам может показаться странным, что для выражения непрямого воздействия требуется такой громоздкий математический аппарат. В самом деле, скажете вы, непрямое воздействие — это всего-навсего то, что остается, если вычесть прямое воздействие. Иначе мы могли бы написать:

Суммарное воздействие = Прямое воздействие + Непрямое воздействие. (9.4)

Если отвечать на это коротко, то схема не работает в моделях, включающих взаимодействия переменных (иногда говорят «модерацию»). Представим, что некое лекарственное средство стимулирует организм выдел ять фермент, который действует как катализатор: он соединяется с этим лекарственным средством и лечит болезнь. Суммарный эффект этого препарата будет, конечно же, положительным. Однако прямой его эффект равен нулю, потому что, если мы заблокируем медиатор (например, не давая организму выделять фермент), препарат не подействует. Непрямой эффект также равен нулю, потому что, если пациент не будет получать препарат, а начнет принимать искусственно синтезированный фермент, болезнь тоже не пройдет. Сам по себе фермент не излечивает болезнь. Таким образом, уравнение (9.4) не выполняется: суммарное воздействие положительное, но и прямое, и непрямое воздействия равны нулю.

Тем не менее уравнение (9.4) выполняется автоматически в одной ситуации без необходимости ввода контрафактивных переменных. Это случай линейной каузальной модели, вроде той, которую мы рассматривали в главе 8. Как обсуждалось там, линейные модели не допускают взаимонаправленных взаимодействий между переменными, и это может быть как преимуществом, так и недостатком. Преимуществом в том смысле, что анализ опосредования становится намного проще, а недостатком — если мы захотим описать некий каузальный процесс в реальном мире, в котором такие взаимодействия все-таки присутствуют.

Поскольку анализ опосредования намного проще для линейных моделей, посмотрим, как он осуществляется, и с чем вероятны проблемы. Допустим, у нас есть каузальная диаграмма, выглядящая как рис. 59. Поскольку мы работаем с линейной моделью, мы можем представить силу каждого воздействия одним числом. Метки (путевые коэффициенты) показывают, что увеличение переменной экспериментальное воздействие на 1 единицу увеличит переменную медиатор на 2 единицы. Аналогично увеличение переменной медиатор на 1 единицу увеличит переменную итог на 3 единицы, а увеличение экспериментального воздействия на 1 единицу увеличит итог на 7 единиц. Все это прямые воздействия. Здесь мы подходим к первой причине того, почему линейные модели так просты: прямые воздействия не зависят от уровня опосредующей переменной, т. е. КПВ (m) одно и то же для всех значений m и мы можем говорить о единственном прямом воздействии.

Каково же будет суммарное воздействие интервенции, благодаря которой экспериментальное воздействие увеличится на 1 единицу? Во-первых, эта интервенция напрямую вынуждает итог увеличиться на 7 единиц (если мы удерживаем медиатор на постоянном уровне). Она также увеличивает медиатор на 2 единицы. Наконец, поскольку каждое увеличение медиатора на 1 единицу напрямую вызывает увеличение итога на 3 единицы, увеличение медиатора на 2 единицы приведет к дополнительному увеличению итога на 6 единиц. Поэтому суммарное увеличение итога по обоим каузальным путям будет составлять 13 единиц. Первые 7 единиц соответствуют прямому воздействию, а оставшиеся 6 — непрямому воздействию. Проще пареной репы!


Рис. 59. Пример линейной модели (путевая диаграмма) с опосредующей переменной


Итак, если имеется более одного непрямого пути от X к Y, мы оцениваем непрямое воздействие по каждому пути как произведение всех путевых коэффициентов вдоль этого пути. Затем мы получаем суммарное непрямое воздействие, суммируя все непрямые каузальные пути. В итоге суммарное воздействие X на Y равняется сумме прямых и непрямых воздействий. Это правило суммы произведений используется с тех пор, как Сьюалл Райт изобрел путевой анализ, и, строго говоря, оно действительно следует из определения суммарного взаимодействия в терминах do-оператора.

В 1986 году Рубен Барон и Дэвид Кенни сформулировали набор принципов для обнаружения и оценки опосредования в системе уравнений. Основные принципы заключаются, во-первых, в том, что все переменные связаны линейными уравнениями, которые оцениваются путем подбора их в соответствии с данными. Во-вторых, прямые и непрямые воздействия исчисляются путем подбора двух уравнений, соответствующих данным: одного с опосредующей переменной и другого без нее. Значительное изменение коэффициентов в случае, когда вводится опосредующая переменная, считается доказательством наличия опосредования.

Простота и убедительность метода Барона — Кенни снискала ему заслуженные лавры в среде общественных наук. В 2014 году их статья занимала 33-е место сверху в списке самых цитируемых работ за всю историю. Их цитировали чаще, чем Альберта Эйнштейна, чаще, чем Зигмунда Фрейда, чаще почти любого другого ученого, которого только можно вспомнить. Их статья стоит на втором месте среди всех публикаций по психологии и психиатрии, хотя она совсем не о психологии. Она о некаузальном опосредовании.

Беспрецедентная популярность подхода Барона — Кенни, без сомнения, определяется двумя факторами. Во-первых, опосредование — очень востребованная концепция. Наше желание понять, «как действует природа» (т. е. найти M в X → M → Y), вероятно, даже сильнее, чем желание подсчитать его. Во-вторых, этот метод легко редуцируется до процедуры, по простоте подобной кулинарному рецепту, основанной на знакомых концепциях статистики, дисциплины, которая долгое время претендовала на исключительное право на объективность и эмпирическую правомерность. Поэтому почти никто не заметил случившийся при этом гигантский рывок вперед — тот факт, что каузальная величина (опосредование) была определена и оценена чисто статистическими методами.

Тем не менее первые трещины в этом возведенном из регрессий оборонительном сооружении начали появляться еще в начале 2000-х, когда практики попытались обобщить правило суммы произведений для нелинейных систем. Это правило включает два допущения: воздействия вдоль разных путей аддитивны, а путевые коэффициенты вдоль одного пути перемножаются, и оба они приводят к неверным ответам в нелинейных моделях, как мы увидим ниже.

Это заняло немало времени, но в конце концов практикующие анализ опосредования окончательно пришли в себя. В 2001 году мой покойный друг и коллега Род Макдональд писал: «Я полагаю, что лучший способ обсудить вопрос обнаружения или демонстрации модерации или медиации в регрессии — это отложить всю имеющуюся по этому поводу литературу в сторону и начать с нуля». Самые свежие публикации по опосредованию, похоже, последовали совету Макдональда: контрфактивные и графические методы в них используются более часто и последовательно, чем регрессионный подход. А в 2014 году основоположник метода Барона — Кенни Дэвид Кенни опубликовал новый раздел на своем веб-сайте под названием «Каузальный анализ опосредования». Хотя я бы пока поостерегся назвать его обращенным, Кенни явно осознает, что времена меняются и анализ опосредования вступает в новую эпоху.

Теперь давайте рассмотрим простой пример того, как наши ожидания оказываются неверными, стоит нам только выйти за границы Линейной Страны Чудес. Рассмотрим рис. 60, представляющий собой слегка измененный рис. 59, на котором кандидат на рабочее место решает принять предложение тогда и только тогда, когда обещанное жалование превосходит определенную пороговую сумму, в нашем случае 10 единиц. Предложение по зарплате определяется так, как показано на диаграмме: 7 ×