[358]. Это достаточно большая разница, которая может изменить результат выборов при близкой популярности кандидатов; к тому же эффект мог усилиться в последующие десятилетия, когда Fox News повсеместно проник на телерынок, благодаря чему его влияние теперь труднее доказать, хотя слабее оно и не стало.
Труднее, но все же возможно. Еще один гениальный ход носит загадочное имя «регрессия инструментальной переменной». Предположим, вы хотите проверить, вызывает ли причина А событие В, и переживаете из-за обычных проблем в виде обратной причинной зависимости (В вызывает А) и мешающего параметра (С вызывает как А, так и В). Далее предположим, что вы отыскали какую-то четвертую переменную, I («инструмент»), которая коррелирует с предполагаемой причиной А, но не может ею вызываться — например, потому, что I предшествует А, а будущее не в силах повлиять на прошлое. Предположим также, что эта незапятнанная переменная к тому же не коррелирует с мешающим параметром С и не может вызывать В непосредственно, а только повлияв на А. Даже если саму А нельзя рандомизировать, у нас есть ее наилучшая альтернатива, I. Если I, свободный от подозрений заменитель А, будет коррелировать с В, это значит, что А вызывает В.
Какое отношение это имеет к Fox News? Еще один подарок социологам — знаменитая американская лень. Американцы терпеть не могут выходить из машин, разбавлять водой суповые концентраты и переключаться на телеканалы с двузначными номерами. Чем ниже номер канала, тем шире его аудитория. Кабельные компании присваивают телеканалам номера случайным образом (нумерация определяется только тем, когда кабельная компания заключила договор с телевещательной, и никоим образом не зависит от демографических характеристик аудитории). Низкий номер (I) может сподвигнуть людей смотреть Fox News (А), а просмотр Fox News то ли может, то ли не может заставить их голосовать за республиканцев (В), но вот ни консервативные взгляды (С), ни голосование за республиканцев (В) не может заставить любимый некоторыми телеканал получить номер пониже. Как и ожидалось, если сопоставить данные по кабельным рынкам, то чем ниже номер канала Fox News относительно других новостных телеканалов, тем выше в этом районе процент голосующих за республиканцев[359].
От корреляции к причинности без экспериментов
Когда специалисты по анализу данных обнаруживают разрыв регрессии или инструментальную переменную, это для них просто праздник, хотя чаще им приходится вытягивать какую ни на есть причинность из привычной путаницы корреляций. Но не стоит опускать руки: для каждого из недугов причинного вывода существуют свои паллиативные средства. Они не так хороши, как обаяние рандомизированности, но зачастую это лучшее, что можно сделать в мире, который создавался не ради удобства ученых.
Проще всего избавиться от обратной причинной зависимости — благодаря железному закону, который не дает разгуляться писателям-фантастам и сценаристам, сочиняющим истории о путешествиях во времени вроде фильма «Назад в будущее» (Back to the Future, 1985): будущее не может влиять на прошлое. Предположим, у вас есть гипотеза «демократия является причиной мира, но не наоборот» и вы хотите ее проверить. Во-первых, в поисках причинно-следственной связи нужно избежать ошибки «все или ничего» и копнуть чуть глубже популярного, но неверного утверждения, будто «демократии никогда не воюют друг с другом» (исключений масса)[360]. Гипотеза, точнее соответствующая реальности, гласит, что страны, более демократичные по сравнению с другими, с меньшей вероятностью вступают в войны[361]. Ряд исследовательских организаций присваивает странам индекс демократии — показатель, который варьируется от –10 для абсолютной автократии вроде Северной Кореи до +10 для абсолютной демократии вроде Норвегии. Миролюбие численно выразить труднее, потому что (к счастью для человечества, но к неудобству социологов) полномасштабные войны редки, и большая часть записей в массиве данных выглядит как «0». Вместо этого воинственность государства можно оценить по числу «вооруженных противостояний», в которые оно ввязалось за год: случаев бряцания оружием, мобилизации войск, предупредительных выстрелов, самолетов вблизи чужих границ, воинственной риторики и приграничных стычек. Эти данные можно превратить из индекса воинственности в индекс миролюбия (так, чтобы показатель миролюбивых стран был выше), вычтя набранные страной баллы из какого-нибудь большего числа, например из максимального количества когда-либо зарегистрированных противостояний. Теперь можно сопоставить индекс миролюбия с индексом демократии, не забывая, конечно, что сама по себе корреляция ничего не доказывает.
Но предположим, что каждая переменная измеряется дважды, скажем с разницей в десять лет. Если демократия является причиной мира, то индекс демократии в первом измерении будет коррелировать с индексом миролюбия во втором. Это тоже мало что доказывает, потому что за десять лет леопард не избавится от пятен: мирная демократия в прошлом может оставаться такой же мирной и сегодня. Но для контроля можно изучить другую диагональ — корреляцию между демократией (индексом демократии) во втором измерении и миром (индексом миролюбия) в первом. Эта корреляция зафиксирует любую обратную причинно-следственную связь вкупе с мешающими параметрами, не изменившимися за десять лет. Если первая корреляция (причина — в прошлом, эффект — в настоящем) сильнее второй (эффект — в прошлом, причина — в настоящем), это намек, что скорее демократия — причина мира, а не наоборот. Такая техника называется перекрестной панельной корреляцией, где «панель» — жаргонный термин, которым специалисты обозначают массив данных, содержащий результаты измерений, сделанных в разные моменты времени.
Грамотный статистик умеет призвать к порядку и мешающие параметры. Если вы интересуетесь новостями науки, то наверняка читали об исследователях, «удерживающих на постоянном уровне» или «статистически контролирующих» какой-нибудь мешающий параметр. Самый простой способ сделать это называется мэтчингом[362]. Связь демократии и мира загрязнена массой мешающих параметров: тут и благосостояние, и образование, и торговля, и членство в международных организациях. Давайте рассмотрим один из них, благосостояние; его можно измерить как ВВП на душу населения. Предположим, что каждой демократической стране в нашей выборке мы сопоставили автократию с тем же уровнем ВВП на душу населения. Если мы сравним средние индексы миролюбия для демократий со средними индексами для их автократических двойников, мы измерим влияние демократии на мир, удерживая благосостояние на постоянном уровне. Логика мэтчинга очевидна, но для применения этого метода требуется большой набор кандидатов, из которого можно было бы выбирать подходящие пары; с каждым новым мешающим параметром он должен быть все больше. Это может сработать для эпидемиологического исследования с десятками тысяч участников, но не для политологического исследования в мире, где всего 195 государств.
Более общая техника называется множественной регрессией; она опирается на тот факт, что мешающий параметр никогда не коррелирует с предполагаемой причиной идеально. Оказалось, что расхождения между ними — не назойливый шум, но красноречивая информация. Вот как это работает с демократией, миром и ВВП на душу населения. Первым делом сопоставим предполагаемую причину, индекс демократии, с мешающим параметром (график слева вверху); каждая точка обозначает страну. (Данные взяты с потолка исключительно для иллюстрации логики.) Далее строим прямую регрессии и смотрим на отклонения регрессии — вертикальные расстояния между каждой точкой и прямой, соответствующие разнице между индексом демократии страны, каким он был бы, если бы доход идеально предсказывал бы уровень демократии, и реальным индексом демократии. Теперь заменим реальные индексы демократии всех стран на эти отклонения регрессии, то есть на показатели демократии при статистически контролируемом ВВП.
Дальше проделаем то же самое для предполагаемого следствия, то есть миролюбия. Сопоставляем индекс миролюбия с мешающим параметром (график справа вверху), измеряем отклонения регрессии, отбрасываем первоначальные данные и заменяем их отклонениями, то есть величиной, на которую реальная миролюбивость каждой из стран отличается от ожидаемой, вычисленной на основе уровня благосостояния. Последний шаг очевиден: сопоставить первые остатки со вторыми (нижний график). Если корреляция значительно отличается от нуля, можно решиться на вывод: удерживая благосостояние на постоянном уровне, демократия действительно является причиной мира.
То, что вы только что наблюдали, — самая суть подавляющего большинства статистических методов, применяемых в эпидемиологии и социальных науках, и называется это основной линейной моделью. Конечный результат ее применения — уравнение, позволяющее предсказать эффект на основании взвешенной суммы предикторов (некоторые из них, предположительно, являются причинами). Обладая хорошим пространственным воображением, можно представить себе прогноз не в виде прямой, но в виде наклонной плоскости, парящей над нулевым уровнем, заданным значениями двух предикторов. В принципе, в это уравнение можно ввести сколько угодно предикторов, создав гиперплоскость в гиперпространстве и поставив в тупик свое беспомощное воображение (которому и с тремя-то измерениями непросто справиться), но, если говорить о математике, нам всего лишь придется прибавить к формуле парочку новых слагаемых. Что касается мира, уравнение будет выглядеть так:
Миролюбие = (a × демократия) + (b × ВВП на душу населения) + (