Еще один вопрос, широко распространенный в естественных экспериментах, неизменно встает перед исследователем, если тот использует для сравнения статистические инструменты (хотя неявно он присутствует даже тогда, когда сравнение проводится нарративно, без статистических тестов). Может ли статистическая корреляция сама по себе свидетельствовать о наличии причины или механизма?
Конечно нет: чтобы подтвердить наличие причины или механизма, требуется по меньшей мере еще три шага, и все они подробно описаны в обширной методологической литературе. Во-первых, существует проблема обратной причинно-следственной связи: если А и В коррелируют, то, возможно, не А вызвало B, как предполагает исследователь; возможно, наоборот, B вызвало A. Часто эту проблему можно решить, обратившись ко временны́м отношениям — то есть, попросту говоря, изменилось ли А до появления B, или наоборот? Для определения вектора причинно-следственной связи часто применяется статистический метод, называемый тестом Грейнджера на причинность. Также используются и более сложные методы. Возьмем, например, недавнее исследование[394], в котором объясняется, какие участки мозга стимулируют другие определенные участки мозга, когда люди переходят от расслабленного состояния к настороженному. Его авторы нашли ответ, рассмотрев, как разности фаз между независимыми и зависимыми переменными изменяются с частотой их колебаний.
Во-вторых, следует учитывать то, что называют смещением опущенной переменной: возмущающая переменная, идентифицированная в ходе «эксперимента», на самом деле может быть частью взаимосвязанного комплекса изменений, в рамках которого имеются и другие переменные, и в действительности дисперсию результатов, возможно, вызывает именно одна из них. (По сути, это и есть тот самый риск, который исследователи, изучающие естественные эксперименты, пытаются минимизировать, хотя и без возможности полного успеха, как мы описали тремя абзацами выше.) С этой проблемой борются как Банерджи и Айер в своем исследовании последствий британского колониального налогообложения в Индии (глава 6), так и Аджемоглу и соавторы в исследовании наполеоновского влияния (глава 7). Среди множества методов, которые статистики используют для ее решения, часто применяют технику множественной регрессии: иными словами, непосредственно проверяют воздействие других возможных объясняющих факторов и смотрят, не пропадает ли кажущаяся объяснительная сила изначально выбранной переменной, когда во внимание принимаются эти остальные переменные.
В-третьих, даже если имеются убедительные доказательства того, что А является причиной В, для того чтобы определить механизм, посредством которого А вызывает B, часто требуется дополнительная информация. Например, расселение людей на экологически уязвимых тихоокеанских островах коррелирует с обезлесением, последовавшим за прибытием человека, и, конечно, нет сомнений, что именно колонизация повлекла за собой обезлесение, а не обезлесение вызвало произошедшую до него колонизацию. Тем не менее это наблюдение само по себе не объясняет, как именно человеческое расселение привело к обезлесению. Возможно, это были прямые действия людей (например, сжигание лесов, вырубка деревьев или использование древесного топлива) или различные косвенные последствия появления человека (например, поедание или повреждение крысами, привезенными человеком, семян деревьев). Дополнительная информация, которая может помочь выделить среди этих механизмов верный, включает в себя археологические и палеоботанические свидетельства: пни с отметинами от топора, угли от древесины опознаваемых видов в очагах и семена со следами крысиных зубов.
В статистическом анализе, как и в нарративном, несравнительном, неквантитативном историческом исследовании, необходимо искать золотую середину между чрезмерно упрощенным и чрезмерно усложненным объяснениями. С одной стороны, существует опасение, что статистический анализ приведет к упрощенным объяснениям, если исследователь после выявления одного-двух первых факторов перестанет искать дальнейшие причины, объясняющие результат. Но в действительности статистики стараются добавлять во множественную регрессию как можно больше независимых переменных, а также проводят анализ остатка, чтобы обнаружить еще больше объясняющих факторов, чем в ходе первого этапа анализа. И наоборот, можно с подозрением относиться к излишне сложным объяснениям — вспомнить хотя бы такую часто встречающуюся насмешку: «Дайте мне две переменные, и я нарисую вам слона; дайте мне третью переменную, и он начнет махать хоботом». На самом деле же статистики обязательно используют специальные тесты, например, так называемый F-тест, чтобы убедиться, что объяснительная сила каждой дополнительной проверяемой переменной больше, чем та, которой можно ожидать просто от случайно выбранной новой переменной.
В общем, чем более многочисленны потенциально важные независимые переменные, тем больше частных случаев необходимо сравнить, чтобы проверить воздействие этих переменных. И наоборот, чем больше случаев доступно для анализа, тем больше число объясняющих факторов, которые можно проверить. Второй по масштабу анализ в этой книге — это сравнение 81 тихоокеанского острова или островного региона по степени обезлесения, проведенное Ролеттом и Даймондом (глава четвертая). Столь обширный массив данных позволил установить существование статистически значимых и механистически объяснимых эффектов девяти независимых переменных: уровня осадков, температуры, возраста острова, количества принесенных ветром пепла и пыли, наличия макатеа (поднятого атолла), площади, высоты над уровнем моря и степени изолированности острова. На некоторые из этих эффектов указали Ролетту и Даймонду коллеги в ходе исследования; поначалу потенциальная их значимость даже не пришла авторам в голову. При таком множестве факторов, воздействующих на обезлесение, было бы совершенно невозможно оценить степень влияния каждого из них без обширной базы данных и применения статистических техник. Первоначально, исходя из своего личного знакомства с двумя примерами — влажным, теплым, почти не подвергшимся обезлесению Маркизским архипелагом и сухим, прохладным, сильно облысевшим островом Пасхи, — Ролетт и Даймонд предположили, что осадки и температура окажутся очень важны. Хотя окончательный анализ подтвердил эту догадку о значении осадков и температуры, однако в ретроспективе становится ясно, что это объяснение нельзя было бы считать исчерпывающим на основе одного только повествовательного сравнения всего двух конкретных случаев — поскольку Маркизы и Пасха отличаются друг от друга и по иным важным параметрам тоже.
Но не стоит считать, что достаточно большая база данных автоматически позволит исследователю обнаружить влияние практически любой переменной. Например, изначально Ролетт и Даймонд подозревали, что обезлесение может также зависеть от различий в четырех земледельческих практиках: ирригационном земледелии, суходольном земледелии, выращивании хлебного дерева и разведении (на Таити) каштанов и канариума. Однако после двух лет упорных попыток свести в таблицу эффект каждого из этих четырех методов на материале 81 острова Ролетт и Даймонд не нашли подтверждения своей догадки: ни одна из этих четырех практик не имела статистически значимого отношения к обезлесению.
Социологи имеют несчастье изучать менее четкие понятия, чем молекулярные биологи, физики, химики и астрономы. Те объясняют вещи, которые легко определить, легко измерить количественно и часто легко интуитивно понять, — такие как скорость, масса, скорость химической реакции и яркость света. Но нас, социологов, интересуют человеческое счастье, мотивация, успех, стабильность, процветание и экономическое развитие. Как соорудить прибор для измерения уровня счастья? Человеческое счастье труднее точно определить и измерить, чем атомный вес молибдена, но в то же время понять и объяснить его — задача куда более важная.
Большая часть практических затруднений при исследованиях в области социальных наук проистекает из необходимости «операционализировать» нечеткие, не поддающиеся измерению, но важные понятия вроде счастья. Задача ученого здесь состоит в том, чтобы выявить параметр, который можно измерить, и доказать, что он может служить отражением или приближенным выражением сущности не поддающейся определению концепции. Например, историкам, которые интересуются современным экономическим развитием, нужно всего лишь нажать одну кнопку на компьютере, чтобы скачать подробные и точные базы данных национального дохода разных стран. Но Аджемоглу и его соавторы (глава 7) хотят понять, положительно или отрицательно Наполеон повлиял на экономическое развитие Европы XIX века — периода, когда доходы еще никто не измерял и не сводил в таблицу. Что же им делать? Они прибегли к «операционализации» расплывчатой концепции экономического развития — то есть выявлению замещающей количественной величины, отражающей уровень экономического развития, но такой, данные для которой уже были доступны в начале XIX столетия. Подходящим заместителем оказывается уровень урбанизации: в частности, доля населения региона, проживающего в городах, каждый из которых насчитывает пять тысяч или более жителей. Ученые нашли эту переменную урбанизации полезным заместителем, поскольку так исторически сложилось, что урбанизацию способны были поддерживать только регионы с высокой продуктивностью сельского хозяйства и хорошо развитой транспортной системой, то есть участки, для которых уместно нечеткое определение «экономически развитых». Математики и физики, которые никогда не пытались измерить нечто столь важное, как уровень урбанизации или счастья, часто насмехаются над попытками социологов операционализировать эти понятия и цитируют вырванные из контекста примеры, чтобы оправдать свое пренебрежение[395].
А что же насчет важности количественных данных и измерений для исторических исследований?