Думай «почему?». Причина и следствие как ключ к мышлению — страница 13 из 82

Y или наоборот. Другими словами, наклон прямой ничего не говорит нам о том, что в данном случае причина, а что следствие. Одна переменная обусловливает значения другой, или обе они обусловливаются третьей; для предсказания их значений это не важно.

Гальтонова идея корреляции впервые предоставила объективную меру связи двух переменных друг с другом, не зависящую от человеческих суждений и интерпретаций. Эти две переменные могут быть ростом, интеллектом или уровнем дохода; они могут находиться в каузальной, нейтральной или обратно-каузальной зависимости друг от друга — их корреляция всегда будет отражать степень взаимной предсказуемости значений двух признаков. Ученик Гальтона Карл Пирсон позже вывел формулу для наклона (правильно масштабированной) линии регрессии и назвал ее коэффициентом корреляции. До сих пор это первое число, которое вычисляют статистики по всему земному шару, когда хотят узнать, насколько взаимосвязаны любые два признака в массиве данных. Гальтон и Пирсон, должно быть, пришли в восторг, обнаружив такой универсальный способ описания взаимоотношений между случайными переменными. Старые, скользкие концепции причины и следствия по сравнению с математически прозрачной и четкой концепцией коэффициента корреляции казались устаревшими и ненаучными, в особенности Пирсону.

Гальтон и оставленные поиски

По иронии истории Гальтон начал с поисков причинности, а закончил открытием корреляции, отношения, лишенного причинности. Однако все равно признаки каузального мышления остаются в его публикациях. «Легко заметить, что корреляция [между размерами двух органов] должна быть следствием того, что изменчивость двух этих органов отчасти вызвана общими причинами», — пишет он в 1889 году. Первым жертвоприношением на алтарь корреляции стала сложная машина Гальтона для объяснения стабильности распределения генетических признаков в популяции. Доска Гальтона имитировала создание изменчивости по длине тела и ее передачу от поколения к поколению. Но ученому пришлось изобрести наклонные желоба в своей машине, ограничивающие постоянно возрастающее разнообразие в популяции. Не сумев обнаружить биологический механизм, удовлетворительно объясняющий эту силу, возвращающую к среднему, Гальтон просто прервал попытки после восьми лет бесплодных поисков и все внимание сосредоточил на корреляции, как моряк на песне сирены. Статистик Стивен Стиглер, много писавший о Гальтоне, заметил этот неожиданный сдвиг в целях и ожиданиях ученого: «Фигурой умолчания оказались Дарвин, желобки, все это „выживание наиболее приспособленных”. … По жестокой иронии, то, что начиналось как попытка подвести математическую основу под „Происхождение видов”, закончилось тем, что сама суть этой великой работы оказалась отброшена, как ненужная!»

Но для нас, живущих в современную эпоху причинного вывода, исходная проблема остается. Как мы объясним стабильность популяционного среднего, невзирая на дарвиновскую изменчивость, которой одно поколение наделяет последующее?

Возвращаясь к машине Гальтона в свете диаграмм причинности, первое, что я замечаю, — это то, что она была сконструирована неправильно. Постоянно растущей дисперсии, которая вынудила ученого создать ей противовес, вообще не должно было там быть. В самом деле, если мы проследим падение шарика в доске Гальтона с одного уровня на другой, мы увидим, что отклонение на следующем уровне наследует сумму всех отклонений, причиненных всеми булавками, с которыми он сталкивался на своем пути. Это откровенно противоречит уравнению Канемана:

Успех = Талант + Удача;

Большой успех = Чуть больше таланта + Намного больше удачи.

Согласно этим уравнениям, успех в поколении 2 не наследует удачу из поколения 1. Удача по определению преходяща и случайна; она не может влиять на будущие поколения. Но подобное поведение признака несовместимо с устройством машины Гальтона. Чтобы сравнить эти две концепции рядом, нарисуем их ассоциированные диаграммы причинности. На рис. 10а (концепция Гальтона) успех передается через поколения и удача накапливается неограниченно. Это легко себе представить, если под успехом понимать богатство или знатность. Однако для описания наследования физических характеристик, таких как рост, нам придется заменить модель Гальтона той, что на рис. 10б. В ней только генетическая компонента, показанная здесь как талант, передается от одного поколения к другому. Удача действует на каждое поколение независимо, таким образом, что случайные факторы в одном поколении не могут влиять на последующие поколения ни прямо, ни косвенно.


Рис. 10. Две модели наследуемости: а — модель, соответствующая машине Гальтона, в которой удача накапливается от поколения к поколению, приводя ко все возрастающей дисперсии успеха; б — генетическая модель, в которой удача не накапливается, приводит к постоянному разбросу успеха


Обе эти модели совместимы с колоколообразным распределением значений роста. Но первая модель не совместима со стабильностью разброса роста (или успеха). Вторая же модель показывает, что для объяснения стабильности разброса успеха от поколения к поколению нам достаточно объяснить только стабильность генетических факторов в популяции (таланта). Эта стабильность, теперь называемая равновесием Харди — Вайнберга, получила удовлетворительное математическое объяснение в работе Годфри Харолда Харди и Вильгельма Вайнберга 1908 года. И да, они основывались на еще одной каузальной модели — менделевской теории наследственности.

Ретроспективно рассуждая, Гальтон не мог предвидеть достижения Менделя, Харди и Вайнберга. В 1877 году, когда Гальтон прочитал свою лекцию, работа Грегора Менделя 1866 года была основательно забыта (ее вновь открыли только в 1900 году), а математические выкладки доказательства Харди и Вайнберга были бы для него, вероятно, слишком сложны. Однако интересно обратить внимание, как близок он был к верному подходу и как диаграммы причинности легко вскрывают ложность его допущения: передачу случайных факторов, удачи, от одного поколения к другому. К сожалению, его завела в тупик красивая, но неверная причинная модель, а позже, открыв красоту корреляции, он уже решил, что каузальность больше не нужна.

В качестве заключительного личного комментария к истории Гальтона я сознаюсь в смертном для историка грехе, одном из многих грехов, допущенных мной в этой книге. В 1960-х стало немодно писать историю науки с точки зрения современной науки, как я делал выше. Такой стиль исторических заметок, который фокусируется на удачных теориях и экспериментах и уделяет мало внимания неподтвержденным теориям и научным тупикам, теперь именуют издевательским термином «история в стиле вигов». Современный стиль истории науки более демократичен, в нем химики и алхимики пользуются равным уважением, а все теории рассматриваются в социальном контексте своего времени.

Однако, когда приходится объяснять, каким образом причинность была изгнана из статистики, я с гордостью надеваю парик историка-вига. Иначе как надев каузальные очки и пересказав историю Гальтона и Пирсона в свете современной науки о причинах и следствиях, просто невозможно понять, как же статистика стала нечувствительным к типу модели методом редукции данных. На самом деле, поступая так, я выпрямляю искажения, созданные современным большинством историков, которые, не владея каузальным словарем, восхищаются изобретением корреляции и не способны заметить огромную потерю — смерть причинности.

Гнев фанатика

Завершить позорное изгнание причинности из статистики предстояло ученику Гальтона Карлу Пирсону. Однако даже он не смог довести это изгнание до конца.

Прочтение «Естественной наследственности» Гальтона стало одним из определяющих моментов в жизни Пирсона: «Я почувствовал себя корсаром времен Дрейка — членом отряда „не вполне пиратов, но с отчетливо пиратскими тенденциями”, как уточняет словарь! — написал он в 1934 году. — Я понял… Гальтона так, что он предполагал существование категории более широкой, чем причинная связь, а именно корреляции, по отношению к которой причинность была только предельным состоянием, и эта новая концепция корреляции ввела психологию, антропологию, медицину и социологию в значительной степени в поле математического анализа. Именно Гальтон впервые освободил меня от предрассудка, будто достойная математика может быть применима только к природным явлениям под категорией причинной связи».

Согласно взглядам Пирсона, Гальтон расширил словарь науки. Причинно-следственные связи были разжалованы в не более чем частный случай корреляции (а именно когда коэффициент корреляции равен 1 или –1 и взаимоотношения между X и Y жестко детерминированы). Свое видение причинности он очень четко формулирует в «Грамматике науки» (1892): «То, что определенная последовательность явлений случалась и повторялась в прошлом, — это опыт, который мы выражаем в концепции причинно-следственных связей. … Наука никоим образом не может продемонстрировать никакой неотъемлемой необходимости в последовательности явлений, ни доказать с абсолютной уверенностью, что эта последовательность должна воспроизводиться». Таким образом, причинность для Пирсона сводится к повторяемости и в детерминистском смысле не может быть доказана. К причинности в недетерминистском мире Пирсон еще более пренебрежителен: «В конечном итоге научное утверждение, описывающее отношение двух явлений, всегда может быть сведено… к таблице сопряженности».

Другими словами, наука — это только данные. Больше ничего. В этом мировоззрении понятия действия и альтернативного сценария, обсужденные в главе 1, не существуют, и самый нижний уровень Лестницы Причинности — это все, что нужно, чтобы заниматься наукой.

Ментальное сальто от Гальтона к Пирсону захватывает дух и действительно достойно корсара. Гальтон доказал только, что одно явление — регрессия к среднему — не нуждается в каузальном объяснении. Пирсон же полностью удалил причинность из науки. Что привело его к этому логическому трюку?