Главной точкой соперничества Фишера и Райта был не путевой анализ, а эволюционная биология. Фишер был не согласен с теорией Райта (называемой генетическим дрейфом), согласно которой вид может эволюционировать очень быстро, когда проходит через популяционное бутылочное горлышко. Детали этого спора выходят за рамки данной книги, и заинтересованный читатель должен обратиться к работе Провина. Важно здесь, однако, следующее: с 20-х до 60-х годов ХХ века научный мир был преимущественно повернут лицом к Фишеру, как к оракулу статистических знаний. И уверяю вас, что он никогда не сказал ни одного доброго слова про путевой анализ.
В 1960-х все стало понемногу меняться. Группа представителей общественных наук, включающая Отиса Дункана, Хьюберта Блалока и экономиста Артура Гольдбергера (упомянутого ранее), заново открыла путевой анализ как метод предсказания результатов социальной и образовательной политики. По иронии судьбы Райта приглашали выступить перед влиятельной группой эконометриков, комиссией Каулза, в 1947 году, но ему совершенно не удалось разъяснить им, в чем смысл путевых диаграмм. Только когда экономисты сами додумались до подобных идей, на короткое время удалось установить контакт. Судьба путевого анализа в экономике и в социологии двигалась по разным траекториям, но каждая из них вела к предательству идей Райта. Социологи переименовали путевой анализ в уравнения структурного моделирования (Structural Equation Modeling; SEM), полюбили диаграммы и активно их использовали до 70-х годов прошлого века, когда компьютерная программа LISREL автоматизировала подсчет путевых коэффициентов (в некоторых случаях). Райт мог бы предсказать то, к чему это привело: путевой анализ превратился в рутинный метод, а исследователи стали пользователями программы, которых слабо интересует, что у нее внутри. В конце 1980-х обращенный к научному обществу призыв (статистика Дэвида Фридмана) объяснить допущения, стоящие за уравнениями структурного моделирования, был проигнорирован, а некоторые эксперты по SEM даже отрицали, что этот метод как-то связан с причинностью.
В экономике алгебраическая часть путевого анализа получила известность как системы одновременных уравнений (без общепринятого сокращения). Экономисты почти никогда не использовали путевые диаграммы и продолжают обходиться без них и по сей день, полагаясь взамен на числовые уравнения и матричную алгебру. Прямое последствие этого подхода в том, что, поскольку алгебраические равенства не направлены(т. е. x = y — это то же самое, что и y = x), у экономистов не было обозначений для различения причинных и регрессионных уравнений, поэтому на вопросы, связанные с выбором стратегии, не получалось ответить даже после того, как уравнения были решены. Вплоть до 1995 года большинство экономистов избегали прямо придавать своим уравнениям каузальный или контрфактивный смысл. Даже те из них, кто использовал структурные уравнения для обоснования выбора стратегических решений, неизлечимо боялись диаграмм, хотя те могли бы избавить их от многих страниц лишних вычислений. Неудивительно, что многие экономисты и сегодня стоят на точке зрения «в данных уже содержится все».
По всем этим причинам многообещающие перспективы путевых диаграмм оставались реализованы только отчасти, по крайней мере до 90-х годов прошлого века. В 1983 году Райта снова лично вызвали на ринг защищать их, на этот раз в «Американском журнале генетики человека». В то время, когда он писал эту статью, ему уже было за 90. Читать его эссе 1983 года одновременно и радостно, и больно — оно о том же, о чем он писал в 1923 году. Много ли в истории науки случаев, когда нам выпадала честь вновь выслушать создателя великой теории через 60 лет после того, как он впервые изложил ее на бумаге? Это примерно как если бы Чарлз Дарвин восстал из могилы, чтобы поприсутствовать на «обезьяньем процессе» Скоупса в 1925 году. Но это и трагично, потому что за эти 60 лет теория должна была расти, развиваться, цвести, а вместо этого она осталась практически на том же уровне, что и в 1920-х.
Написать статью Райта побудила критика путевого анализа, которую ранее опубликовали в том же журнале Самуэль Карлин (математик Стэнфордского университета, награжденный в 1989 году Национальной научной медалью, внесший фундаментальный вклад в экономику и популяционную генетику) и два его соавтора. Нас здесь интересуют два аргумента Карлина.
Во-первых, путевой анализ вызывает у Карлина возражения по причине, которую Найлз не упомянул: он предполагает, что все взаимоотношения между любыми переменными в путевой диаграмме линейны. Это допущение позволило Райту описать каузальные взаимодействия с помощью только одного числа — путевого коэффициента. Если бы уравнения были нелинейны, то тогда воздействие на Y от изменения X на единицу зависело бы от текущего значения X. Ни Карлин, ни Райт не знали, что до появления общей теории нелинейности осталось совсем немного (ее всего три года спустя разработает звезда моей лаборатории Томас Верма).
Но самое интересное возражение Карлина — как раз то, которое он считал важнейшим: «Наконец, с наибольшим успехом исследователь может выбрать подход, не предполагающий модели вообще, приводящий к пониманию данных интерактивно, используя ряд отображений, индексов и контрастов. Этот подход подчеркивает концепцию надежности данных в интерпретации результатов». В одном этом коротком отрывке Карлин выражает, сколь мало изменилось со времен Пирсона и насколько влиятельной его идеология оставалась даже в 1983 году. Он говорит, что в самих данных уже заключена вся научная мудрость; их нужно только уметь умаслить и сделать им массаж (с помощью отображений, индексов и противопоставлений), и они сами выронят жемчуг мудрости вам в руки. Нашим аналитикам нет нужды принимать во внимание процессы, которые привели к появлению этих данных. У нас все получится ровно так же, и даже лучше с подходом, «не предполагающим никакой модели вообще». Если бы Пирсон жил сегодня, в эпоху больших данных, он сказал бы ровно это: все ответы уже содержатся в самих данных. Конечно, утверждения Карлина нарушают все, о чем мы говорили в первой главе. Чтобы говорить о причинности, нам требуется ментальная модель реального мира. «Безмодельный подход» может привести нас на первую ступень Лестницы Причинности, но никак не дальше.
Райт, надо отдать ему должное, прекрасно понимал, как велики ставки, и написал недвусмысленно: «Заявляя, что подход, не предполагающий модели вообще — наилучшая альтернатива… Карлин с соавторами хотят не просто изменить метод путевого анализа, но лишить его цели и оценки относительной важности различных причин. Этот анализ невозможен без модели. Они предлагают тем, кому хочется провести такую оценку, подавить свое желание и заняться чем-нибудь другим».
Райт понимал, что защищает саму суть научного подхода и интерпретации данных. Сегодня я бы дал энтузиастам больших данных, избегающим моделей, тот же совет. Конечно, замечательно попытаться выудить всю информацию, которую данные способны нам сообщить, но надо понимать, насколько далеко это позволит нам уйти. А уйти оно позволит не дальше первой ступени Лестницы Причинности и никогда не сможет дать ответ даже на такой простой вопрос: какова относительная важность различных действующих факторов?
E pur si muove!
От объективности к субъективности: мост, переброшенный Байесом
Еще одна тема из отповеди Райта может намекнуть на другое обстоятельство, по которой статистики сопротивлялись причинности. Он многократно утверждает, что не хотел бы, чтобы путевой анализ стал «стереотипным». Буквально по Райту: «Нестереотипный подход путевого анализа принципиально отличается от стереотипных моделей описания, созданных для того, чтобы избегать малейших отклонений от полной объективности».
Что он имеет в виду? Во-первых, то, что путевой анализ должен быть основан на личном понимании причинно-следственных процессов, отраженных в каузальных диаграммах. Он не может быть редуцирован до механических процедур вроде тех, что описываются в справочниках по статистике. Для Райта рисование путевой диаграммы — не упражнение в статистике; это упражнение в генетике, экономике, психологии или любой другой области, экспертом в которой является ученый.
Во-вторых, Райт прослеживает связь очарования «безмодельных» методов с их объективностью. Для статистики объективность действительно была святым Граалем с самого первого дня, или же с 15 марта 1834 года, когда было основано Лондонское статистическое общество. В его уставе сказано, что данные во всех случаях имеют приоритет над мнениями и интерпретациями. Данные объективны — мнения субъективны. Эта парадигма возникла задолго до Пирсона. Борьба за объективность — принцип выведения умозаключений только на основе данных и экспериментов — была важнейшим моментом в том, как наука определяла сама себя со времен Галилея.
В отличие от корреляций и большинства других инструментов общепринятой статистики, каузальный анализ требует от пользователя субъективной заинтересованности. Ему потребуется нарисовать каузальную диаграмму, отражающую его качественные представления, или, скорее, консенсусные представления исследователей в его области науки, о топологии происходящих в данном случае каузальных процессов. Он должен забыть о многовековой догме объективности для ее же пользы. Там, где дело касается причинности, одно зерно разумной субъективности говорит нам больше о реальном мире, нежели любые объемы объективности.
Абзацем выше я сказал, что «большинство» инструментов статистики стремится к полной объективности. Для этого правила, однако, есть одно серьезное исключение. Область статистики, именуемая байесовой статистикой, за последние примерно 50 лет достигла значительной популярности. Когда-то ее едва ли не проклинали, но теперь это нечто совершенно общепринятое, и на конференции по статистике за все время работы уже не услышать ни одного спора между «байесианцами» и «частотниками», хотя в 1960-х и 1970-х они гремели.