Регрессия к среднему
Слово «регрессия» стало общепринятым обозначением корреляционного анализа, но связаны они не напрямую. Первоначально этот термин относился к особому, сопряженному с корреляцией явлению — регрессии к среднему. Этот повсеместно распространенный, но, на первый взгляд, парадоксальный феномен открыл викторианский ученый-универсал Фрэнсис Гальтон (1822–1911), который сопоставил рост детей со средним ростом родителей («средним по родителям», то есть со средним арифметическим ростов отца и матери), в обоих случаях внося поправку на среднюю разницу в росте мужчин и женщин. Гальтон обнаружил, что «если средний родительский показатель выше посредственного, дети обычно ниже родителей, если же средний родительский показатель ниже посредственного, дети обычно выше родителей»[339]. Это до сих пор так, причем в отношении не только роста детей и родителей, но и коэффициента интеллекта детей и родителей и, если уж на то пошло, любых двух не идеально коррелирующих переменных. Экстремальное значение одной из них будет, как правило, соответствовать не-так-чтобы-экстремальному значению другой.
Это не значит, что высокие родители производят на свет все более низкорослое потомство, и наоборот, так что однажды все дети мира выровняются по одной и той же отметке на косяке, и не видать нам больше ни жокеев, ни баскетболистов. Не стоит и ожидать, что IQ человечества сойдется на посредственных ста баллах, а гении и глупцы вымрут без следа. Вопреки регрессии к среднему человечество не скатывается ко всеобщей посредственности; дело в том, что хвосты распределения постоянно пополняются редкими очень высокими детьми родителей выше среднего и очень низкорослыми отпрысками родителей ниже среднего.
Регрессия к среднему — чисто статистический феномен, следствие особенности, присущей нормальным распределениям: чем сильнее величина отличается от среднего, тем реже она встречается. Отсюда следует, что, если значение переменной действительно исключительно велико или мало, значение любой другой сопоставленной с ней переменной (например, рост ребенка родителей-гигантов) вряд ли будет таким же странным, или продолжит полосу везения, или оседлает ту же удачу, или потерпит то же фиаско, или еще раз угодит в идеальный шторм — скорей всего, оно скатится к заурядности. В случае роста или коэффициента интеллекта все будет определяться уникальным сочетанием родительских генов, влияния среды и биологических случайностей. Какие-то из составляющих этого сочетания дети унаследуют, но в точности оно не воспроизводится никогда. (И наоборот: так как регрессия — статистический, а не причинный феномен, характеристики родителей точно так же регрессируют к среднему относительно детей.)
Если графически отобразить соотношение двух коррелирующих величин, имеющих нормальное распределение, диаграмма рассеяния будет похожа на наклоненный мяч для регби. На рисунке ниже представлен гипотетический массив данных, подобный собранному Гальтоном: рост родителей (среднее по каждой паре) и рост их взрослых детей (скорректированный так, чтобы рост сыновей и дочерей можно было откладывать на одной оси).
Серая диагональ, пересекающая координатную плоскость под углом 45°, показывает, какую картину мы наблюдали бы, если бы дети уникальных родителей были такими же уникальными. Черная прямая регрессии — то, как обстоят дела в реальности. Если вы посмотрите на крайние значения, скажем на родителей, средний показатель роста которых превышает 6 футов (182 см), вы обнаружите, что точки, обозначающие их потомство, в основном сосредоточены ниже диагонали в 45°, в чем легко убедиться, проведя правую вертикальную пунктирную линию до прямой регрессии, повернув налево и проведя горизонтальную пунктирную линию до вертикальной оси, в которую она утыкается чуть выше отметки 5 футов 9 дюймов (175 см), — эти дети ниже своих родителей. Если же посмотреть на родителей, чей средний рост 5 футов (152 см, левая вертикальная пунктирная линия), вы увидите, что точки, обозначающие их детей, в основном сосредоточены выше серой линии, а повернув налево от прямой регрессии, вы уткнетесь в отметку 5 футов 3 дюйма (160 см), а значит, эти дети своих родителей переросли.
Регрессия к среднему наблюдается, если две переменные не полностью коррелируют, а это значит, что мы сталкиваемся с ней буквально на каждом шагу. И тем не менее Тверски и Канеман показали, что люди, как правило, ничего не знают об этом феномене — показанного ниже шутника из комикса Frank and Ernest можно не учитывать{30},[340].
Необычные явления притягивают внимание людей, но им невдомек, что любая связанная с ними характеристика вряд ли будет настолько же необычной — и они пускаются{31} выдумывать нелепые объяснения тому, что, по сути, представляет собой статистическую закономерность.
Печальным примером этого можно считать иллюзию, будто критика эффективнее похвалы, а наказание — награды[341]. Мы ругаем школьника за двойку, но какое бы неудачное стечение обстоятельств ни обрекло его на провал в прошлый раз, вряд ли оно повторится при следующей попытке, поэтому ребенок как пить дать исправится, а мы будем думать, что наказание сработало. Мы хвалим его за пятерку, но снаряд дважды в одну воронку не падает, и поэтому он вряд ли возьмет ту же высоту в следующий раз, а мы будем думать, что похвала его только портит.
Неосведомленность о регрессии к среднему создает почву и для многих других иллюзий. Спортивные болельщики ломают головы, почему «дебютант года» обязательно сталкивается с «кризисом второго сезона» и почему атлет, чей портрет однажды попал на обложку известного спортивного журнала, в дальнейшем обречен жить с «проклятием Sports Illustrated». (Излишняя самоуверенность? Завышенные ожидания? Звездная болезнь?) Но если человека чествуют за неделю или год невероятной удачи, вряд ли звезды сойдутся таким образом два раза подряд, так что ему — или ей — остается только дрейфовать к среднему. (И если неудачливая команда после замены тренера показывает хорошую игру, это тоже ровным счетом ничего не значит.) После того как новость о серии ужасных преступлений разлетится по всем газетам, политики начинают активно заниматься деятельностью полицейского спецназа, закупками новых технических средств, табличками «Соседского дозора» и прочими эффектными мерами — и, естественно, через пару месяцев уже поздравляют себя со снижением уровня преступности. Психотерапевты, независимо от школы разговорной терапии, также могут незаслуженно приписывать себе победу над болезнью, полечив пациента, явившегося к ним с жесточайшим приступом депрессии или тревожности.
Как всегда, не застрахованы от таких ошибок и ученые. У кризиса воспроизводимости есть и еще одна причина: экспериментаторы не учитывают разновидность регрессии к среднему, которая называется «проклятием победителя». Для того чтобы интересующий нас эффект подтвердился экспериментально, много чего должно пойти так, как надо, — и неважно, реален эффект или нет. Может, сегодня экспериментатору улыбнулась удача — но не факт, что так случится и завтра, а значит, пытаясь воспроизвести результат, ему нужно привлечь к эксперименту больше участников. Но ученые обычно думают, что раз они уже собрали кое-какие доказательства, то могут обойтись меньшим числом участников, не осознавая, что такая стратегия ведет их прямиком к публикации в «Журнале невоспроизводимых результатов»[342]. На неспособности понять, как регрессия к среднему влияет на поразительные открытия, основаны аргументы нелепой статьи «Исчезающие истины» (The Truth Wears Off), опубликованной в 2010 г. журналом The New Yorker; там постулировался загадочный «эффект снижения», который, по мнению автора, ставит под сомнение сам научный метод[343].
Проклятие победителя распространяется на любое наше необычайно успешное начинание, и неумение вводить поправку на неповторимые мгновения удачи, возможно, отчасти объясняет, почему жизнь так часто нас разочаровывает.
Что такое причинно-следственная связь?
Прежде чем попытаться перекинуть мост от корреляции к причинности, давайте проведем разведку на противоположном берегу, то есть рассмотрим саму причинность, которая оказалась на удивление расплывчатой концепцией[344]. Дэвид Юм в очередной раз определил ход дискуссии на столетия вперед, предположив, что причинность — это просто ожидание, что корреляция, с которой мы столкнулись в прошлом, сохранится и в будущем[345]. Если мы уже неоднократно наблюдали за игрой в бильярд, то всякий раз, увидев, как один шар приближается к другому, мы, опираясь на подразумеваемое, но недоказуемое допущение, что законы природы устойчивы во времени, ожидаем, что этот другой, как всегда, устремится вперед.
Нетрудно понять, почему «устойчивая конъюнкция» — плохой фундамент для теории причинности. Петух всегда кукарекает перед рассветом, но мы же не думаем, что это петух заставляет солнце вставать. Гром часто предшествует лесным пожарам, но мы же не утверждаем, будто гром вызывает пожар. Все это — эпифеномены; их еще называют мешающими параметрами — они сопутствуют событию, но не вызывают его. Эпифеномены — проклятье эпидемиологии. Годами кофе винили в болезнях сердца, потому что с любителями кофе инфаркты случаются чаще. Оказалось, однако, что эти люди к тому же больше курят и не занимаются спортом, а кофе — просто эпифеномен.
Юм предчувствовал такой поворот и развил свою идею: причина должна не просто регулярно предшествовать следствию — важно, что «если бы не было первого объекта, то никогда не существовало бы и второго»