Шанс есть! Наука удачи, случайности и вероятности — страница 10 из 40

Избирательное сообщение результатов влияет на то значение, которое мы придаем этому хронометражу гонок 1997 года. Если бы эти цифры не совпали, мы бы, возможно, отыскали какой-то необычный рисунок в теннисном счете матчей «US Open», или в бильярдном турнире этой недели, или в гольфе… Обо всем этом тоже непременно сообщили бы. Но никакое из неслучившихся совпадений не попадает на первые полосы газет. Если внести всего-навсего десяток главных спортивных событий в список этих неслучившихся совпадений, тогда шансы 1/10 000 вырастут вдесятеро – до 1/1000. С чем сравнить эту величину? Такова же вероятность того, что при подбрасывании монетки у вас десять раз подряд выпадет орел.

Вернемся к летчикам израильской боевой авиации. Что здесь действует – только ли случай? Или вдобавок что-то еще? Для ответа на вопрос традиционная статистика выстроила бы очевидное выборочное пространство (дети пилотов истребителей), оценила бы вероятность рождения мальчика и девочки и затем рассчитала бы вероятность появления на свет 84 % девочек в совершенно случайной выборке. Но этот анализ не обращает внимания на избирательное сообщение результатов. Почему вообще кто-то заинтересовался полом отпрысков израильских пилотов истребителей? Вероятно, потому что такое статистическое сгущение уже привлекло чье-то внимание. Если бы такое же явление наблюдалось при анализе роста детей израильских авиаконструкторов или музыкальных способностей жен израильских авиадиспетчеров, мозг, повсюду ищущий необычные сгущения, тут же обратился бы к этим неожиданным сведениям. Традиционный статистический подход молчаливо исключает из рассмотрения многие факторы, которые не дают сгущения. Иными словами, при этом игнорируется часть выборочного пространства.

Человеческий мозг отфильтровывает колоссальные объемы данных, отыскивая вещи, которые кажутся необычными, и лишь тогда посылает осознанный сигнал: мол, поглядите-ка! Чем шире вы раскидываете сеть, ища осмысленный узор, тем больше вероятность, что вы поймаете статистическое сгущение. Ничего страшного в этом нет. Но если вы хотите узнать, насколько значимо такое сгущение, нужно не учитывать данные, которые первоначально привлекли ваше внимание к этому сгущению. В комнате, где присутствует 20 человек, обычно найдется один (самый высокий), чей рост позволяет ему попасть в несколько процентов самых высоких людей в стране. Но нельзя потом вывести этого дылду из комнаты, заново измерить его рост и сделать глубокомысленный вывод: мол, как удивительно, что вы нашли человека с таким необычным ростом. Опомнитесь, вы ведь изначально выбрали его именно по такому параметру.

Точно такую же ошибку совершали в первых опытах по изучению экстрасенсорного восприятия. Экспериментаторы просили тысячи добровольцев угадать карту в специальной колоде из пяти символов. После нескольких недель отбора каждый, чьи способности оказывались выше среднего уровня, приглашался на второй круг опытов. Поначалу казалось, что эти «хорошие угадчики» обладают сверхъестественными способностями. Но с течением времени доля успешных предсказаний для каждого такого «экстрасенса» медленно скатывалась обратно к среднему значению, словно мистическая сила постепенно покидала их. Дело в том, что их первоначальные высокие показатели (те сгущения, по которым их и отобрали) рассматривались на общем фоне и включались в общие расчеты. Если бы эти удачные результаты исключили из второго набора опытов, показатели тут же упали бы примерно до средних величин для первого круга.

Такая же история с пилотами истребителей и с левыми-правыми яичниками. Любопытные цифры, которые привлекли внимание ученых именно к этим конкретным данным, вполне могли стать следствием избирательного сообщения результатов – или, что почти одно и то же, избирательного восприятия. А если так, можно сделать простое предсказание: «В дальнейшем цифры вернутся к равному распределению – пятьдесят на пятьдесят». Если прогноз не сбудется и новые данные подтвердят дисбаланс, отраженный в статистическом сгущении, тогда эти новые данные можно будет счесть имеющими какое-то значение. Но я готов поручиться, что предсказание окажется верным.

Та же погрешность таится в традиционных экспериментальных исследованиях – скажем, направленных на то, чтобы выяснить, вызывают ли рак определенные продукты. Для экономии времени обычно рассматривают много пищевых компонентов сразу: клетчатку, жиры, красное мясо, овощи и т. п. – и определяют, как все они соотносятся с заболеваемостью раком. Пока вроде бы все выглядит нормально. Но потом вы решаете выбрать самую впечатляющую позицию – компонент, который необычно тесно коррелирует с заболеваемостью раком. Если вы проявите неосторожность, то мигом позабудете обо всех прочих факторах и опубликуете статью, утверждающую, что употребление в пищу красного мяса существенно увеличивает вероятность онкологических заболеваний. На самом деле вы просто выбрали среди сотен разных продуктов один, который показался вам наиболее значимым. Разумеется, какой-то один непременно должен был таким показаться. По чисто статистическим причинам следовало бы удивиться, если бы такого продукта не нашлось, даже если все продукты отбирались случайным методом.

Мнимое падение содержания сперматозоидов в семенной жидкости может служить еще одним примером избирательного сообщения результатов. Группа Нильса Скаккебака из Копенгагенского университета опубликовала первые (впоследствии многими признанные) данные в пользу такого падения в 1997 году. Но винить в избирательном сообщении результатов следует не этих исследователей. Повинны в этом ученые, у которых имелись данные в пользу противоположного вывода и которые не опубликовали их, считая, что они, должно быть, неверны. Повинны в этом и редакции журналов, чаще принимавшие статьи, где подтверждалось падение, нежели те работы, где это падение не подтверждалось. Повинна в этом и пресса, лихо свалившая в одну кучу разные связанные с половой сферой дефекты в разных частях царства животных и слепившая из этого одну единую историю, не отдавая себе отчета в том, что каждый отдельный случай имеет прекрасно обоснованное объяснение, не имеющее ничего общего с падением содержания сперматозоидов, а зачастую и с сексом. К примеру, половые аномалии у рыб, живущих близ предприятий по очистке сточных вод, по всей видимости, вызваны избытком нитритов (все рыбоводы знают, что эти вещества вызывают самые разные отклонения у рыб), а не эстрогеноподобными веществами в воде, которые придали бы больше пикантности истории с падением доли сперматозоидов.

Главное здесь вот в чем. При оценке статистической значимости нужно формировать выборочное пространство согласно тому, как вы действительно проводили эксперимент, а не опираться на его отредактированную версию, полученную с применением избирательного сообщения результатов. Надежнее всего не учитывать данные, которые привели к этому результату, привлекшему ваше внимание, и повторить эксперимент, чтобы получить новые данные. Но даже тогда вы не должны позволять совпадению (статистическому сгущению) определять выборочное пространство за вас. Поддавшись такому искушению, вы невольно проигнорируете окружающее пространство почти-совпадений.

Мы решили проверить эту теорию во время нашей недавней поездки в Швецию. Еще в самолете Джек предсказал, что в стокгольмском аэропорту, где нам предстоит приземлиться, нас ждет некое совпадение. Он выдал и причину: избирательное сообщение результатов. По его словам, вглядываясь достаточно пристально, мы наверняка что-нибудь такое найдем. Мы прилетели, добрались до автобусной остановки близ терминала, но никаких совпадений за это время не произошло. Но мы никак не могли отыскать нужный автобус, и Джек вернулся к справочной стойке. Пока он ждал своей очереди, за ним встал какой-то человек. Этим человеком оказался Стефано, математик, который работает по соседству с Джеком в британском Уорикском университете, буквально в соседней комнате.

Итак, предсказание подтвердилось. Однако на самом деле мы хотели заполучить почти-совпадение – такое, которое на самом деле не произошло, но о котором могли бы рассказать благодаря избирательному восприятию. К примеру, если бы еще кто-то из наших знакомых появился бы в то же самое время, но в другой день или в другом аэропорту, мы этого никогда бы не заметили. Швеция вообще могла бы кишеть нашими знакомыми, и для нас было бы практически невозможно избежать встречи с ними практически в любой конкретный момент. Почти-совпадения по определению трудно наблюдать. Но мы, так уж случилось, упомянули об этом в разговоре с Тедом, другом Йена, который приехал к нему в гости вскоре после того, как мы вернулись обратно в Англию. «Стокгольм? – переспросил Тед. – Когда?» Мы сказали. «Какой отель?» – «„Ярл Биргер“», – ответили мы. – «Вот так штука! Я останавливался в „Ярле Биргере“, только на день позже!» Значит, если бы мы прилетели на следующий день, мы не встретили бы Стефано, зато встретили бы Теда. Согласно законам селективного сообщения результатов, мы рассказали бы друзьям лишь о той встрече, которая произошла на самом деле.

Теория вероятностей позволяет оценить, какова возможность того, что некое событие произойдет, а другие (которые могли бы произойти) по тем или иным причинам не будут иметь места. Иными словами, вероятность одного события здесь сравнивается с вероятностью других. На уровне интуиции мы плохо воспринимаем вероятности, поскольку система детектирования свойств и явлений в нашем мозгу замечает лишь то, что происходит. В окружающем нас мире каждое событие уникально. Каждая встреча, каждая доля сперматозоидов, каждый расклад в бридже. «Как, у тебя часть телефонного номера похожа на номер твоей машины? Ну и ну!» Однако если вспомнить, что у обычного гражданина несколько десятков важных для него номеров и чисел (цифры в адресе, почтовый индекс, ПИН-коды, номер мобильного, номера кредитных карточек…), случайное сходство между двумя из них – вещь совершенно обыденная, и ничего примечательного в ней нет.