Форма реальности. Скрытая геометрия стратегии, информации, общества, биологии и всего остального — страница 14 из 82

Мы уже видели, что расстояние от дома до комара через 200 дней (которое численно равно разности между количеством демократов и республиканцев в нашем опросе) в среднем составляет примерно 11 километров. Поэтому вовсе не странно было бы обнаружить в нашем опросе 106 республиканцев и 94 демократа. Другое дело, если бы выявилось соотношение 120 на 80, далекое от политической реальности. Это все равно что зачерпнуть в тарелке Висконсина, а получить ложку Миссури. Если республиканцев на 40 больше, чем демократов, то это эквивалентно тому, что комар блуждает в 40 километрах от дома, а мы уже видели, что вероятность такого сценария всего 3 из 1000.

Иными словами, маловероятно, что двести участников опроса будут существенно отличаться от висконсинцев в целом. Ложка супа имеет тот же вкус, что и вся тарелка. С 95-процентной вероятностью доля республиканцев в этой выборке будет заключена между 43 % и 57 %, а потому о таком опросе будет сказано, что он имеет погрешность ±7 %. Но это при условии, что в выборе респондентов не было никакого скрытого перекоса. Росс очень хорошо понимал, что подобное смещение может испортить его комариную модель: перед вычислениями и составлением диаграмм он оговаривает, что его ландшафт настолько однороден, «что все его точки равно привлекательны для них [комаров] в отношении питания и что нет ничего такого, например ветра или локальных врагов, что могло бы заставлять их попадать в какие-то определенные районы местности».

Росс настаивает на этом предположении по действительно веской причине: без него все летит к чертям. Допустим, что есть ветер. Поскольку комары очень малы, то даже легкий ветерок может сбить их с курса. Если ветер дует в северном направлении, то, возможно, вероятность того, что комар полетит на северо-восток, составит не 50 %, а 53 %. Точно так же в нашем опросе может оказаться незамеченное смещение, когда респондент окажется республиканцем с вероятностью не 50 %, а 53 %. Скажем, республиканцы охотнее соглашаются отвечать на вопросы, чем демократы, или чаще берут трубку, или чаще имеют телефон. Это значительно увеличивает шансы на то, что наш опрос даст описание электората, отличающееся от истины. При непредвзятом опросе вероятность обнаружить 120 республиканцев и 80 демократов будет всего 3 из 1000. При «республиканском ветре» она подскакивает до 2,7 %, то есть увеличивается почти вдесятеро.

В реальной жизни мы никогда не узнаем, насколько объективен опрос. Поэтому нам, пожалуй, следует довольно скептически относиться к заявленной погрешности. Если легкий ветерок систематического смещения регулярно подталкивает опрос в ту или иную сторону, то можно ожидать, что реальные результаты выборов будут гораздо сильнее выходить за пределы заявленных погрешностей, чем утверждается. И знаете что? Именно так и происходит. В одной статье 2018 года говорится[113], что реальные результаты выборов в среднем отличаются от результатов опросов примерно вдвое больше, чем можно было предположить исходя из заявленных погрешностей. Ветреные выборы!

Есть еще один способ подумать о воздействии неизвестного ветра. Это означает, что перемещения комара в разные дни не независимы, а коррелируют друг с другом. Если сегодня комар полетел на северо-восток, это слегка повышает вероятность, что ветер дует в том же направлении, поэтому более вероятно, что и завтра насекомое полетит туда же. Этот эффект слаб, но имеет тенденцию накапливаться.

Существует популярное заблуждение, которое называют «закон средних чисел»: если монета несколько раз подряд выпала орлом, то в следующем подбрасывании шансы на выпадение решки повышаются, чтобы все было «уравновешено в среднем». Мудрый человек скажет, что это неправда, потому что броски монеты не зависят друг от друга: вероятность орла в каждом последующем подбрасывании равна 50 % вне зависимости от того, что выпадало ранее.

Но на деле все еще хуже! Если у вас нет абсолютной уверенности в честности монеты, получается какой-то «закон антисредних». Если вы получили сто орлов подряд, то можете просто удивляться необычной полосе везения или разумно предположить, что вероятность выпадения орла на вашей монете не 50 %, а больше (возможно, на монете два орла). Чем больше орлов подряд выпадет, тем логичнее ожидать орла и далее[114].

Это приводит нас к Дональду Трампу. Перед президентскими выборами 2016 года все соглашались, что Хиллари Клинтон опережает соперника, но активно спорили, каковы именно шансы Трампа. Журнал Vox 3 ноября писал:

Еще на прошлой неделе[115] прогноз Нейта Сильвера, основанный исключительно на результатах опросов, давал Хиллари Клинтон ошеломительную вероятность победы – 85 процентов. Однако на утро четверга ее шансы упали до 66,9 процента – это значит, что, несмотря на то что Дональд Трамп все еще остается аутсайдером, есть один шанс из трех, что он станет следующим президентом.

Либералы пытались утешить себя, что FiveThirtyEight[116] – это исключение среди шести крупных прогнозистов, а остальные пять дают Трампу шансы на победу от 16 до менее 1 процента.

Сэм Ван в Принстоне оценивал шансы Трампа в 7 % и был так уверен в победе Клинтон, что обещал съесть какое-нибудь насекомое, если она проиграет. Через неделю после выборов он проглотил сверчка в прямом эфире CNN. Математики[117] иногда ошибаются, но мы держим слово.

Каким образом Ван так ошибся? Все прогнозисты соглашались, что результаты выборов будут зависеть от небольшого количества колеблющихся штатов, включая Флориду, Пенсильванию, Мичиган, Северную Каролину и, конечно же, Висконсин. Казалось, что Трампу для победы нужно выиграть в большинстве этих штатов, однако было похоже, что в каждом из них лидировала Клинтон. По оценкам Сильвера, шансы Трампа составляли:

Флорида 45 %,

Северная Каролина 45 %,

Пенсильвания 23 %,

Мичиган 21 %,

Висконсин 17 %.

Трамп мог выиграть во всех этих штатах, но такая вероятность казалась небольшой, равно как и вероятность, что комар пять раз подряд переместится в одном направлении. Вы можете оценить ее, как, скорее всего, и будущий поедатель сверчка Сэм Ван. Она равна:

0,45 × 0,45 × 0,23 × 0,21 × 0,17,

то есть примерно 1/600. Как показывают аналогичные вычисления, шансы Трампа на победу даже в трех или четырех из этих штатов довольно малы.

Однако Нейт Сильвер взглянул на вещи под другим углом. Его модель учла возможную корреляцию между разными штатами, основанную на неоспоримом факте, что исследователи общественного мнения могли неосознанно смещать выборку в пользу того или иного кандидата. Да, по нашей лучшей оценке, Трамп отставал во Флориде, в Северной Каролине и во всех остальных колеблющихся штатах. Но если он выиграет в одном из этих штатов, то это будет доказательством, что из-за какой-то ошибки в опросах положение Клинтон выглядит лучше, чем на самом деле, а потому победа Трампа в других штатах становится более вероятной. Так же как в вышеприведенном примере с «законом антисредних», победа Трампа во всех колеблющихся штатах становится вероятнее, чем можно было бы ожидать по цифрам в отдельных штатах. Вот почему Сильвер дал Трампу серьезные шансы на победу на выборах. И по этой же причине оценил шансы на победу Клинтон с двузначным отрывом (то есть с разницей больше чем 10 %) как 1 к 4, в то время как Ван тоже считал это крайне маловероятным[118].

Журналисты, ошарашенные результатами выборов, начали публиковать статьи под слезливыми заголовками вроде «Можем ли мы после 2016 года снова доверять опросам?»[119].

Да. Можем. Опросы по-прежнему намного лучше отражают оценку общественного мнения, чем рейтинг абстрактного президентского правления от какого-нибудь эксперта или остроты на дебатах. По оценкам Сильвера, борьба была очень упорной и выиграть мог любой кандидат. Он оказался прав! Если вы считаете, что это сомнительная отговорка, то спросите себя: разве лучше, чтобы математика предоставила вам способ притвориться, что вы почти наверняка знаете победителя, хотя на самом деле ни вы, ни кто-либо иной его не знает?

ПИСЬМО В NATURE

Рональд Росс полностью изучил поведение комара, привязанного к направлению с юго-запада на северо-восток. Однако более реалистичная ситуация, когда насекомые могут летать в произвольном направлении, выходила за рамки его математических познаний, поэтому летом того же 1904 года он обратился к Карлу Пирсону.

Это была вполне естественная кандидатура для консультаций, если у вас имелась какая-то идея, не вписывавшаяся в академические рамки. Пирсон был хорошо зарекомендовавшим себя профессором прикладной математики в Университетском колледже Лондона; он получил эту должность, когда ему не было и тридцати. Однако перед этим он изучал право и немецкую литературу в Гейдельберге и Берлине, и сначала ему предложили профессуру по германистике в Королевском колледже Кембриджа. Он любил Германию, которая по сравнению с Англией казалась раем бурной интеллектуальной жизни, не обремененной общественными условностями в целом и религией в частности. Будучи поклонником Гете, Пирсон написал романтический роман «Новый Вертер» под псевдонимом Локи. Гейдельбергский университет написал в каком-то документе его имя на немецкий манер – Karl вместо Carl, и он всю жизнь предпочитал именно этот вариант. Впечатленный тем, что в немецком языке есть гендерно-нейтральное слово Geschwister, означающее «брат или сестра», он изобрел аналогичное слово sibling[120].

Вернувшись в Англию, Пирсон выступал за нерелигиозный рационализм и освобождение женщин, а также читал скандальные лекции на такие темы, как «Социализм и секс». Газета Glasgow Herald так писала об одном из его выступлений: «Мистер Пирсон национализировал