Гладиаторы, пираты и игры на доверии. Как нами правят теория игр, стратегия и вероятности — страница 21 из 26

И если даже в процентных отношениях мы уже начинаем блуждать, просто представьте, что происходит, когда мы переходим в мир вероятностей (как правило, грядущих событий).

Вероятность, Библия, 9/11 и отпечатки пальцев

Как-то раз один ученый показал мне ловкий трюк. 50-я буква в Книге Бытия на иврите – Т. Отсчитайте еще 50 букв – и вы окажетесь на букве О. Еще 50 букв – и мы на Р, а 200-я буква (еще плюс 50) – А. Произнесем все вместе… ТОРА! Слово на иврите, призванное обозначить Пятикнижие, или Учение! Случайное ли это совпадение? Или так было задумано? Когда-то в прошлом люди часто развлекались, прочесывая Библию на предмет самых разных интервалов, исполненных скрытого смысла, и на эту тему даже писали книги и статьи. Так правда ли Священное Писание содержит тайные послания наподобие этого? Если оставить в стороне богословские аспекты, то это прежде всего статистический вопрос, который мы можем задать и о других пространных книгах, таких как та же «Война и мир». Не содержатся ли в них интересные комбинации? Что же, скорее всего, они там есть. Множество любопытных распределений таят в себе и «Моби Дик», и «Анна Каренина», и много других больших-больших книг. (Просто представьте, сколько их можно найти в романе «В поисках утраченного времени», семитомном сочинении Марселя Пруста!)

После террористических атак 11 сентября 2001 г. жители Нью-Йорка были поражены совпадением случайных «фактов», возникших вокруг злодеяния. Например, номер рейса первого самолета, который врезался во Всемирный торговый центр, – 11! В сочетании «Нью-Йорк Сити» 11 букв, равно как и в английском написании слова «Афганистан» (Afghanistan), и в имени президента Буша (George W. Bush). Кроме того, 11 сентября – это 254-й день года. «И что?» – спросите вы. Как что? 2 + 5 + 4 = 11! Даже форма башен-близнецов напоминает число 11. Вот теперь и правда становится страшно!

Еще одна интересная проблема, косвенно с этим связанная, – раскрытие преступлений по отпечаткам пальцев. Я выступаю в защиту такого мнения: когда суды готовятся предъявить кому-либо обвинение, поскольку его отпечатки пальцев совпали с теми, что нашлись на месте преступления, сперва неплохо бы подумать о том, сколь густо населена округа. Насколько мне известно, совпадения по отпечаткам пальцев никогда не бывают идеальными: совпадает лишь определенное количество идентичных форм. (Возможно, вы помните, как сказал Бенджамин Франклин: уверенным быть можно в двух вещах – в налогах и в смерти. Об отпечатках пальцев он не упоминал.) Вероятность того, что совпадут неидентичные отпечатки, составляет 1:100 000 или 1:200 000, в зависимости от того, что за книгу вы держите в руках. Итак, если отпечатки найдены на месте преступления в поселке, где проживают двести человек, и у нас есть подозреваемый, чьи отпечатки совпадают с найденными на месте преступления, тогда шанс того, что мы нашли преступника, весьма высок: вряд ли мы найдем в этом городишке другого жителя с такими же пальчиками. Но, когда этот метод применяют к преступлению, совершенному, скажем, в Нью-Йорке или Токио, разумно предположить, что там мы можем найти гораздо больше людей со схожим паттерном отпечатков.

О средних величинах и медианах

Хотя средние величины часто упоминаются в самых разных повседневных контекстах, мне кажется, что «среднее» – это одна из самых запутанных проблем в мире статистики. Например, нам скажут, что средняя месячная зарплата в условном Хэппиленде – стране счастливой жизни – составляет $100 000. Что это значит? Я спросил нескольких умных людей, и оказалось, что многие понимают это так: примерно у 50 % жителей Хэппиленда доход превышает $100 000, а у другой половины он ниже этой отметки. Конечно же это ошибка. Величина, разделяющая население надвое, – это не среднее, а медиана. Что же до средней величины, о которой упоминалось выше, то очень вероятно, что в стране есть горстка избранных с баснословными доходами, гораздо выше уровня $100 000, а все остальные – большинство – зарабатывают меньше. Представим такую картинку: семеро работают в гипотетическом филиале банка. У шестерых обычные зарплаты, а у менеджера – $7 млн. Выходит, средняя зарплата по банку – более $1 млн. Да, как-то так – ведь даже если мы возьмем одну только зарплату менеджера и разделим ее на семь равных частей, у нас в каждой части будет по миллиону, значит, реальная средняя величина должна быть выше. В этом примере только один человек получает больше остальных, а все остальные получают меньше, и, как видно, доходы меньше средней зарплаты не у половины сотрудников, а у гораздо большего их числа. Известен тот факт, что в некоторых странах только у 30–40 % работников заработная плата больше средней.

Со средней величиной есть проблема: она очень чувствительна к крайним значениям. Если наш менеджер удвоит даже только свою зарплату – и никто другой при этом не получит ни гроша, – средняя зарплата равно так же практически удвоится. Впрочем, медиана (не забывайте, что медиана – это «срединная» величина в перечне чисел, выстроенном от самого малого к самому большому) создает противоположную проблему. Такое же повышение зарплаты менеджера не окажет на медиану никакого влияния: она совершенно нечувствительна к крайним значениям. И если мы хотим показать ситуацию в численно обоснованном виде, то должны представить и медиану, и среднюю величину, а также стандартное отклонение и форму распределения. Любопытно: когда данные о зарплате появляются в новостях, почти всегда сообщают о «средней зарплате» или о «средних расходах среднестатистической семьи» (надеюсь, теперь вы понимаете причину). Безусловно, редакторы новостей чувствуют, что им не следует углубляться в статистические сложности: это разве что заставит зрителей переключить канал. Но вы, мои любезные читатели, не должны делать никаких умозаключений на основе этих данных. Ясно, что статистик, стоя одной ногой в ледяной воде, а другой – в кипятке, блаженствует (в среднем).

Среднестатистический казначей

Как-то раз я слышал репортаж о министре финансов некоей страны, который, судя по его цитируемой фразе, надеялся, что наступит день, когда все рабочие в его стране начнут зарабатывать больше, чем в среднем по стране (иногда автором этой «мудрости» называют Билла Клинтона). Должен признать, это блестящая идея. Можем только пожелать этому казначею долгих лет жизни – она ему понадобится, если он намерен дождаться дня исполнения своей мечты. В ответ на этот рассказ один из читателей предположил, будто казначей не в курсе, что такое средняя величина, и любезно объяснил: «50 % работников зарабатывают больше среднего, а 50 % – меньше». Само собой, он тоже не особенно разбирался в статистике – и спутал среднюю величину с медианой.

Среднестатистические водители

В другой раз я читал статью, автор которой, журналист, в статистике вроде как должен был разбираться по долгу службы. Он утверждал, будто каждый считает, что водит «лучше среднего», и объяснял, что такая ситуация математически невозможна. Он был неправ. И объяснить почему – очень просто. Скажем, пусть четверо из пяти водителей за последний год попали в аварию по разу, а пятый – 16 раз. Выходит, в общем все пятеро водителей попадали в аварии 20 раз, и средняя величина аварий на каждого водителя – 4. Получается, четверо из пяти (то есть 80 %) водят лучше среднего! В следующий раз, когда прочтете, что все считают себя водителями лучше среднего, не отвергайте это утверждение так быстро. Кто знает? Возможно, они правы – по крайней мере, статистически.

Говори за себя

Один из самых странных и самых интересных фактов о статистике заключается в том, что многие люди, никогда ее не изучавшие, верят в то, что они ее понимают (покажите мне человека, который никогда не изучал дифференциальные уравнения в частных производных или функциональный анализ – и тем не менее уверяет, будто знает эти дисциплины). Люди часто бросают в разговоре реплики вроде: «Числа говорят сами за себя». Это глупо. Я никогда не слышал, чтобы число 7 говорило за себя или вело задушевные беседы с числом 3. А вы?

Увлекательное чтиво

В этом контексте я хотел бы упомянуть две из моих любимых книг. Первая – «Математик за газетой»[23], в которой Джон Аллен Паулос объясняет, почему он (математик) читает новостные сводки совершенно иначе, нежели среднестатистический (медианный) человек. Вторая – чудесная книга Даррела Хафа «Как лгать при помощи статистики» [24]. Я часто обращаюсь к ней, когда начинаю проводить уроки по статистике: она помогает студентам не так сильно ненавидеть предмет.

11. Вопреки всему

В этой главе мы выясним, что именно подразумеваем, говоря о шансах, побросаем монетки и кубики, обсудим значение вероятности на операционных столах, поможем врачам не ставить неверные диагнозы и попытаемся пройти проверку на детекторе лжи – так, чтобы наша ложь осталась незаметной.

Обратная сторона монеты

На первый взгляд кажется, что концепция «шансов», или «вероятностей», довольно проста. Мы и впрямь довольно часто говорим что-нибудь вроде: «Завтра, вероятно, будет снег», «Шанс на то, что я займусь спортом в ближайшие 45 лет, весьма невелик», «Вероятность выкинуть шестерку при броске кубика – один к шести», «Вероятность того, что будущим летом начнется война, только что удвоилась» или «После такого он, наверное, никогда не восстановится». И все же стоит только приступить к изучению концепции – и все оказывается намного более запутанным и сложным.

Начнем с простейшего примера: подбрасывания монеты. На вопрос о том, какова вероятность выпадения орла при броске монеты, любой, само собой, ответит, что орлы выпадут примерно в половине бросков. Возможно, это правильный ответ, но путаница возникает сразу же после того, как мы спросим: «Почему вы сказали “половина”? На каком знании основан этот ответ?»