Десять уравнений, которые правят миром. И как их можете использовать вы — страница 8 из 49

единственно верное действие.

И вот почему. Теорема Байеса – связь, которую нам нужно установить между моделью и данными. Она позволяет нам проверить, насколько хорошо наши картинки соотносятся с реальностью. В примере, который мы разбирали в начале главы, мы рассматривали вероятность P{катастрофа|тряска} того, что самолет разобьется, при условии, что он попал в болтанку. Эми желает знать P{стерва|грубость}, и логика здесь та же.

Катастрофа и стерва – модели в наших головах. Это наши представления о мире, которые принимают форму мыслей или (в моем случае) фильмов. Тряска и грубость – данные, которые есть в нашем распоряжении. Это нечто осязаемое, то, что происходит, что мы можем ощущать. Значительная часть прикладной математики включает сопоставление моделей с данными, столкновение наших мечтаний с суровой реальностью.

Будем использовать букву M для модели и Д для данных. Мы хотим знать сейчас вероятность того, что модель верна (Рэйчел – стерва), при условии истинности данных (грубый комментарий в туалете). Имеем:



Чтобы понять уравнение (формулу Байеса), лучше всего рассмотреть по отдельности компоненты правой части.

Числитель (часть над дробной чертой) – произведение двух вероятностей, P{М} и P{Д|М}. Множитель P{М} – вероятность того, что модель истинна, до того, как произошло некое событие (статистическая вероятность крушения самолета или оценка Эми, что встреченный ею человек стервозен; в последнем случае – 1/20). Эту величину Эми знала прежде, чем отправилась в туалет. Второй множитель, P{Д|М}, касается того, что произошло в санузле. Это вероятность, что Рэйчел оскорбит Эми, если она в самом деле стерва, или – в общем случае – того, что мы наблюдаем некоторые конкретные данные, если наша модель верна. Трудно оценить это число количественно, поэтому будем считать его эквивалентом броска монетки: P{Д|М} = 0,5. Рэйчел не каждый раз при посещении туалета злословит о сокурсницах. Минимум 50 % времени стервы тратят на разговоры о чем-то еще.

Мы перемножаем вероятности, чтобы найти вероятность того, что произошли одновременно оба события. Например, если я бросаю две игральные кости и хочу найти вероятность выпадения двух шестерок, то я определяю вероятность 1/6 для выпадения шестерки на первой кости, вероятность 1/6 для шестерки на второй, а затем перемножаю их и получаю вероятность выпадения шестерок на обеих костях: 1/6 ∙ 1/6 = 1/36. Тот же принцип применяется и здесь: числитель – вероятность того, что Рэйчел стерва и она отпустила стервозный комментарий при посещении туалета.

Итак, числитель описывает Рэйчел как стерву, но мы должны также рассмотреть альтернативную модель, в которой она хороший человек. Это делается в знаменателе дроби справа. Рэйчел может быть стервой, сделавшей стервозный комментарий (M), или хорошим человеком, допустившим ошибку (M–). Черта над буквой означает противоположность или дополнение. В нашем случае дополнение к «быть стервой» – «быть не стервой», «быть хорошим человеком». Обратите внимание, что первое слагаемое в знаменателе совпадает с числителем, P{Д|М} ∙ P{M}. Второе, P{Д|M–} ∙ P{M–}, – вероятность того, что Рэйчел сделала свое грязное замечание при условии, что она не стерва, умноженная на вероятность того, что она хороший человек. Мы охватили все возможные объяснения тех данных, что получила Эми, сидя в кабинке туалета. Теперь можно найти P{M|Д} – вероятность модели при условии этих данных.

Если Рэйчел не стерва, то она хороший человек, поэтому P{M–}=1–P{M}=0,95. Теперь нужно определить вероятность, что хороший человек совершает ошибку и говорит гадость. Возможно, у милой Рэйчел был неудачный день – у всех такое случается. Предположим, что один раз из десяти у хороших людей бывает плохой день и они говорят то, о чем потом жалеют. Иными словами, пусть P{Д|M–}=0,1 (см. рис. 2).


Рис. 2. Иллюстрация теоремы Байеса


Осталось только произвести подсчет – точно так же, как с крушением самолета, но с другими числами:



Вероятность того, что Рэйчел – стерва, примерно 1/5. Именно поэтому Эми стоит простить ее. С вероятностью 4/5 она хороший человек. Было бы нечестно судить девушку только по одному действию. Эми не следует упоминать, что она слышала Рэйчел, или допустить, чтобы эти слова влияли на их общение. Лучше ждать и смотреть, что произойдет завтра. С вероятностью 80 % к концу года они будут вместе смеяться над этим случаем в туалете.

И еще один совет Эми, съежившейся за дверью туалета. Возможно, в то утро она не работала с максимальной отдачей. Может, в следующий раз ей нужно лучше стараться и уж точно не стоит сидеть в уборной и развлекаться с телефоном. Но помните, что Байес прощает прегрешения. Эми должна применять ту же формулу и к себе. Теорема Байеса предлагает ей медленно корректировать свое мнение о себе и не особо огорчаться из-за конкретных событий.

Вы продукт всех своих действий, а не результат одной или нескольких ошибок. Применяйте к себе то же рациональное прощение, которое Байес просит вас применять к другим.

* * *

Первый урок, который нужно извлечь из формулы Байеса (уравнения суждений), – не надо торопиться с выводами. Числа, которые я использовал в примере, влияют на результат, но не на саму логику. Вы можете спросить себя: какая доля людей, по-вашему, в целом хорошие? Как часто хорошие люди совершают ошибки? И как часто стервы поступают по-свински? Подставьте свои цифры в уравнение, и вы придете к тому же заключению: нужно больше, чем один грязный комментарий, чтобы поставить на человеке клеймо «стерва» или «сволочь».

Иногда мой руководитель ведет себя как козел. Иногда моим студентам как будто не хватает сосредоточенности. Порой кто-то из коллег хочет приписать себе мою идею, заявляя, что придумал это первым. Иногда председатель комиссии, где я состою, кажется мне неорганизованным: он тратит мое время на бесполезный неэффективный обмен электронными письмами. В таких ситуациях я использую уравнение суждений. Но я не вычисляю вероятность того, что каждый из моих коллег – скотина, рассеянный или некомпетентный. И не позволяю разовым событиям определять свои ощущения. Если я вижу, что некто, с кем я работаю, совершил ошибку, я жду развития ситуации. Вполне может оказаться, что неправ был я.

* * *

Мы не можем понять «Десятку» без раскрытия ее истории и философии. История «Десятки» – рассказ о небольшой группе людей, которые передавали секреты рационального мышления из поколения в поколение. Они ставили масштабные вопросы. Они хотели знать, как мыслить яснее и точнее, уметь оценивать истинность того, что говорят люди. Они даже задавались вопросом, что значит быть истинным или ложным. Это история о действительно важных вопросах: природе реальности и месте этих людей в ней.

Это также рассказ о религии, о том, что такое хорошо и что такое плохо, об этике, о добре и зле.

Наша первая остановка – 1761 год. Валлийский философ Ричард Прайс обнаружил в бумагах недавно умершего друга (того самого Томаса Байеса) эссе, полное математических символов и философских размышлений, и один вопрос звучал так: как на основе данных о предыдущих событиях оценить вероятность того, что подобное произойдет снова? Прайс опубликовал его со своим приложением, где просил читателя представить «человека, только что появившегося в этом мире, который заключает из своих наблюдений за порядком и ходом событий, какие силы и причины в нем действуют». Спрашивается, как такой человек должен рассуждать, увидев восход в первый раз, во второй и в третий. Что он должен сказать о вероятности того, что солнце встает каждый день?

Вывод примечателен. Ежедневный восход солнца не должен привести нашего «только появившегося» человека к выводу, будто солнце будет вставать всегда. Наоборот, его умоляют быть очень осторожным с этим событием – даже после сотни восходов и целой жизни восходов. Ничто не должно быть само собой разумеющимся.

«Только появившемуся» человеку предлагалось дать оценку вероятности ежедневного наступления восхода с помощью некоторого параметра θ. Перед первым восходом человек не имеет никаких априорных представлений о солнце и должен считать все значения параметра θ равновозможными. В этот момент одинаково вероятно, что солнце поднимается каждый день (θ = 1), встает в половине дней (θ = 0,5) или только один раз из ста (θ = 0,01). Величина θ может принимать бесконечное число значений из интервала от 0 до 1 (все вероятности находятся в этом промежутке). Например, она может оказаться 0,8567, 0,1234792, 0,99999 и т. д. При этом число десятичных знаков любое, точность произвольна.

Далее человеку предлагается определить, какое значение тот сочтет минимальной правдоподобной вероятностью того, что солнце восходит ежедневно. Если человек думает, что шансы на восход превышают 50 %, то θ > 0,5. Если он считает, что они превысят 90 %, то θ > 0,9.

Теперь представим, что человек увидел 100 восходов подряд и пытается сделать из этого вывод о вероятности восхода в один день: он заявляет, что солнце поднимается чаще 99 раз из 100. Иными словами, он дает оценку θ > 0,99. Выражение P{θ > 0,99|100 восходов} определяет вероятность того, что он прав в своей оценке. Байес показал с помощью определенной разновидности уравнения 2, что P{θ > 0,99|100 восходов} = 1–0,99100+1 ≈ 63,8 %. Соответственно, с вероятностью 36,2 % наш человек ошибается и солнце встает реже, чем он полагает[26].

Если человек прожил 60 лет и видел восход солнца каждый день, он мог бы определенно быть уверен, что вероятность восхода солнца каждый день превышает 99 %. Но если он желает быть уверенным, что вероятность восхода солнца превосходит 99,99 %, мы бы посоветовали проявлять осторожность: 1–0,9999365×60+1 ≈ 88,8 %. Так что остается еще 11,2 %, что он ошибается. Мы заставляем новоприбывшего обитателя мира определить свою модель, высказать минимальное возможное значение θ, а затем сообщаем ему вероятность, с которой он прав в своем предположении.