же Лаплас определил различие между шансом и вероятностью. В его детерминистской философской концепции шанс по своей природе не имеет отношений к реальности. Учитывая, что все события имеют свои причины, шанс — это лишь выражение нашего незнания о причинах события. Вероятность — более подходящий способ описания нашего незнания причин, определяющих события.
В основе теории вероятностей — только здравый смысл, сведенный до исчисления; эта теория позволяет нам оценить с точностью то, что острые умы чувствуют своим инстинктом, находящимся вне времени и неспособным считать.
Пьер-Симон де Лаплас
Лаплас не ограничился анализом вероятностей, а также взял на себя труд доказать их пользу для статистики и демографии. В своей работе он анализировал вероятности того, какого пола родится ребенок. Лаплас опирался на данные приходских книг для определения априорных вероятностей, необходимых, чтобы применить теорему Байеса. Ученый сделал вывод, что вероятность рождения мальчика немного выше вероятности рождения девочки. По его мнению, можно предугадать, что рождаемость мальчиков в Париже немного превзойдет рождаемость девочек в течение следующих 179 лет. И все это благодаря статистике!
Несмотря на поддержку Кондорсе, применение теории вероятностей в других областях встречало сопротивление: так, сам наставник Лапласа, д’Аламбер, неоднократно выражал сомнения относительно пользы расчета вероятностей. Однако несмотря ни на что Лаплас пошел дальше своих предшественников и не прекратил настаивать на необходимости такого типа выводов для наблюдений и экспериментальных наук, которые идут от следствий к причинам. В этих науках часто известны результаты, а не причины. Байесовское приближение, применяемое к статистическому выводу, стало на рубеже XIX и XX веков одним из инструментов, представленных статистиками Карлом Пирсом (1857-1936), Рональдом Эйльмером Фишером (1890-1962), Эгоном Пирсом (1895-1980, сын Карла) и Ежи Нейманом (1894-1981). Эти четверо математиков, увлеченные генетикой, евгеникой и биологией, критиковали Байеса и разработали современные статистические методы. И все же именно благодаря Лапласу статистика перестала быть описательной наукой и превратилась в дисциплину индуктивную и моделирующую будущее. Так в ряду математических дисциплин зажглась новая звезда.
Д’Аламбер написал для Энциклопедии статью о вероятностях, хотя, в отличие от Кондорсе и Лапласа, он был критически настроен к этому понятию. В статье д’Аламбер допустил ошибку, рассчитав вероятность выпадения орла и решки путем подбрасывания двух монет. Он утверждал, что вероятность равна 1/3, то есть существует только один благоприятный результат (одна монетка ложится орлом, а вторая — решкой) из трех возможных (два орла, две решки, орел и решка). Он не учитывал возможность получения орла и решки двумя разными способами: орел и решка и решка и орел. Таким образом, реальная вероятность — 2/4, или два благоприятных исхода из четырех возможных. Лаплас не упустил возможности указать своему наставнику на ошибку!
Теория вероятностей, предложенная Лапласом, опирается на знаменитое правило Лапласа, определяющее вероятность какого-либо события. Оно сформулировано в научном исследовании, датируемом 1774 годом. Бернулли и Муавр в своих работах ранее предложили более или менее похожие определения.
Вероятность (какого-либо события) — это количество благоприятных исходов, разделенное на количество возможных исходов.
Правило Лапласа
Так, вероятность события выражается цифрой от 0 до 1.
Когда вероятность равна 1, это означает, что событие произойдет обязательно. Когда вероятность равна 0, мы говорим о невозможном событии. Приведем пример: если одна урна содержит 7 шаров, из которых 5 белых и 2 черных, вероятность вытащить черный шар, по знаменитому правилу, равна 2/7 (~ 29%); у нас есть 2 черных шара (2 благоприятных исхода) на 7 шаров, лежащих в урне.
Правило Лапласа предполагает, что все исходы, благоприятные или возможные, имеют одинаковую вероятность.
В ситуациях, когда один исход имеет большую или меньшую вероятность, чем другие, возможно определить вероятность события, применяя правило сумм, также сформулированное Лапласом: если событие может произойти двумя различными способами (или больше, чем двумя), несовместимыми один с другим, то вероятность — это сумма вероятностей всех благоприятных исходов. Например, вероятность вытащить туз или короля в колоде из 32 карт — это сумма вероятности вытащить туз (которая равна 4/32, так как в колоде 4 туза) и вероятности вытащить короля (также 4/32): 4/32 + 4/32 = 8/32 (=25 %).
Однако событие, вероятность которого мы хотим рассчитать, иногда может быть составным. В этом случае необходимо применить не правило Лапласа, а правило произведения, которое мы также находим у Лапласа: если для появления события А нужно, чтобы в одно и то же время произошли два других события, В и С, то вероятность события А равна произведению вероятности события В, умноженной на вероятность события С, при условии, что событие В уже произошло. Это формулу мы знаем сегодня как формулу условных вероятностей. Например, вероятность, что выпадет 6, если мы бросаем одну кость, равна 1 /6. Какова вероятность получить сразу две 6? На основании правила умножения необходимо умножить вероятность выпадения первой 6(1 /6) на вероятность выпадения второй 6 (также 1/6, поскольку эти два события не зависят друг от друга): 1/6 х 1/6 = (1/6)² = 1/36 (-2,8%).
Шевалье де Мере описывает следующую ситуацию: игроки А и В играют друг против друга, и каждый ставит 32 золотые монеты, то есть всего 64 монеты, которые заберет первый игрок, выигравший три партии. Однако они вынуждены прервать игру. Как следует разделить выигрыш, если один из них победил в двух партиях, а второй — только в одной? Ошибочное решение для этой задачи нашел Лука Пачоли в XV веке. Он предложил игрокам разделить деньги исходя из количества побед: так как они сыграли три партии и игрок А выиграл две из них, а игрок В — только одну, А должен забрать 2/3 денег, а В — 1/3. Однако Кардано доказал, что это неверное решение, потому что оно не учитывает количество партий, которое каждый игрок должен был выиграть, чтобы забрать весь банк.
Решение нашли Паскаль и Ферма — каждый своим способом. «Я вижу, — писал первый второму, — что истина одна и та же в Тулузе и Париже».
Предположим, что А и В в одинаковой степени ловки в игре (в каждой партии вероятность, что один выиграет у другого, равна 1/2); вероятность, что А выиграет третью партию у В, — 3/4, так как есть два возможных исхода: либо он выиграет с первой попытки (с вероятностью 1/2, финальный счет тогда 3:1), либо со второй (вероятность 1/2 х 1/2 = 1/4, финальный счет 3:2). Сумма вероятностей этих двух исходов — 3/4. Напротив, вероятность того, что В выиграет, — лишь 1/4, поскольку ему для этого необходимо выиграть два раза подряд (1/2 х 1/2 = 1/4). Таким образом, следует разделить монеты следующим образом: 3/4 для А (48 монет) и 1/4 — для В (16 монет). Впоследствии Лаплас обобщает эту задачу исходя из гипотезы, что два игрока играют по-разному.
Схема различных возможностей завершить игру.
Первая публикация этого позднего труда — Лапласу было уже 62 года — состоялась в 1782 году. Работа была посвящена Наполеону. Автор подчеркивал, что расчет вероятностей применялся «к самым важным жизненным вопросам, которые по большей части являются лишь задачами вероятности». Наполеон в ответ назвал теорию вероятностей «первой из наук». Лаплас в течение десятилетий полностью посвятил себя небесной механике, но потом он вновь взялся за свои прежние труды о вероятностях и отправил в издательство научный трактат на эту тему.
РИС.1
РИС. 2
Как гласило название, Лаплас стремился предложить аналитическую теорию вероятностей, то есть установить связь между анализом и расчетом вероятностей — двумя дисциплинами, тогда еще полностью разделенными.
Важен тот факт, что в своей книге Лаплас исследовал центральную предельную теорему, имеющую решающее значение для статистики и теории вероятностей. В своем труде от 1773 года он изучал увлекательный вопрос, связанный с определением реального положения звезды на основании серии наблюдений. Здесь недостаточно применить арифметический метод, ведь необходимо доказать, что выбранное значение минимизирует погрешность, то есть разницу между реальным и наблюдаемым явлениями. Лаплас интерпретировал эту проблему, рассматривая фактическое положение звезды в качестве причины наблюдаемых положений, и предположил, что погрешности зависят от случая. Искусно используя теорему Байеса, ученый пришел к выводу, что возможно начертить кривую, которая представляла бы распределение погрешностей вокруг истинного значения. Кривая является симметричной и нисходящей, исходит из центрального значения; чем больше мы удаляемся от этой точки, тем больше вероятность, что мы допускаем погрешность измерения. Чем ближе мы к вершине кривой, тем больше вероятность того, что мы ближе к фактическому значению. Решая дифференциальное уравнение, Лаплас сделал вывод, что кривая распределения погрешностей (рисунок 1, страница 136) выражается экспоненциальной функцией:
φ(x) = (e-|x|)/2.
Лаплас не первый определил нормальное распределение, равно как и экспоненциальную функцию (хотя и выраженную с помощью другой формулы). Она была введена Муавром в начале XVIII века. Обычная кривая распределения погрешностей связана с методом наименьших квадратов (рисунок 2, страница 136), цель которого — представление полученных данных в виде кривой, а также минимизация погрешностей метода. Лежандр представил этот метод в 1805 году в труде «Новые методы для определения орбит комет». Кроме этого молодой математик по имени Карл Фридрих Гаусс утверждал, будто он первым использовал этот метод в 1801 году, что спровоцировало ожесточенный спор между двумя математиками, каждый из которых отстаивал свое право на авторство открытия.