Во многих ситуациях обновление наиболее вероятных байесовских предположений по мере получения свежих данных происходит снова и снова, и процесс вывода приобретает характер бесконечного цикла. В каждой итерации прежняя апостериорная вероятность становится текущей априорной, на ее основе трактуется новая порция данных и формируется новая апостериорная вероятность — новое наиболее вероятное предположение, затем цикл повторяется. Если ваш газон окажется мокрым и на следующее утро, то в этот раз вы в своем наиболее вероятном предположении о причинах будете отталкиваться от вчерашнего наиболее вероятного предположения, и так далее, с каждым новым днем.
Байесовский вывод с успехом используется в самых разных контекстах, от медицинской диагностики до поиска пропавших атомных подлодок, и ему постоянно находится все новое и новое применение[129]. Собственно, и сам научный метод можно рассматривать как байесовский процесс, в котором научные гипотезы обновляются с появлением новых свидетельств по итогам экспериментов. Подобное представление о науке отличается и от «сдвигов парадигмы» Томаса Куна, согласно которым целые научные построения переворачиваются, как только накапливается достаточный объем не совпадающих с ними свидетельств, и от «фальсификационизма» (опровергаемости) Карла Поппера, согласно которому гипотезы выдвигаются и проверяются по очереди, одна за другой, словно воздушные шарики, которые отпускают в небо, а потом сбивают. В философии науки больше всего с байесовской концепцией схожи взгляды венгерского философа Имре Лакатоса, который в своих работах сосредоточивался прежде всего на том, что позволяет научно-исследовательским программам работать на практике, а не на том, в чем они в идеале должны состоять[130].
Конечно, байесовское представление о науке подразумевает, что априорные убеждения ученых об обоснованности их теорий повлияют на то, в какой мере эти теории будут обновляться или опровергаться в свете новых данных. У меня, например, имеется сильное априорное убеждение, что мозг — это машина, выдающая байесовские прогнозы. Это сильное убеждение определяет не только мою трактовку экспериментальных данных, но и то, какие эксперименты я буду проводить, чтобы получить новые данные, отвечающие моим убеждениям. Мне иногда становится интересно, сколько понадобится данных, чтобы развенчать мое байесовское убеждение в том, что мозг, по сути, руководствуется байесовскими принципами[131].
Давайте вернемся к нашему воображаемому мозгу, который, томясь в глухой темнице черепной коробки, пытается выяснить, что происходит снаружи, во внешнем мире. Теперь мы можем ухватиться за эту трудную задачу как за идеальную возможность вывести байесовское умозаключение. Выдвигая наиболее вероятные предположения об источниках своих зашумленных и неоднозначных сенсорных сигналов, мозг руководствуется принципами преподобного Томаса Байеса.
Перцептивные априорные вероятности могут кодироваться на разных уровнях абстракции и гибкости. Они варьируются от самых общих и относительно фиксированных — таких как «свет льется сверху» — до обусловленных конкретной ситуацией, таких как «приближающийся мохнатый объект — это горилла». Условные вероятности в мозге кодируют отображение потенциальных источников в сенсорных сигналах. Это составляющие перцептивного умозаключения по принципу «рассуждения, направленного вперед», которые, как и априорные вероятности, могут действовать в самых разных пространственно-временных масштабах. Мозг непрерывно комбинирует эти априорные и условные вероятности согласно байесовскому правилу, каждую долю секунды формируя новую байесовскую апостериорную вероятность — наиболее вероятное перцептивное предположение. И на каждом следующем витке постоянно меняющегося потока входящих сенсорных данных предшествующая апостериорная вероятность становится действующей априорной. Восприятие — это текучий процесс, а не застывший снимок.
Надежность сенсорной информации играет важную роль и здесь. Если вы не в зоопарке, то априорная вероятность, что замаячившая вдалеке темная косматая фигура окажется гориллой, очень низка. Поскольку этот «неопознанный объект» пока находится далеко, оцениваемая надежность входящих зрительных данных тоже будет низкой, поэтому вряд ли вашим наиболее вероятным перцептивным предположением сразу же будет горилла. Но по мере приближения зверюги зрительные сигналы будут становиться все надежнее и информативнее и мозг будет перебирать наиболее вероятные предположения одно за другим — большая черная собака, человек в костюме гориллы, собственно горилла, — пока вы воочию не увидите гориллу (будем надеяться, как раз вовремя, чтобы успеть убежать).
Проще всего представить байесовские убеждения — априорные, условные и апостериорные вероятности — как числа от 0 (обозначающего нулевую вероятность) до 1 (обозначающей стопроцентную вероятность). Но чтобы понять, как надежность сенсорных сигналов влияет на перцептивное умозаключение, и увидеть, как байесовское правило может на самом деле применяться в мозге, нам нужно еще немного углубиться в теорию и начать рассуждать в терминах распределения вероятностей.
Диаграмма ниже демонстрирует пример распределения вероятностей для переменной х. Переменная в математике — это просто символ, который может принимать разные значения. Распределение вероятностей для х описывает вероятность того, что значения х будут располагаться в определенных пределах. Как видно на диаграмме, область значений можно изобразить в виде кривой. Вероятность того, что х находится в определенных пределах, задается площадью области под кривой, соответствующей этим пределам. В данном примере вероятность попадания х между двумя и четырьмя гораздо выше, чем вероятность его попадания между четырьмя и шестью. На графике распределения вероятностей общая площадь, лежащая под кривой, всегда равна единице. Это обусловлено тем, что при рассмотрении всех вероятных исходов какой-то непременно реализуется[132].
Распределение вероятностей может принимать самую разную форму. Распространенная разновидность таких форм, к которой относится и данная кривая, — нормальное, или гауссовское, распределение. Оно полностью описывается средним значением или медианой (значением на вершине кривой — в нашем случае это три) и прецизионностью (насколько далеко друг от друга расположены значения — чем выше прецизионность, тем меньше растянута кривая). Эти величины — среднее и прецизионность — называются параметрами распределения[133].
Рис. 8. Гауссовское распределение вероятностей
Нам это важно, поскольку байесовские убеждения можно с успехом представить в виде распределения Гаусса. В интуитивном смысле среднее означает содержание убеждения, а прецизионность — уверенность мозга по поводу этого убеждения. Сжатая заостренная кривая (высокая прецизионность) соответствует высокой уверенности в убеждении. Как мы еще увидим, именно в этой способности отражать уверенность, или надежность, заключена сила и действенность байесовского вывода.
Вернемся к примеру с гориллой. Теперь мы можем представить соответствующие априорные, условные и апостериорные вероятности как распределения вероятностей, каждое из которых будет характеризоваться средним значением и прецизионностью. Для каждого распределения среднее будет означать вероятность того, что объект окажется гориллой, а прецизионность — уверенность мозга в оценке этой вероятности[134].
Что происходит при появлении новых сенсорных данных? Процесс байесовского обновления данных лучше и проще будет изобразить графически. На следующей диаграмме пунктирная кривая представляет априорную вероятность встречи с гориллой. У этой кривой низкое среднее значение, указывающее на то, что гориллы здесь считаются редкостью, и относительно высокая прецизионность, говорящая о том, что уверенность в этом априорном убеждении высока. Прерывистая кривая — это условная вероятность, соответствующая входящим сенсорным данным. Здесь среднее значение выше, но ниже прецизионность: если бы навстречу вам действительно двигалась горилла, именно такие сенсорные данные вы бы и получали, но вы в этом не особенно уверены. И наконец, сплошная кривая — это апостериорная вероятность, представляющая вероятность того, что перед вами горилла, на основании имеющихся сенсорных данных. Апостериорная вероятность, как всегда, выводится с применением байесовского правила. При использовании распределения Гаусса применение байесовского правила сводится к перемножению пунктирной и прерывистой кривой, при этом площадь области под конечной кривой — апостериорной — должна сохраняться равной единице.
Рис. 9. Байесовский вывод с распределением Гаусса для наиболее вероятного предположения насчет встречи с гориллой
Обратите внимание, что пик кривой апостериорной вероятности ближе к пику априорной, чем пик условной. Это потому, что комбинация двух распределений Гаусса зависит и от среднего значения, и от прецизионности. В данном случае, поскольку у условной вероятности прецизионность относительно низкая — сенсорные сигналы, указывающие на наличие гориллы, оцениваются как ненадежные, — наиболее вероятное апостериорное предположение недалеко уходит от априорного. Но уже при следующем взгляде сенсорные данные, касающиеся гориллы, могут оказаться более отчетливыми, поскольку она приближается, и так как новая априорная вероятность — это прежняя апостериорная, то новая апостериорная — новое наиболее вероятное предположение — сдвинется ближе к версии «горилла». И так далее, пока не станет ясно, что пора уносить ноги.
Теорема Байеса обеспечивает критерий оптимальности для перцептивных умозаключений. Она задает наиболее оптимистичные сценарии того, что должен делать мозг, вычисляя наиболее вероятные источники входящих сенсорных данных, будь то горилла, красное кресло или чашка кофе. Однако это далеко не весь процесс. Теорема Байеса не в состоянии показать, как именно с точки зрения нейронных механизмов мозг проворачивает этот фокус с выдачей наиболее вероятного предположения.