Шанс есть! Наука удачи, случайности и вероятности — страница 35 из 40

Возникла и еще одна существенная проблема: такой подход не работает «задом наперед». Скажем, если вы знаете, что Z страдает болезнью Y, невозможно с абсолютной уверенностью заключить, что Z подхватил ее от X. Вполне типичная ситуация для медицинской диагностики, постоянно сталкивающейся с такими трудностями. Логические правила и закономерности привязывают болезни к симптомам, но врач, который имеет дело с ними, должен делать умозаключения о причинах болезни. «Для этого требуется перевернуть логическую формулу, но дедукция здесь не очень-то годится», – подчеркивает Тененбаум.

К середине 1980-х подобные проблемы, чего и следовало ожидать, привели к наступлению «зимы искусственного интеллекта». В обществе укоренилось мнение, что ИИ идет в никуда. Но Гудман убежден, что в глубине души люди все-таки сохраняли веру в ИИ. «Он просто ушел куда-то в подполье», – говорит ученый.

Первые проблески весны относятся к концу 1980-х, когда ученые стали активно изучаться нейронные сети. Идея ошеломляла своей простотой. Успехи нейробиологии позволили создать упрощенные модели нейронов и их взаимодействий. А тут еще и невиданный прогресс в разработке алгоритмов. Все это дало специалистам возможность конструировать искусственные нейронные сети (ИНС), способные обучаться и на первый взгляд напоминавшие по характеру своей работы человеческий мозг. Воодушевившись, ученые-компьютерщики принялись грезить об искусственных нейронных сетях с миллиардами или даже триллионами нейронов. Однако вскоре стало очевидно, что наши модели нервных клеток чересчур упрощенны. Исследователи не могли даже определить, какие из свойств нейронов особенно важны, не говоря уж о том, чтобы моделировать эти свойства, строя какие-то там ИНС.

Впрочем, нейронные сети в некоторой степени помогли заложить основу для нового ИИ. Некоторые специалисты, разрабатывавшие ИНС, в конце концов осознали: можно представить, что такие сети осмысливают мир в понятия статистики и вероятностей. Заговорили не о синапсах и импульсных пиках, а о параметризации и случайных переменных. «Теперь это уже походило не на большой мозг, а на большую вероятностную модель», – говорит Тененбаум.

А потом, в 1988 году, Джуд Перл из Калифорнийского университета в Лос-Анджелесе написал книгу «Вероятностные рассуждения в интеллектуальных системах», ставшую важной вехой в развитии науки об искусственном интеллекте и подробно описывавшую принципиально новый подход к ИИ. По сути, в ее основе лежала теорема Томаса Байеса, английского математика и священника, жившего в XVIII веке. Теорема связывает условную вероятность события Р (того, что событие P произойдет при условии, что произошло событие Q) и условную вероятность события Q (того, что событие Q произойдет при условии, что произошло событие P). Иными словами, появился метод, как бы позволяющий переключаться между причиной и следствием. «Если вы при помощи такого метода опишите все те различные вещи, которые вас интересуют, то байесианская математика подскажет вам, каким образом наблюдать следствия и как рассуждать, двигаясь вспять – к вероятностям различных причин», – старается объяснить Тененбаум.

Ключевую роль здесь играет байесианская сеть – модель, выстроенная на основе различных случайных переменных, причем вероятностное распределение для каждой зависит от всех других переменных. Изменяя значение одной из них, вы тем самым измените распределение вероятностей для всех прочих. Если вам известно значение хотя бы одной переменной, байесианская сеть позволяет предположить, каково вероятностное распределение для других переменных – иными словами, каковы их вероятные значения. Допустим, эти переменные являются отражением симптомов, болезней и результатов клинического анализа. Исходя из результатов анализа (выявлена вирусная инфекция, пока неизвестно, какая именно) и симптомов (высокая температура, кашель), можно сделать заключение о вероятности причин (грипп – весьма вероятно; пневмония – маловероятно).

К середине 1990-х некоторые исследователи, в том числе и Рассел, стали разрабатывать алгоритмы для байесовских сетей, способных обрабатывать существующие данные и обучаться на их основе. Во многом подобно тому, как человек при обучении в значительной мере полагается на уже достигнутое понимание и существующее (априорное) знание, эти новые алгоритмы могли выстраивать гораздо более сложные и точные модели на основании гораздо меньшего количества данных (по сравнению со своими предшественницами). Это стало огромным шагом вперед: в первых ИНС не было места априорному знанию, и для каждой новой проблемы они начинали обучение заново.

Так собирались кусочки мозаики, которая могла бы в конечном счете позволить создать искусственный интеллект, способный действовать в реальном мире. Параметрами для байесианской сети являются вероятностные распределения, и чем больше система знает о мире, тем полезнее для нее эти распределения. Но, в отличие от систем, основанных на логике первого порядка, цепочка рассуждений здесь не рушится перед лицом неполного знания.

Впрочем, логика не собиралась никуда уходить. Оказывается, самих по себе байесовских сетей недостаточно: они не позволяют строить произвольные сложные конструкции из простых элементов. Шум вокруг нового ИИ возник как раз благодаря синтезу логического программирования и байесовских сетей в рамках новой сферы – вероятностного программирования.

На первом плане этого нового ИИ – несколько компьютерных языков, включающих в себя и ту, и другую составляющую. В их числе язык Church, разработанный Тененбаумом совместно с коллегами и названный в честь Алонзо Чёрча, предложившего применить в компьютерном программировании одну из форм логики. Затем появилась Логическая сеть Маркова, разработанная командой Домингоса и сочетающая логику с марковскими сетями[14] (подобием байесовских). По сути, Рассел и его коллеги действовали в рамках байесианской логики (Bayesian Logic, отсюда название созданного ими компьютерного языка – BLOG).

Рассел продемонстрировал выразительную силу подобных языков, выступая в таких почтенных местах, как Подготовительная комиссия ООН по договору о всеобъемлющем запрещении ядерных испытаний (Comprehensive Test Ban Treaty Organization, CTBTO) в Вене. Комиссия пригласила Рассела, надеясь, что новые технологии в области ИИ помогут решить проблему выявления мест ядерных взрывов. На утреннем заседании выступающие говорили о том, как трудно обнаруживать характерный сейсмический рисунок далеких ядерных взрывов на фоне постоянных землетрясений, о капризах распространения сигнала сквозь земную кору, о «шумных» детекторах на сейсмических стациях. Внимательно выслушав все это, Рассел стал прикидывать, как бы решить столь сложную задачу, используя вероятностное программирование. «В обеденный перерыв я уже сумел полностью расписать модель для всей этой штуки», – хвастается Рассел. Модель заняла полстраницы.

В такого рода модели можно включать априорное знание – скажем, сравнительную вероятность того, что на индонезийской Суматре и в британском Бирмингеме случится землетрясение. Кроме того, комиссия требует, чтобы каждая система исходила из предположения: детонация ядерного устройства может с равной вероятностью произойти в любой точке Земли. Учитываются, конечно, и реальные данные, поступающие с мониторинговых станций комиссии. Задача системы ИИ – принимать всю эту информацию и на ее основе выдавать наиболее вероятное объяснение для каждого набора сейсмических сигналов.

Здесь-то и кроется затруднение. Такие компьютерные языки, как BLOG, оснащены так называемыми едиными устройствами вывода. Имея дело с проблемой из реального мира, где есть, как водится, большой набор переменных и большой набор вероятностных распределений, устройство вывода должно рассчитать вероятность, скажем, ядерного взрыва на Ближнем Востоке с учетом априорных вероятностей ожидаемых событий и новых сейсмических данных. Но если сделать так, что переменные будут представлять симптомы и болезнь, та же машина должна уметь поставить медицинский диагноз. Иными словами, ее алгоритмы должны носить весьма обобщенный характер. А значит, они будут совершенно неэффективны.

Таким образом, алгоритмы приходится подгонять к каждой новой задаче. Но ведь нельзя нанять какого-нибудь аспиранта, чтобы он приноравливал алгоритм под каждую новую возникающую проблему, замечает Рассел: «Ваш мозг работает не так. Ваш мозг сразу берется за решение задачи».

Вот почему Рассел, Тененбаум и многие их коллеги не дают уверенных прогнозов насчет будущих успехов ИИ. «Хочется, чтобы люди воодушевились, но не хочется прослыть шарлатаном, который торгует сомнительными снадобьями», – замечает Рассел. С ним согласен Тененбаум; хотя он несколько моложе Рассела, он все равно считает, что эффективное устройство вывода появится при его жизни лишь с 50-процентной вероятностью. И это несмотря на тот факт, что компьютеры становятся все быстрее, а алгоритмы – все смышленее. «Это куда более сложные проблемы, чем высадка на Луну или на Марс», – говорит Тененбаум.

Впрочем, такого рода выводы не нарушают общего духа оптимизма, царящего в сообществе специалистов по ИИ. Дафна Коллер из Стэнфордского университета, например, занимается решением весьма специфических проблем с помощью вероятностного программирования и добилась на этом поприще немалых успехов. Совместно со своей коллегой по Стэнфорду, неонатологом Анной Пенн, она разработала систему PhysiScore, призванную давать прогнозы, будет ли недоношенный ребенок иметь какие-то проблемы со здоровьем. Задача чрезвычайно трудна. Врачи не способны предсказать это хоть с какой-то степенью уверенности. «А ведь это единственное, что важно для семьи», – подчеркивает Пенн.

Система PhysiScore учитывает такие факторы, как возраст беременной и вес новорожденного, а также данные, собираемые в реальном времени в первые же часы после рождения: сведения о частоте сердечных сокращений, частоте дыхания, насыщенности крови кислородом. «Сейчас мы уже можем в течение первых трех часов после рождения младенцев с высокой степенью вероятности предсказать, какие дети будут здоровы, а какие будут более склонны к серьезным проблемам, даже если эти проблемы проявятся лишь через две недели», – говорит Коллер.