Думай «почему?». Причина и следствие как ключ к мышлению — страница 19 из 82

Прототип байесовского анализа таков: предварительные представления + новые данные = пересмотренные представления. Представьте, что вы подбросили монету десять раз, и девять из них она выпадала орлом. Ваша уверенность в том, что монета не фальшивая, поколеблена, но насколько? Традиционный статистик скажет: «При отсутствии дополнительных данных я предположил бы, что эта монета с грузом, и я поставлю девять против одного, что в следующий подброс она выпадет орлом». Байесовский статистик возразит: «Подождите. Мы должны учесть уже имеющиеся данные о происхождении монеты». Откуда она взялась: из сдачи в гастрономе или из кармана мошенника? Если это обычный гривенник, то выпадение девяти орлов подряд не должно вызывать у нас настолько сильных подозрений. И наоборот, если мы уже подозревали, что с монетой что-то не так, мы заключим с большей уверенностью, что девять орлов — это серьезное нарушение случайного распределения.

Байесова статистика дает нам объективный способ объединить результаты наблюдений с нашими предварительными знаниями (или субъективными представлениями), чтобы получить пересмотренные представления и, следовательно, пересмотренные предсказания о том, как поведет себя монета при следующем подбрасывании. Однако чего частотники не могли простить, так это того, что байесианцы позволили мнению, в виде субъективной вероятности, проникнуть в стерильное царство статистики. Признания большинства удалось заслужить только очень постепенно, когда байесовский анализ проявил себя как превосходный инструмент для решения множества задач, таких разных, как предсказание погоды и отслеживание вражеских подводных лодок. Вдобавок во множестве случаев можно доказать, что влияние предварительных представлений тает с ростом массива данных, так что в конце остается чисто объективный вывод.

К сожалению, то, что общепринятая статистика смирилась с байесовской субъективностью, никак не повлияло на ее отношение к субъективности каузальной, требующейся для составления путевых диаграмм. Почему? Ответ лежит в плоскости великого языкового барьера. Чтобы озвучить субъективные предположения, байесова статистика все-таки использует язык вероятностей — родной язык Гальтона и Пирсона. Предположения о причинно-следственных связях, однако, требуют более богатого языка (например, диаграммы), который одинаково чужд и байесианцам, и частотникам. Взаимопонимание, к которому пришли последние, показывает, что преодолеть философские барьеры помогает добрая воля и общий язык. Языковые барьеры не так легко перепрыгнуть.

Более того, субъективная компонента в каузальной информации далеко не всегда уменьшается со временем, даже с ростом объема данных. Два человека, у которых два разных взгляда на причинность одного явления, могут анализировать один и тот же набор данных и никогда не прийти к общему результату, как бы велик объем данных ни был. А это пугающая перспектива для адвокатов научной объективности, и она объясняет их отказ принять неизбежность необходимости полагаться на субъективную каузальную информацию.

Положительная сторона этой проблемы в том, что причинностное умозаключение объективно в одном принципиально важном смысле: если двое ученых согласны в своих предположениях, оно позволяет со 100 %-ной объективностью интерпретировать новую входящую информацию (данные). В этом оно совпадает с байесовским умозаключением.

Так что пытливый читатель, вероятно, не удивится тому, что я пришел к теории причинности окольным путем, который начинался с байесовских вероятностей и затем шел через байесовские сети. Эту историю я расскажу в следующей главе.

Глава 3. От доказательств к причинам. Преподобный Байес знакомится с мистером Холмсом

Пойдут ли двое вместе, не сговорившись между собою? Ревет ли лев в лесу, когда нет перед ним добычи?

Книга пророка Амоса. 3:3

«Элементарно, Ватсон!» — так говорил Шерлок Холмс (по крайней мере, в кино), прежде чем изумить верного помощника характерным и подчеркнуто неэлементарным дедуктивным рассуждением. Но на деле Холмс занимался не просто дедукцией, которая ведет от гипотезы к заключению. Он прекрасно владел искусством индукции, которая работает в противоположном направлении — от улики к гипотезе.

Еще одна известная цитата описывает его образ действий: «Если исключить невозможное, то, что останется, и будет правдой, сколь бы невероятным оно ни казалось». Получив несколько гипотез методом индукции, Холмс затем отметал одну за другой, чтобы с помощью дедукции (исключения) найти верную. Хотя индукция и дедукция идут рука об руку, первая гораздо загадочнее. Этот факт и позволяет детективам вроде Шерлока Холмса оставаться в деле.

Однако в последние годы эксперты по искусственному интеллекту добились большого прогресса в автоматизации процесса умозаключений, ведущего от улик к гипотезам и подобным же образом — от следствий к причинам. Мне повезло участвовать в этом процессе на самых ранних стадиях: я разработал один из его базовых инструментов под названием «байесовские сети». Эта глава объясняет, что они собой представляют, рассматривает способы их применения сегодня и обсуждает окольные пути, по которым они привели меня к исследованию причинно-следственных связей.

Bonaparte — компьютер-детектив

17 июля 2014 года рейс MH17 авиакомпании «Малайзия эйрлайнс» вылетел из амстердамского аэропорта Схипхол в Куала-Лумпур. Увы, самолет не добрался до пункта назначения. Через три часа, когда самолет пролетал над Восточной Украиной, его сбили ракетой «земля — воздух» российского производства. Все 298 человек на борту, 283 пассажира и 15 членов экипажа, погибли в авиакатастрофе.

23 июля, когда в Нидерланды были доставлены первые погибшие, объявили днем государственного траура. Но для криминалистов из Нидерландского института судебной экспертизы в Гааге 23 июля стало точкой отсчета. В их задачи входило как можно скорее идентифицировать останки и доставить их близким для похорон. Время поджимало, потому что каждый день неизвестности приносил обездоленным семьям новую боль.

Криминалисты столкнулись со множеством препятствий. Тела были сильно обожжены, и многие хранились в формальдегиде, который разрушает ДНК. Кроме того, поскольку Восточная Украина оставалась территорией военных действий, место авиакатастрофы было доступно не всегда. Останки находили в течение десяти месяцев. К тому же криминалисты не располагали информацией о ДНК жертв по той простой причине, что погибшие не были преступниками. Поэтому приходилось полагаться на частичные совпадения с ДНК родственников.

К счастью, у голландских специалистов был мощный инструмент — новейшая программа под названием Bonaparte, предназначенная для идентификации жертв катастроф. Эта программа, которую разработали в середине 2000-х ученые из Университета Неймегена имени святого Радбода Утрехтского, использует байесовские сети, чтобы скомбинировать информацию о ДНК, взятую у нескольких членов семьи.

Отчасти благодаря скорости и точности Bonaparte голландские криминалисты смогли опознать останки 294 из 298 жертв к декабрю 2014 года. К 2016 году только две жертвы катастрофы (оба граждане Нидерландов) оставались пропавшими без вести.

Байесовские сети, инструмент для машинного рассуждения, лежащий в основе программы Bonaparte, влияет на нашу жизнь разными способами, о которых большинство людей не имеет представления. Они используются в программах распознавания речи, фильтрах для спама, прогнозах погоды, при оценке потенциальных нефтяных скважин и одобрении медицинских приборов в Управлении по санитарному надзору за пищевыми продуктами и медикаментами. Если вы играете в видеоигры на приставке XboX компании «Майкрософт», значит, байесовские сети оценивают ваш уровень. Если у вас есть мобильный телефон, то алгоритмы, которые используются, чтобы выбрать ваш исходящий вызов из тысяч других, кодируются с помощью алгоритма распространения доверия, разработанного для байесовских сетей. Винт Серф, главный пророк Интернета из еще одной небезызвестной компании — Google, — говорит об этом так: «Мы потребляем байесовские методы в огромных объемах».

В этой главе я расскажу историю байесовских сетей с их появления в XVIII веке до развития в 1980-х годах, а еще приведу больше примеров того, как они используются сегодня. Они связаны с диаграммами причинности очень простым способом: такая диаграмма — это байесовская сеть, в которой каждая стрелка обозначает прямое причинно-следственное отношение или, по крайней мере, его возможность в направлении этой стрелки. Не все байесовские сети имеют причинно-следственную природу — во многих случаях это не имеет значения. Однако, если вы когда-нибудь захотите задать вопрос второго или третьего уровня на Лестнице Причинности, вам необходимо будет нарисовать диаграмму, обратив самое пристальное внимание на причинно-следственные связи.

Преподобный Байес и проблема обратной вероятности

Томас Байес, в честь которого я назвал сети в 1985 году, даже и не мечтал, что формула, которую он вывел в 1750-х годах, однажды будет использоваться, чтобы идентифицировать жертв катастрофы. Его волновала исключительно вероятность двух событий, одно из которых (гипотеза) происходит после второго (подтвержденного факта). Тем не менее причинность весьма его волновала. Более того, стремление установить причинно-следственные связи было движущей силой для его анализа «обратной вероятности».

Преподобный Томас Байес, пресвитерианский священник, живший с 1702 по 1761 годы, очевидно, был сильно увлечен математикой. Отколовшись от англиканской церкви, он не мог учиться в Оксфорде или Кембридже и вместо этого получил образование в Эдинбургском университете, где, вероятно, немало занимался любимой наукой. После того как Байес вернулся в Англию, он продолжал баловаться математикой и организовывать математические обсуждения.

В статье, опубликованной после его смерти, Байес разобрал задачу, которая была для него идеальной: столкнул м