Мозг: биография. Извилистый путь к пониманию того, как работает наш разум, где хранится память и формируются мысли — страница 57 из 99

овые модели не просто метафорически объясняли, как работает мозг. Они действительно открывали реальные механизмы.

* * *

Когда волнение по поводу «Пандемониума» и «Перцептрона» утихло, Дэвид Марр разработал другой подход в создании вычислительных моделей функционирования мозга. Ученый уже заслужил прочную репутацию в Кембридже, опубликовав ряд статей, где объявлял, что открыл принципы работы мозга. Вскоре Марр открестился от своих математических моделей, назвав их «простым комбинаторным трюком», поскольку понял, что требуется нечто совершенно иное [15]. В 1973 году Марр перешел в Массачусетский технологический институт в Бостоне, чтобы работать с Минским. Его целью было создать машину, способную видеть, которая помогла бы выяснить, как функционирует человеческое зрение. Четыре года спустя у Марра обнаружили лейкемию, и он поспешно приступил к написанию книги под названием «Зрение», которая должна была обобщить его идеи. В предисловии ученый пишет: «В декабре 1977 года произошли события, вынудившие меня написать эту книгу на несколько лет раньше, чем я собирался это сделать»[257] [16]. Марр умер в 1980 году в возрасте тридцати пяти лет. «Зрение» было опубликовано в 1982 году [17].

Возможно, осознание приближающейся смерти придало произведению Марра более грандиозную перспективу, чем могли бы гарантировать детали модели зрения. Он поместил свою теорию работы мозга в гораздо более широкий этический контекст, рассказав нам кое-что о том, как мы эволюционировали, и о происхождении наших самых глубоких убеждений о влиянии естественного отбора:

«Утверждение, что мозг – это компьютер, корректно, но вводит в заблуждение. Мозг действительно узкоспециализированное устройство обработки информации, или, скорее, самое крупное из них. Рассмотрение нашего мозга как устройства обработки данных не принижает и не отрицает человеческие ценности. В любом случае оно только поддерживает их и может, в конце концов, помочь нам понять, чем из такой информационной точки зрения являются человеческие ценности, почему они имеют выборочное значение и как они увязываются с социальными и общественными нормами, которыми обеспечили нас наши гены» [18].

Говорили, что из-за сложности расчетов работы Марра чаще цитировались, чем понимались[258]. Шутка свидетельствует о том, что значимость исследования Марра заключается не в точных деталях его вычислительных моделей зрения – даже его самые ярые сторонники признают, что большая часть книги сейчас скорее представляет исторический интерес, – но в его целостном подходе [19].

В отличие от Барлоу Марр не считал, что активность отдельных нейронов может объяснить, как функционируют целые сети и как работает восприятие. Марр в немного резком тоне писал о своем методе:

«Попытки понять зрительное восприятие, изучая лишь нейроны, подобно попытке понять полет птицы, изучая лишь ее перья. Это просто невозможно. Чтобы понять полет птицы, нам необходимо понять аэродинамику, и только потом структура перьев и различные формы птичьих крыльев будут иметь для нас какое-то значение»[259] [20].

Подход Марра к пониманию того, как та или иная функция выполняется в мозге (или компьютере), включал разделение задачи на три части. Во-первых, решаемая проблема должна быть сформулирована логически. Теоретический шаг определяет, будет ли проблема исследоваться экспериментальным путем или смоделируется. Во-вторых, необходимо определиться со способом представления входных и выходных данных системы, а также описанием алгоритма, который мог бы перевести систему из одного состояния в другое. Наконец, требуется объяснить, как второй уровень может быть реализован физически – в случае мозговой деятельности, в нервной системе. Марр предполагал, что ограничения в создании сети, способной видеть, будь то машина или мозг, в основном будут схожими и, следовательно, приведут к использованию аналогичных алгоритмов, даже если обнаружатся существенные различия в том, как эти алгоритмы были реализованы – во плоти или в железе.

Он утверждал, что, решив проблему машинного зрения, мы сможем лучше контролировать собственное.

Ученый Марр утверждал, что, решив проблему машинного зрения, мы сможем лучше контролировать собственное.

Марр опирался на открытия Хьюбела и Визеля касательно идей о том, как можно идентифицировать нечто столь простое, как линия края. Но его подход включал гораздо более богатую вычислительную схему, чем простая иерархия, склеивавшая кусочки линии вместе и заполнявшая шаблон, как в «Пандемониуме» или «Перцептроне». В 1976 году Марр, на встрече в Колд-Спринг-Харбор, сказал: «Этот контур не обнаруживается, он строится» [21]. Такая точка зрения, восходящая к Гельмгольцу, подчеркивает, что мозг – это не просто пассивный наблюдатель, получающий сенсорную информацию. Восприятие включает в себя сборку и интерпретацию входящих стимулов. Подобный подход необходим для любой модели зрения, поскольку ничего не произойдет, если машина (или сетчатка) просто идентифицирует количество света и тени в каждой точке изображения. На это способна камера, но камеры не могут видеть.

Несмотря на значимые прозрения, машинный подход Марра не изменил нашего понимания машинного зрения и понимания того, как видит мозг. Исходя из того, что известно о процессах, происходящих в зрительной коре, мозг и компьютер не имеют одинаковых алгоритмов [22]. Также проблемой является то, что специфический подход Марра к исследованию зрения не может быть обобщен и перенесен на другие аспекты функции мозга.

Хотя было многое достигнуто в области компьютерного распознавания лиц и других методов искусственного анализа сцен, машинное зрение еще далеко отстоит от того, что происходит в вашей голове прямо сейчас. А наши представления о точных процессах зрительного восприятия в мозге человека все еще недостаточно полные. Все согласны с тем, что в мозге должна быть какая-то символическая репрезентация окружающего мира, но никто не знает, как именно это происходит. В тридцатую годовщину публикации «Зрения» Кент Стивенс, один из учеников Марра, проанализировал вклад в науку своего научного руководителя. Он пришел к выводу, что, даже если роль символической репрезентации в зрении несомненна, «мы не до конца понимаем место символических систем в биологическом зрении» [23]. С данной проблемой, возможно, столкнулись в результате изучения клеток, распознающих лица, в мозге обезьяны.

В 2017 году два исследователя из Калифорнийского технологического института, Ле Чанг и Дорис Цао, показывали макакам различные лица и изучали реакции отдельных нейронов в их мозге [24]. Клетки идентифицировали пятьдесят измерений лица (каждое измерение состояло из множества физических признаков), причем каждый нейрон интересовался только одним из этих измерений. Чтобы показать, как собранная информация может быть объединена для получения полной общей картинки, Чанг и Цао перенесли ответы от 200 нейронов на серию фотографий. Затем ученые использовали компьютер для точной реконструкции исходных изображений на основе электрической активности этих нейронов. Интересно, что они не нашли никаких доказательств существования у обезьян «клетки Дженнифер Энистон», или, как они выразились, «детекторов для идентификации конкретных особей». Вместо этого, согласно исследованию другой группы, в височной доле мозга обезьян, видимо, есть область, которая участвует в распознавании лиц знакомых особей [25].

Процесс распознавания лиц у людей очень отличается от алгоритмов распознавания лиц, которые позволяют смартфону идентифицировать вас.

Цао, краткая твиттер-автобиография которой гласит, что она «кортикальный геометр», подозревает, что тип извлечения признаков, который она смогла выявить в отношении распознавания лиц, может быть общим процессом, происходящим в зрительной коре. «Мы полагаем, что вся нижне-височная кора может использовать одну и ту же организацию в сети связанных участков и один и тот же код для всех типов распознавания объектов» [26]. Нынешняя задача исследовательницы состоит в том, чтобы попытаться изучить нейронную основу зрительных иллюзий, таких как хорошо известная иллюзия «Ваза Рубина»[260]. Как указывает Цао, десять лет назад никто даже не знал, с чего начать. Теперь мы знаем. Что касается процесса распознавания лиц у людей (в том числе и лиц своих бабушек), вероятно, что, как и в мозге макаки, у нас существует некая распределенная сеть распознавания лиц [27]. Это очень отличается от алгоритмов распознавания лиц, которые позволяют смартфону идентифицировать вас или службам безопасности просматривать фотографии подозреваемых. Данные алгоритмы полностью адаптированы под сравнение различных строго фиксированных биометрических параметров: расстояние между глазами, форма лица и т. д. Распознавание лиц мозгом гораздо сложнее и абстрактнее и в конечном счете основывается на типах элементов, которые были выявлены Хьюбелом и Визелем, – линии, пятна и так далее – а не анатомических структурах лица и их взаимосвязи. Эти элементы каким-то образом организуются в сложную иерархическую систему общего вида, представленную Марром, которая в равной степени применима к другим особенностям окружающей среды, а не только к лицам.

Недавно, благодаря тревожащему совершенству вычислений и электрофизиологических методов, с которыми группа Маргарет Ливингстон провела эксперимент на обезьянах в Гарварде, были выдвинуты новые предположения о том, чем именно могут быть интересны иерархические клетки. Исследователи проецировали изображения на экран и регистрировали активность отдельных нейронов в нижне-височной коре бодрствующих макак [28]. Пока все шло предсказуемо. Но изображения не были статичными: они были синтетическими, постоянно меняющимися и текучими, «эволюционировали» с помощью алгоритма под названием XDReAM