DeepMind поставила вычислительный эксперимент: исследователи обучили мощную нейронную сеть на данных, моделировавших информацию о движении, которой пользуется животное, разыскивающее еду в темноте. Исследователи с удивлением обнаружили, что структуры, напоминающие нейроны решетки, «спонтанно возникли внутри сети — что поразительно напоминает паттерны активности нейронов, наблюдающиеся у разыскивающих еду млекопитающих»[157]. Иными словами, оказалось, что одна и та же базовая навигационная структура сама собой возникает в двух совершенно разных субстратах, биологическом и цифровом. Хассабис сказал мне, что считает это одним из самых поразительных прорывов, совершенных компанией. Похоже, что внутренняя система, использующая нейроны решетки, попросту представляет собой самый эффективный с точки зрения вычислений способ отображения навигационной информации в любой структуре, независимо от того, как именно она реализована[158]. Научная статья DeepMind, описывающая это исследование и опубликованная в журнале Nature[159], вызвала широкий отклик в сфере нейробиологии. Подобные открытия заставляют предположить, что междисциплинарный подход, которого придерживается эта компания, скорее всего, окажется улицей с двусторонним движением — исследователи ИИ будут не только учиться у мозга, но и способствовать его пониманию.
DeepMind внесла еще один важный вклад в нейробиологию в начале 2020 года, использовав свой опыт в области глубокого обучения для исследования работы дофаминовых нейронов в мозге[160]. Нейробиологи с 1990-х годов стали понимать, что эти особые нейроны предсказывают вероятное вознаграждение за выполнение животным определенного действия. Если реальная награда оказывается больше ожидаемой, то выделяется относительно больше дофамина. Если же результат отстает от ожиданий, это химическое вещество, дающее нам чувство благополучия, вырабатывается в меньшем количестве. Традиционное обучение с подкреплением у компьютерных систем устроено во многом так же — алгоритм делает прогноз и затем регулирует вознаграждение, исходя из разницы между ожидаемыми и действительными результатами. Исследователям из DeepMind удалось значительно усовершенствовать алгоритм обучения с подкреплением, сгенерировав распределение прогнозов вместо одного усредненного предсказания и затем корректируя вознаграждение в соответствии с ними. Затем компания совместно с группой исследователей из Гарварда проверила, происходит ли подобный процесс в головном мозге. Им удалось доказать, что мозг мышей действительно создает аналогичное распределение прогнозов: одни дофаминовые нейроны оценивают потенциальную награду более пессимистично, другие — более оптимистично. Иными словами, компания снова продемонстрировала наличие одного и того же базового механизма, обеспечивающего аналогичные результаты, в цифровом алгоритме и в биологическом мозге.
Исследования такого рода свидетельствуют о глубокой вере Хассабиса и его команды в обучение с подкреплением и об отношении к этому методу как к важнейшему элементу попыток приблизиться к более универсальному искусственному интеллекту. В этом плане они стоят особняком. Например, Ян Лекун из Facebook заявил, что отводит обучению с подкреплением второстепенную роль. В своих выступлениях он часто говорит, что если бы интеллект был тортом, то обучение с подкреплением представляло бы собой лишь вишенку на нем[161]. Команда из DeepMind убеждена в принципиально большей значимости этого метода, а также видит в нем реальный путь к созданию универсального ИИ.
Обычно мы описываем обучение с подкреплением как действие основанного на вознаграждении алгоритма, оптимизирующего некоторые внешние макропроцессы, например освоение игры го или навыка вождения смоделированного автомобиля. Однако Хассабис отмечает, что обучение с подкреплением также играет определяющую роль в головном мозге и может являться обязательным условием возникновения разума. Вполне возможно, что обучение с подкреплением — первичный механизм, побуждающий мозг проявлять любопытство, учиться и мыслить. Представим, например, что естественная задача мозга сводится к исследованию и последующему упорядочиванию потока необработанных данных, непрерывно воспринимаемых животным, движущимся в своей среде обитания. По словам Хассабиса, «мы знаем, что при взгляде на что-то новое и необычное в мозге вырабатывается дофамин», и если мозг так устроен, что «поиск информации и ее структурирование само по себе есть вознаграждение, то это чрезвычайно полезная мотивация»[162]. Иначе говоря, двигателем, поддерживающим наше постоянное стремление к постижению окружающего мира, вполне может быть алгоритм обучения с подкреплением, связанный с выработкой дофамина.
Совершенно другого подхода к созданию универсального машинного интеллекта придерживается Дэвид Ферруччи, генеральный директор и основатель стартапа в области ИИ Elemental Cognition. Ферруччи более известен как глава команды, создавшей Watson, систему IBM, победившую Кена Дженнингса и других сильнейших игроков в Jeopardy! в 2011 году. После триумфа Watson Ферруччи ушел из IBM и присоединился к хедж-фонду с Уолл-стрит Bridgewater and Associates, где, по слухам, работал над использованием искусственного интеллекта для осмысления макроэкономики и помог воплотить управленческую и инвестиционную философию основателя Bridgewater Рэя Далио в алгоритмы, повсеместно используемые в фонде.
Сейчас Ферруччи совмещает должности директора по прикладному ИИ в Bridgewater и руководителя Elemental Cognition, получившей первоначальное венчурное финансирование от хедж-фонда[163]. Ферруччи сказал мне, что целью Elemental Cognition является «подлинное понимание речи». Компания создает алгоритмы, способные автоматически читать тексты и затем поддерживать интерактивный диалог с людьми, в котором система углубляет понимание прочитанного, а также может объяснить свои выводы. Далее Ферруччи пояснил:
Мы хотим копнуть глубже внешней структуры языка, глубже паттернов, проявляющихся в частоте словоупотребления, и добраться до стоящего за ними смысла. На этой основе мы хотим строить внутренние логические модели, которые люди могут создавать и использовать в мышлении и коммуникации. Мы хотим получить систему, поддерживающую совместимый интеллект, способный при взаимодействии с человеком самостоятельно учиться и углублять понимание речи, диалога и тому подобного[164].
Это чрезвычайно смелая цель, на мой взгляд, очень близкая к созданию интеллекта человеческого уровня. Существующие ИИ-системы, обрабатывающие естественный язык, имеют те же самые ограничения, что продемонстрировала созданная DeepMind система DQN для игр Atari, когда ракетку сместили на несколько пикселей вверх. Точно так же, как DQN не понимает, что пиксели на экране представляют физический объект, который можно перемещать, сегодняшние системы распознавания языка реально не понимают, что означают слова, которые они обрабатывают. Вот какой вызов приняла компания Elemental Cognition.
Ферруччи явно уверен, что решение задачи понимания языка — самый верный путь к созданию универсального интеллекта. Вместо того чтобы погружаться в физиологию мозга, как команда из DeepMind, Ферруччи считает возможным напрямую сконструировать систему, способную приблизиться к человеку по уровню понимания речи и использования логики и мышления. Его отличает от остальных исследователей ИИ убежденность, что базовые кирпичики для создания универсального интеллекта у нас уже есть. Как говорит он сам, «я не считаю, подобно другим, что мы не знаем, как это сделать, и ждем какого-то колоссального прорыва. По-моему, это не так. На мой взгляд, мы прекрасно знаем, что делать, осталось лишь продемонстрировать результат»[165].
Ферруччи с большим оптимизмом оценивает вероятность достижения этой цели в относительно близком будущем. В документальном фильме 2018 года он сказал: «Не пройдет и трех-пяти лет, как мы получим компьютерную систему, способную самостоятельно учиться понимать во многом так же, как это делает человеческий мозг»[166]. Когда я подловил его на этом прогнозе, он немного сдал назад, признав, что три-пять лет, пожалуй, слишком оптимистичный прогноз. Тем не менее, по его словам, он по-прежнему «считает, что мы сможем это увидеть в течение следующего десятилетия или около того. Ждать 50 или 100 лет не придется»[167].
Чтобы достичь этой цели, команда из Elemental Cognition создает своего рода гибридную систему, включающую глубокие нейронные сети и реализации других методов машинного обучения в сочетании с программными модулями поддержки логики и мышления, основанными на традиционных методах программирования. Эффективность гибридного подхода (в противоположность стратегии, опирающейся исключительно на нейронные сети) обещает стать одним из важнейших дискуссионных вопросов в сфере ИИ.
Рэй Курцвейл, в настоящее время технический директор Google, также пытается приблизиться к универсальному интеллекту, идя по пути, сильно ориентированному на понимание речи. Курцвейл прославился, издав в 2005 году книгу «Сингулярность уже близка»[168], благодаря которой стал считаться самым видным пропагандистом идеи «сингулярности». Курцвейл и его многочисленные последователи верят, что в один прекрасный день сингулярность приведет к появлению сверхчеловеческого машинного интеллекта, обусловив резкий перелом и крутой подъем кривой исторического развития человечества. В этой точке перегиба ускорение технологического прогресса станет настолько быстрым, что полностью, в немыслимых масштабах, преобразует каждую составляющую нашей жизни и цивилизации.