На конференции Лекун все же поймал Сейновски, и ученые поделились своими соображениями. Разговор привел к появлению небольшого братства исследователей, которые намеревались создать новую модель искусственного интеллекта. Лекун завершил работу над диссертацией по подходу к обучению нейронных сетей, известному как «обратное распространение ошибки». Его вклад сделал возможной автоматическую «настройку» сети на более точное распознавание образов.
После завершения учебы Лекун стал искать во Франции организации, использующие аналогичные подходы к искусственному интеллекту. Найти удалось лишь небольшую лабораторию Министерства науки с профессором, работавшим в смежной области, но Лекун получил финансирование и место в ней. Его новый профессор сказал: «Я не представляю, чем ты занимаешься, но у тебя, похоже, светлая голова, поэтому я подпишу бумаги». Но Лекун там не задержался. Сначала он перешел в занимавшуюся нейронными сетями группу Джеффа Хинтона в Торонтском университете, а когда поступило предложение от Bell Labs, переехал в Нью-Джерси и продолжил совершенствовать свой подход, известный как сверточные нейронные сети, первоначально ориентированные на распознавание рукописных символов для автоматизированной сортировки почты. Родившийся во Франции канадец Йошуа Бенджио, получивший образование в Массачусетском технологическом институте яркий специалист по информатике, присоединился к нему в Bell Labs и работал над программным обеспечением для распознавания символов, а позже над созданием технологии машинного зрения, которая будет использоваться компанией NCR для автоматической обработки значительной части банковских чеков, циркулирующих в мире.
Несмотря на успехи разработчиков нейронных сетей, мейнстрим компьютерной науки не замечал их. Воспринимая себя как трех мушкетеров, Хинтон, Лекун и Бенджио решили изменить ситуацию. В 2004 г. они, как выразился Лекун, организовали «заговор» с целью повышения популярности сетей и одновременно развернули кампанию по ребрендингу, предлагавшую более привлекательные концепции технологии, такие как «глубинное обучение» и «глубокие сети доверия». К этому времени Лекун перебрался в Нью-Йоркский университет в какой-то мере для более тесного общения с нейробиологами и исследователями, применяющими алгоритмы машинного обучения к проблемам зрения.
Хинтон обратился в Канадский институт перспективных исследований за помощью в организации исследований в своей области и проведении ежегодных конференций. Проект, известный как «Нейрокомпьютеры и адаптивное восприятие», позволил ему отыскать самых перспективных исследователей в разных областях – от нейронауки до электротехники – и создать сообщество людей, заинтересованных в развитии нейросетей.
В этот раз на их стороне был технический прогресс – ускорение роста мощности компьютеров позволило строить нейронные сети огромных масштабов, способные обрабатывать массивы данных на порядки больше, чем раньше. Процесс занял почти десятилетие, но зато теперь возможности и ценность нейронных сетей были бесспорными. Помимо недостатка быстродействия компьютеров развитие нейронных сетей сдерживалось отсутствием больших массивов данных, необходимых для обучения. Ситуация быстро изменилась с появлением глобального интернета, а вместе с ним новой информационно-технологической концепции – облачных вычислений, а также возможности соединения этого ресурса с миллиардами мобильных передающих и вычислительных систем в виде смартфонов. Теперь нейронные сети можно было легко обучать на базе миллионов цифровых изображений или аудиозаписей, доступных в интернете.
Успех технологии стал очевидным, и Хинтон начал получать приглашения от компьютерных компаний, искавших пути повышения точности ориентированных на потребителя интеллектуальных сервисов – распознавания речи, машинного зрения, распознавания лиц, перевода и диалоговых систем. Казалось, что список был бесконечен. В качестве консультанта Хинтон внедрил нейронные сети глубинного обучения в Microsoft, и правильность такого подхода подтвердилась в 2012 г., когда директор по разработкам Microsoft Ричард Рашид выступил перед большой аудиторией в Тяньцзине, Китай. Рашид говорил по-английски, делая паузу после каждого предложения, а программа сразу произносила его на китайском голосом лектора. В конце выступления наступила тишина, а затем раздались оглушительные аплодисменты.
Программа работала не идеально, но за счет алгоритма глубинного обучения, разработанного на основе исследований Хинтона, количество ошибок распознавания было снижено более чем на 30 %. В следующем году ручеек интереса к нейронным сетям превратился в поток. Доступность данных в интернете и дешевой рабочей силы за счет краудсорсинга обеспечила и вычисления, и человеческие ресурсы для целей обучения.
Microsoft была не одинокой. Новые нейросетевые и другие технологии машинного обучения резко повысили интерес к искусственному интеллекту в Кремниевой долине и не только в ней. Соединение нового подхода к искусственному интеллекту с интернетом открывало путь к созданию новых сервисов на основе машинного зрения или распознавания речи и получения прямого доступа к глобальной аудитории через десятки миллионов смартфонов.
В 2010 г. Себастьян Трун пришел в Google, чтобы создать X Laboratory, своего рода аналог Исследовательского центра Xerox в Пало-Альто. У лаборатории был большой портфель научно-исследовательских проектов – от работы Труна над беспилотными автомобилями до развития нейронных сетей. В широком смысле их определяли как «мозговые» проекты, возрождавшие новую волну интереса к системам искусственного интеллекта.
Проект «Человеческий мозг» первоначально возглавлял Эндрю Ын, коллега Труна по возрожденной Стэнфордской лаборатории искусственного интеллекта. Ын был экспертом по машинному обучению и знатоком некоторых методов глубинного обучения нейронных сетей, предложенных Хинтоном и Лекуном. В 2011 г. он начал заниматься в Google созданием системы машинного зрения, и в следующем году проект дал такие результаты, что исследователи Google решили представить их в докладе об эксперименте по неконтролируемому обучению с использованием видео из YouTube. Обучение на 10 млн цифровых изображений, найденных на YouTube, прошло намного лучше, чем все предыдущие попытки, – точность распознавания 20 000 объектов возросла примерно в два раза. Система также научилась распознавать кошек, что не удивительно, учитывая изобилие изображений кошек на YouTube. «Мозг» Google смонтировал сказочное цифровое изображение кошки, используя иерархию ячеек памяти для последовательного отбора общих особенностей на основе просмотра миллионов изображений. Ученые описывали этот механизм как кибернетический аналог процесса, происходящего в зрительной зоне коры головного мозга. Эксперимент стал возможным благодаря огромным вычислительным ресурсам Google, позволившим исследователям выделить для решения задачи кластер из 16 000 процессоров, что, конечно, ничтожно мало по сравнению с миллиардами нейронов мозга, значительная доля которых задействована в нашей зрительной системе.
Вопрос о том, идет ли Google по пути создания подлинного искусственного «мозга», становится все более спорным. Методы глубинного обучения, без сомнения, позволили добиться многого в распознавании образов и речи. В Кремниевой долине растет число тех, кто полагает, что мы вновь на пути к «сильному искусственному интеллекту» – созданию обладающей самосознанием машины с интеллектом, равным или превосходящим человеческий.
Рэй Курцвейл, исследователь искусственного интеллекта и страстный проповедник «технологического бессмертия», пришел в Google в 2013 г. как продолжатель работы Ына в области мозга вскоре после публикации книги «Эволюция разума», в которой предлагался рецепт создания работающего искусственного интеллекта. Курцвейл всегда был одним из самых откровенных сторонников идеи сингулярности. Как и Моравек, он уверен в том, ускорение роста вычислительной мощности неизбежно приведет к появлению самостоятельного сверхчеловеческого машинного интеллекта: по его оценке, около 2023 г. В Кремниевой долине эта идея материализовалась в форме Университета сингулярности и Института сингулярности – организаций, которые занимаются последствиями экспоненциального роста.
К Курцвейлу примыкает разношерстная группа ученых и инженеров, считающих, что, стоит лишь разгадать механизм функционирования биологического нейрона человека и создание искусственного интеллекта станет вопросом масштабирования. Успешный инженер из Кремниевой долины и соавтор книги «Об интеллекте» Джефф Хокинс, основавший с Донной Дубински компанию Palm Computing, утверждал, что путь к интеллекту на уровне человека лежит в эмуляции и масштабировании подобных коре головного мозга схем, способных распознавать образы. В 2005 г. Хокинс создал Numenta, одну из многих компаний, работающих с технологиями распознавания образов. Теория Хокинса перекликается с рецептом Курцвейла из «Эволюции разума». Аналогичным путем идут и Дилип Джордж, получивший образование в Стэнфорде исследователь искусственного интеллекта, который работал с Хокинсом в Numenta, а затем создал собственную компанию Vicarious для разработки «следующего поколения алгоритмов искусственного интеллекта», и швейцарский исследователь Анри Маркрам, убедивший Европейский союз выделить на его проект по созданию точной копии человеческого мозга €1 млрд.
В 2013 г. охота на таланты, которая и раньше не прекращалась, достигла нового размаха. Хинтон перешел в Google, поскольку ресурсы, доступные в Маунтин-Вью, затмевали все, чем он располагал в Торонтском университете. Компьютеры теперь были несравненно более мощными, чем во времена, когда Сейновски и Хинтон создали машину Больцмана, значительно больше стало и данных, пригодных для обучения нейронных сетей. На повестке стояла проблема управлении нейронной сетью, в которой количество параметров могло превышать миллиард. То, что было кошмаром для рядового статистика, породило бурнорастущую индустрию «больших данных», которая не пасовала перед необходимостью отслеживать и накапливать информацию практически по всем аспектам поведения людей, их взаимодействия и мышления.