Универсальное устройство. Неизвестная история создания iPhone — Брайан Мёрчант

«Это хорошо с точки зрения восприятия, – говорит Грубер. – Машинное зрение, машинная речь, усвоение, распознавание шаблонов – однако всё перечисленное слабо коррелировало с представлениями знаний. Они полезнее для методов сбора данных и обработки сигналов. Поэтому вот что произошло: машинное обучение значительно продвинулось лишь в обобщении, полученном в результате работы с обучающими примерами».

Но у такого подхода, конечно, есть и недостаток. «Модели, полученные с помощью машинного обучения, на самом деле не имеют ни малейшего понятия, какие знания они получили и что эти знания означают; модели просто натренированы на обучающей выборке выполнять определённую функцию», как в случае с воспроизведением картин Ван Гога.

Учёные имеют прекрасное представление о том, как работает человеческое восприятие – механизмы, которые позволяют нам видеть и слышать, – и их можно смоделировать довольно естественно. Но учёные не обладают знаниями о том, как работает наш мозг. К примеру, нет единого научного консенсуса о том, как люди понимают тот или иной язык. Базы данных могут копировать то, что мы видим и слышим, но не то, как мы размышляем. «Поэтому большинство людей уверены, что именно таков ИИ. Однако это не ИИ, а всего лишь восприятие».

После Амхерста Грубер отправился в Стэнфорд, где он изобрёл Hypermail[49]. В 1994 году он открыл свою первую компанию Intraspect – «по сути… коллективный разум для больших корпораций». Последующие десять лет или около того он провёл, разрываясь между исследованиями и своими молодыми предприятиями. А затем он познакомился с Siri. Точнее, с тем, чему предстояло стать Siri. Процесс развития занял долгие годы.

* * *

Прежде чем завести речь о Siri, нам следует обратиться к DARPA (или ARPA до 1972 года). Управление перспективных исследовательских проектов Министерства обороны в шестидесятых годах обильно финансировало проекты ИИ и распознавания речи, возглавляемые Раджем Редди и другими, чтобы развить эту область и вдохновить подобных Тому Груберу учёных присоединиться к разработкам в этой области. В 2003 году, десятки лет спустя, DARPA неожиданно вернулось в игру с ИИ.

Управление выделило общественному исследовательскому институту SRI International приблизительно двести миллионов долларов на привлечение пятисот ведущих учёных к совместной работе по созданию виртуального ИИ. Проект получил название CALO, «виртуальный помощник, способный к обучению и организации»[50]: попытка создать акроним из латинского слова «calonis», что в переводе зловеще звучит как «прислужник солдата». К нулевым годам ИИ вышел из моды как исследовательское направление, поэтому данная широкомасштабная попытка удивила очень многих, работавших в этой области. «CALO появился в то время, когда большинство людей считало ИИ пустой тратой времени, – рассказывал Пол Саффо, специалист в области технологии прогнозирования, интернет-изданию Huffington Post. – Подобные затеи слишком часто заканчивались неудачей, скептицизм всё возрастал, и люди считали это попросту дурацкой затеей».

Одна из причин, по которой Министерство обороны вдруг заинтересовалось ИИ, заключалась в иракской войне, которая началась в 2003 году: действительно, некоторые технологии, разработанные в рамках CALO, были использованы в Ираке как часть программного обеспечения армейской системы Command Post of the Future («командный пункт будущего»). Так или иначе, сфера ИИ пробудилась от сна и стала активно развиваться. Проект CALO был «как ни крути, самой огромной программой ИИ за всю историю», говорил Дэвид Израэль, один из ведущих учёных, участвовавших в ней. Примерно тридцать университетов направили своих лучших исследователей ИИ, и сторонники каждого из основных направлений развития ИИ впервые занялись совместной работой. «За этот проект отвечал Стэнфордский исследовательский институт, – рассказывает Грубер. – Правительство влило в них двести миллионов баксов, чтобы они запустили проект по созданию… смышленого секретаря, который мог бы помочь вам с организацией встреч, презентациями и тому подобным. Они хотели стимулировать развитие возможностей ИИ».

Правительство влило в них двести миллионов баксов, чтобы они запустили проект по созданию… смышлёного секретаря, который мог бы помочь вам с организацией встреч, презентациями и тому подобным.

Когда в 2008 году проект стал близиться к завершению, главный идейный вдохновитель, Адам Чейер, и руководитель высшего звена, Даг Киттлаус, решили построить на некоторых ключевых элементах данного исследования свой новый стартап.

«Они придумали алгоритмы для решения таких вопросов как: как вам представлять фрагменты данных ассистенту? Как распознать речь? Как распознать человеческий язык? Как найти взаимопонимание с сервисами вроде Yelp[51], или как понимать ваше приложение-календарь? Как скомпоновать входные данные для достижения цели?» – рассказывает Грубер.

Чейер и Киттлаус видели своего ассистента неким оператором «все умеющей машины», который заменил бы поисковые службы и стал доминирующим способом взаимодействия людей с Сетью. По словам Грубера, прародитель Siri мог не только просматривать интернет, но ещё, к примеру, по одной команде присылать машину, чтобы забрать вас. Правда, изначально он вовсе не задумывался как голосовой интерфейс.

«Он был помощником, он просто понимал язык. Он не занимался распознаванием речи, – объясняет Грубер. – Вы просто набирали текст, а помощник понимал естественный язык. Но он был больше заточен под такие вещи, как планирование и составление досье на людей, с которыми вы встречаетесь, и прочее в том же духе.

Это был очень и очень интересный проект, но ориентирован он был на людей, работающих за компьютером».

Грубера познакомили с проектом, когда тот находился ещё «на стадии мозгового штурма», и Грубер подружился с двумя соучредителями. «Я сказал им, что это прекрасная задумка, но ориентирована на потребителя… Нам нужно сделать под неё интерфейс, – рассказывает он. – Моя крохотная команда внутри Siri создала диалоговый интерфейс. Поэтому всё, что вы видите сейчас, представляет всю ту же привычную парадигму нити разговора с наполнением внутри». Это не просто практичный вариант «команда и ответ на неё». Siri поддерживает с вами беседу. «Диалог устраняет недопонимание. Важно словесное общение, отсюда и появился помощник, способный к обмену репликами».

Проект начался через год после выхода iPhone, и когда он сформировался, стало ясно, что его целью станут смартфоны. «Siri изначально задумывалась под мобильные устройства, – рассказывает Грубер. – Давайте сделаем помощника, и сделаем его портативным. И ещё давайте добавим речь, когда её сделаем… Ко второму году технология распознавания речи была уже достаточно хорошо разработана, чтобы мы смогли лицензировать её».

Теперь же Груберу и его коллегам предстояло задуматься, как пользователи могли бы разговаривать с интерфейсом ИИ – с чем-то, чего прежде никогда не существовало на потребительском рынке. Им предстояло продумать, как обучить людей тем командам, которые воспринимает Siri.

«Нам нужно было научить людей разбираться в том, что можно, а чего не стоит говорить помощнику, что и по сей день остаётся проблемой; и, думается, дела у нас тут шли намного лучше, когда мы были молодым предприятием, нежели в нынешнее время», – говорит Грубер. Siri часто была медлительной, потому как ей требовалось время на обработку команды и формулировку ответа. «Идея о том, чтобы Siri иногда отвечала резко или остроумно шутила, выросла как ответ на проблему: как быть с тем фактом, что Siri много чего не знает? Тут приходится отступать либо в сторону поиска в интернете, либо делать вид, будто Siri знает нечто, чего на самом деле не знает». Siri, по сути, просто выигрывает время. «Например, Siri разговаривает с вами так, будто хорошо вас знает, но вы ещё об этом не догадываетесь, однако подобная манера речи – лишь мастерская иллюзия». И чем больше Siri привыкает к вашему голосу, тем меньше нужды в такой иллюзии.

Им также пришлось подумать, как сделать общение увлекательным, чтобы людям было интересно снова и снова обращаться к Siri. «Факт есть факт – без увлекательной зацепки никуда, – говорит Грубер. – Поэтому мы использовали относительно простой способ построения диалога, но сделали акцент не столько на форме, сколько на содержании.

Если бы вам предложили задать вопрос о чём угодно, о чём бы вы спросили? Чаще всего люди спрашивают: «Каков смысл жизни?» или «Выйдешь за меня?». И тому подобное. Очень скоро мы поняли, какие вопросы самые распространённые, и написали действительно удачные ответы. Я нанял гениального парня, чтобы он написал эти диалоги». Грубер не может раскрыть его имя, так как тот всё ещё работает в Apple, однако все намёки указывают на Гарри Седлера, чей профиль в LinkedIn говорит, что он менеджер в отделе разработки интерактивного взаимодействия Siri. На сегодняшний день над репликами Siri работает целая команда, и ребята тратят уйму времени на имидж Siri.

«Мы разработали Siri так, что невозможно понять, какого она пола – или даже биологического вида. Она смотрит на человечество и находит его забавным видом, – рассказывает Грубер. – Люди кажутся ей весёлыми и любознательными». Изначально Siri была более колоритным персонажем: она материлась, ехидно подтрунивала над пользователями и обладала более претенциозными чертами характера. Но остается открытым вопрос: какого нрава и каких манер мы ожидаем от нашего личного помощника с искусственным интеллектом? С кем бы нам захотелось общаться каждый день и какого отношения к себе нам бы хотелось?

«Непростая проблема, верно? – говорит Грубер. – У вас есть колоссальная аудитория, и вам приходится прописывать неординарные черты, чтобы они понравились людям. Представьте, что пишете книгу и придумываете персонажа. Вы размышляете: как он себя ведёт и на что способен? Итак, перед нами помощник, который едва знаком с человеческой культурой, ему любопытно узнать больше, но при этом он отлично выполняет свою работу, ведь он профессионал. Вы можете оскорбить его, и он не стерпит обиду. Впрочем, и ругаться в ответ он не станет… именно так и должно быть, потому что Apple не считает

Предыдущая Стр. 44 из 77 Следующая

Оглавление