Атлас искусственного интеллекта: руководство для будущего — страница 30 из 57

[354]. Но если мы посмотрим на то, как эти эмоции были упорядочены и обозначены, то обнаружим несчетное количество вопросов. И ведущей фигурой, стоящей за этим подходом, является Пол Экман.

«Самый знаменитый в мире человек, читающий по лицам»

Исследования Экмана начались с удачной встречи с Сильваном Томкинсом, тогда уже признанным психологом из Принстона, который в 1962 году опубликовал первый том своего magnum opus об аффектах «Affect Imagery Consciousness»[355]. Работа Томкинса оказала огромное влияние на Экмана, который посвятил большую часть своей карьеры изучению их последствий. Один аспект, в частности, сыграл огромную роль: идея о том, что если аффект – это врожденный набор эволюционных реакций, то они должны быть универсальными и поэтому узнаваемыми в разных культурах. Это стремление к универсальности имеет важное значение для того, почему эти теории сегодня широко применяются в системах распознавания эмоций ИИ: они предлагают небольшой набор принципов, которые можно применять повсеместно, упрощение сложности, которое легко воспроизводимо.

Во введении к книге «Аффект, образ, сознание» Томкинс сформулировал свою теорию биологически обоснованных универсальных эмоций как теорию, направленную на решение острого кризиса человеческого суверенитета. Он бросил вызов развитию бихевиоризма и психоанализа, двух школ мысли, которые, по его мнению, рассматривали сознание как всего лишь побочный продукт других сил и служение им. Он отметил, что человеческое сознание «снова и снова подвергалось сомнению и приуменьшению, сначала Коперником», который переместил человека из центра вселенной, «затем Дарвином», чья теория эволюции разрушила идею о том, что люди созданы по образу и подобию христианского Бога, «и больше всего Фрейдом», который «обесценил человеческое сознание и разум как движущую силу наших мотивов»[356]. Томкинс продолжает: «Парадокс максимального контроля над природой и минимального контроля над человеческой природой отчасти является производной пренебрежения ролью сознания как механизма контроля»[357]. Проще говоря, сознание мало что говорит нам о том, почему мы чувствуем и действуем определенным образом. Это утверждение имеет решающее значение для всех видов последующих применений теории аффектов, которые подчеркивают неспособность людей осознавать как чувство, так и выражение эмоций. Если мы, люди, неспособны по-настоящему определить, что мы чувствуем, то, возможно, системы искусственного интеллекта смогут сделать это за нас?

Теория Томкинса позволила ему решить проблему человеческой мотивации. Он утверждал, что мотивация регулируется двумя системами: эмоциями и стимулами. Стимулы, в свою очередь, тесно связаны с непосредственными биологическими потребностями, такими как голод и жажда[358]. Они инструментальны; муки, вызванные голодом, устраняются с помощью еды. Однако основной системой, управляющей мотивацией и поведением человека, являются эмоции, включающие в себя позитивные и негативные чувства. Эмоции, играющие самую важную роль в мотивации человека, усиливают сигналы стимулов, но также стоит понимать, что они гораздо сложнее. Например, трудно определить точную причину или причины, которые заставляют ребенка плакать и выражать стресс. Он может «проголодаться, замерзнуть, намочить пеленки, испытывать боль, или [плакать] из-за высокой температуры»[359]. Точно так же существует ряд способов управления аффективным чувством: «Плач можно остановить кормлением или объятиями, обогревом или охлаждением комнаты, удалением занозы из пальца, и так далее»[360].

Томкинс заключает: «Цена, которую приходится платить за эту гибкость, – двусмысленность и ошибки. Индивид может правильно определить „причину“ своего страха или радости, а может и не определить. А может не научиться уменьшать свой страх, поддерживать или восстанавливать радость. В этом отношении система эмоций не является такой же простой сигнальной системой, как система стимулов»[361]. Аффекты, в отличие от драйвов, не являются строго инструментальными; они имеют высокую степень независимости от стимулов и объектов, что означает, что мы часто можем не знать, почему мы чувствуем гнев, страх или радость[362].

Вся эта двусмысленность наводит на мысль, что сложности аффектов невозможно разрешить. Как мы можем что-то знать о системе, в которой связи между причиной и следствием, стимулом и реакцией столь непрочны и неопределенны? Томкинс предложил свой ответ: «Первичные аффекты … похоже, врожденно связаны с заметной системой органов». А именно – с лицом[363]. Он нашел прецеденты такого акцента на выражении лица в двух работах, опубликованных в девятнадцатом веке: Чарльз Дарвин «О выражении эмоций у человека и животных» (1872) и малоизвестный том французского невролога Гийома-Бенжамена-Аманда Дюшена де Булонь «Электрофизиологический анализ выражения страстей пластического искусства» (1862)[364].

Томкинс полагал, что проявление эмоций на лице является универсальным человеческим свойством. «Эмоции, – считал Томкинс, – это наборы мышечных, сосудистых и железистых реакций, расположенных на лице и по всему телу и генерирующих сенсорную обратную связь. Эти организованные наборы реакций запускаются в подкорковых центрах, где хранятся специфические „программы“ для каждого отдельного аффекта» – очень раннее использование вычислительной метафоры для человеческой системы[365].

Однако Томкинс признал, что интерпретация аффективных проявлений зависит от индивидуальных, социальных и культурных факторов, и что в разных обществах существуют совершенно разные «диалекты» языка лица[366]. Даже прародитель исследований аффекта допускал возможность того, что распознавание эмоций зависит от социального и культурного контекста. Потенциальный конфликт между культурными диалектами и биологически обоснованным, универсальным языком имел огромные последствия для изучения выражения лица и более поздних форм распознавания эмоций. Учитывая, что выражения лиц культурно изменчивы, использование их для обучения систем машинного обучения неизбежно привело бы к смешению всевозможных контекстов, сигналов и ожиданий.

В середине 1960-х годов возможность постучалась в дверь Экмана в виде Агентства перспективных исследовательских проектов (ARPA), исследовательского подразделения Министерства обороны. Оглядываясь на этот период, он признается: «Это была не моя идея – заниматься этим [исследованием влияния]. Меня попросили, подтолкнули. Я даже не писал исследовательское предложение. Его написал за меня человек, который дал мне на это деньги»[367]. В 1965 году он изучал невербальную экспрессию в клинических условиях и искал финансирование для развития исследовательской программы в Стэнфордском университете. Он организовал встречу в Вашингтоне, округ Колумбия, с Ли Хоуфом, руководителем отдела поведенческих наук ARPA[368]. Хоуфа не заинтересовали описания Экмана, но он увидел потенциал в понимании межкультурной невербальной коммуникации[369].

Единственная проблема заключалась в том, что, по собственному признанию Экмана, он не знал, как проводить межкультурные исследования: «Я даже не знал, что такое аргументы, литература или методы»[370]. Поэтому Экман по понятным причинам решил отказаться от финансирования ARPA. Но Хоуф настоял на своем, и, по словам Экмана, он «просидел один день в моем кабинете и написал предложение, которое затем профинансировал. В результате я провел исследование, которым я наиболее известен – доказательства универсальности некоторых выражений эмоций на лице и культурных различий в жестах»[371]. Он получил огромное вливание средств от ARPA, примерно один миллион долларов – эквивалент более восьми миллионов долларов на сегодняшний день[372].

В то время Экман задавался вопросом, почему Хоуф так охотно финансировал это исследование, даже несмотря на его возражения и отсутствие опыта. Оказалось, что Хоуф хотел побыстрее распределить деньги, чтобы избежать подозрений со стороны сенатора Фрэнка Черча. Он уличил его в использовании исследований в области социальных наук в качестве прикрытия для получения информации в Чили, которая могла быть использована для свержения левого правительства при президенте Сальвадоре Альенде[373]. Позднее Экман пришел к выводу, что он был просто счастливчиком, человеком, «который мог проводить зарубежные исследования, не доставляя ему [Хоуфу] неприятностей!»[374] ARPA станет первым в длинном ряду агентств из оборонной промышленности, разведки и правоохранительных органов, которые будут финансировать как карьеру Экмана, так и область распознавания эмоций в целом.

Получив крупный грант, Экман начал свои первые исследования, чтобы доказать универсальность выражения лица. В целом, эти исследования проводились по схеме, которая была скопирована в первых лабораториях ИИ. Он во многом повторил методы Томкинса, даже использовал фотографии Томкинса для тестирования испытуемых из Чили, Аргентины, Бразилии, США и Японии