Атлас искусственного интеллекта: руководство для будущего — страница 31 из 57

[375]. Экман полагался на предложение участникам исследования имитировать выражение эмоций, которые затем сравнивались с фотографиями полученными вне лабораторных условий[376]. Испытуемым представлялись снимки с наиболее яркими эмоциями, а затем просили выбрать одну из категорий и обозначить. В ходе анализа измерялась точность, с которой выбранные испытуемыми обозначения коррелировали с обозначениями, выбранными исследователями.

С самого начала у методологии возникли проблемы. Формат ответов Экмана с принудительным выбором был позже раскритикован за то, что он предупреждал испытуемых о связях, которые исследователи уже установили между мимикой и эмоциями[377]. Кроме того, тот факт, что эти эмоции были симулированы, вызвал серьезные сомнения в достоверности результатов[378]. Экман обнаружил некоторые межкультурные соответствия, но его выводы были оспорены антропологом Рэем Бирдвистеллом, который предположил, что эти соответствия не отражают истинных эмоций, если они были усвоены через воздействие таких средств массовой информации, как фильмы, телевидение или журналы[379]. Именно этот спор заставил Экмана отправиться в Папуа-Новую Гвинею, специально для изучения коренных жителей высокогорного региона. Он решил, что если люди, мало знакомые с западной культурой и СМИ, согласятся с тем, как он классифицировал аффективные проявления, то это послужит убедительным доказательством универсальности его схемы.

После того как Экман вернулся после своей первой попытки изучения народа Форе в Папуа-Новой Гвинее, он разработал альтернативный подход для доказательства своей теории. Он показывал своим американским испытуемым фотографию, а затем попросил их выбрать одну из шести эмоций: счастье, страх, отвращение и презрение, гнев, удивление и печаль[380]. Результаты оказались достаточно близки к результатам испытуемых из других стран, чтобы Экман посчитал возможным полагать, что «определенные формы поведения лица универсально ассоциируются с определенными эмоциями»[381].

От физиогномики до фотографии

Идея о том, что о внутреннем состоянии человека можно достоверно судить по внешним признакам, частично вытекает из истории физиогномики, которая была основана на изучении черт лица человека для выявления признаков его характера. В древнегреческом мире Аристотель считал, что «о характере человека можно судить по его внешности… ибо предполагалось, что тело и душа поражаются вместе»[382]. «Греки также использовали физиогномику как раннюю форму расовой классификации, применяя ее к „самому роду человеческому“, разделяя его на расы, в той мере, в какой они различаются по внешности и характеру (например, египтяне, фракийцы и скифы)»[383]. Они предполагали связь между телом и душой, что позволяло судить о внутреннем характере человека по его внешнему облику.

Физиогномика в западной культуре достигла своего апогея в восемнадцатом и девятнадцатом веках, когда она рассматривалась как часть анатомических наук. Ключевой фигурой в этой традиции стал швейцарский пастор Иоганн Каспар Лаватер, который написал книгу «Эссе о физиогномике», первоначально опубликованную на немецком языке в 1789 году[384]. Лаватер взял подходы физиогномики и соединил их с новейшими научными знаниями. Он пытался создать более «объективное» сравнение лиц, используя силуэты вместо гравюр художников, поскольку они носили более механический характер и фиксировали положение каждого лица в привычной профильной форме, позволяя иметь сравнительную точку зрения[385]. Лаватер считал, что структура костей является основополагающей связью между внешностью и типом характера. Если выражения лица мимолетны, то черепа давали более прочный материал для физиогномических выводов[386]. Измерение черепов, как мы видели в последней главе, использовалось для поддержки зарождающегося национализма, расизма и ксенофобии. Эта работа продолжила свое развитие в XIX веке такими френологами, как Франц Джозеф Галль и Иоганн Гаспар Шпорцгейм, а также в научной криминологии благодаря работе Чезаре Ломброзо. Все это привело к тем типам классификаций, которые повторяются в современных системах искусственного интеллекта.

Но именно французский невролог Дюшен, которого Экман назвал «удивительно одаренным наблюдателем», кодифицировал использование фотографии и других технических средств для изучения человеческих лиц[387]. В книге «Механизм физиогномики человека» Дюшен заложил важные основы для Дарвина и Экмана, соединив старые идеи физиогномики и френологии с более современными исследованиями в области физиологии и психологии. Он заменил расплывчатые утверждения о характере более ограниченным исследованием выражения лица и внутренних ментальных или эмоциональных состояний[388].

Дюшен работал в Париже в приюте Сальпетриер, где содержалось до пяти тысяч человек с самыми разными диагнозами психических заболеваний и неврологических состояний. Некоторые из них стали объектами его мучительных экспериментов – часть давней традиции медицинских и технологических экспериментов над самыми уязвимыми и теми, кто не может отказаться[389]. Дюшен, который был мало известен в научном сообществе, решил разработать технику электрического шока для стимулирования изолированных мышечных движений. Его целью стало создание более полного анатомического и физиологического представления о лице. Дюшен прибегнул к этим методам, чтобы соединить новую психологическую науку с гораздо более древним изучением физиогномических признаков, или страстей[390]. Он использовал новейшие фотографические технологии, которые позволяли использовать гораздо более короткое время экспозиции и заморозить на снимках мимолетные мышечные движения и выражения лиц[391].

Даже на этих ранних стадиях лица никогда не являлись естественными или социально обусловленными человеческими экспрессиями, а представляли собой имитации, созданные путем грубого воздействия электричества на мышцы. Тем не менее, Дюшен верил, что использование фотографии и других технических систем позволит превратить неуклюжий процесс репрезентации в нечто объективное и доказательное, более подходящее для научного исследования[392]. В своем предисловии к книге «О выражении эмоций у человека и животных» Дарвин высоко оценил «великолепные фотографии» Дюшена и включил их репродукции в свою собственную работу[393]. Поскольку эмоции оказались временными, даже мимолетными, фотография давала возможность фиксировать, сравнивать и классифицировать их видимое выражение на лице. Тем не менее, образы истины Дюшена были в высшей степени искусственными.


Фотографии из книги Ж. Б. Дюшена (де Булонь) «Механизм человеческой физиогномики, или Электрофизиологический анализ выражения страстей». Предоставлено Национальной медицинской библиотекой США


Вслед за Дюшеном Экман поставил фотографию в центр своей экспериментальной практики[394]. Он считал, что замедленная съемка необходима для его подхода, поскольку многие выражения лица работают на пределе человеческого восприятия. Его целью был поиск так называемых микровыражений – крошечных мышечных движений на лице. Продолжительность микровыражений, по его мнению, «настолько мала, что они находятся на пороге распознавания, если не использовать замедленную съемку»[395]. В более поздние годы Экман настаивал, что любой человек без специальной подготовки может научиться распознавать микровыражения примерно за один час[396]. Но если эти выражения слишком быстры для распознавания человеком, как их понять?[397]

Одним из масштабных планов Экмана в его ранних исследованиях являлась кодификация системы обнаружения и анализа выражений лица[398]. В 1971 году он опубликовал описание того, что он назвал техникой оценки лицевых действий (FAST). Опираясь на фотографии, этот подход использовал шесть основных эмоциональных типов, в значительной степени основанных на интуиции Экмана[399]. Но вскоре FAST столкнулся с проблемами, когда другие ученые смогли создать выражения лица, не включенные в его типологию[400]. Поэтому Экман решил основать следующий инструмент измерения на лицевой мускулатуре, возвращаясь к первоначальным исследованиям электрошока Дюшенна. Экман определил примерно сорок различных мышечных сокращений на лице и назвал основные компоненты каждого выражения лица единицей действия[401]. После некоторого тестирования и проверки Экман и Уоллес Фризен опубликовали в 1978 году систему кодирования действий лица (FACS); обновленные издания до сих пор продолжают широко использоваться