Атлас искусственного интеллекта: руководство для будущего — страница 17 из 57

[189].

Фраза «Мы все – ИТ-работники» стала обычным лозунгом на протестах, связанных с технологиями. Его несут и программисты, и уборщики, и работники столовой, и инженеры[190]. Его можно читать по-разному: он требует, чтобы технологический сектор признал рабочую силу, которую привлекает для обеспечения функционирования своих продуктов, инфраструктуры и рабочих мест; также он напоминает, что очень многие люди используют ноутбуки и мобильные устройства, общаются на таких платформах, как Facebook или Slack, и подвергаются на рабочих местах воздействию систем искусственного интеллекта для стандартизации, отслеживания и оценки. Все это создало основу для солидарности, построенной вокруг работы в сфере технологий. Работники любой сферы подвергаются воздействию добывающих технических инфраструктур, которые стремятся контролировать и анализировать время до мельчайших деталей. Многие из них вообще не идентифицируют себя с технологическим сектором или технологической работой. История труда и автоматизации напоминает нам, что на кону стоит создание более справедливых условий для каждого человека, и эта цель не должна зависеть от расширения определения технологического труда. Все мы коллективно заинтересованы в том, как будет выглядеть наше будущее.


Глава 3Данные

Молодая женщина смотрит вверх, глаза сфокусированы на чем-то за пределами кадра, как будто она отказывается признать камеру. На следующей фотографии ее взгляд устремлен вдаль. На другой фотографии она изображена с растрепанными волосами и угрюмым выражением лица. На протяжении всей последовательности снимков мы видим, как она со временем стареет, морщины вокруг рта опускаются и углубляются. На последнем кадре она выглядит обиженной и удрученной. Это фотографии женщины, арестованной на протяжении многих лет жизни. Ее изображения хранятся в коллекции, известной как NIST Special Database 32 – Multiple Encounter Dataset, размещенной в Интернете для исследователей, желающих протестировать программы распознавания лиц[191].

Эта база данных, поддерживаемая Национальным институтом стандартов и технологий (NIST), – одна из старейших и наиболее уважаемых лабораторий физических наук в США, которая в настоящее время входит в состав Министерства торговли. NIST был создан в 1901 году с целью укрепления измерительной инфраструктуры страны и создания стандартов, которые могли бы конкурировать с экономическими соперниками в промышленно развитом мире, такими как Германия и Великобритания. Все – от электронных медицинских карт до сейсмостойких небоскребов и атомных часов – находится в ведении NIST. Он стал агентством измерения: времени, протоколов связи, неорганических кристаллических структур, нанотехнологий[192]. Цель NIST состоит в том, чтобы сделать системы совместимыми посредством определения и поддержки стандартов, и теперь это включает разработку стандартов для искусственного интеллекта. Одна из инфраструктур тестирования, которую он поддерживает, предназначена для биометрических данных.

Впервые я обнаружила базы данных снимков в 2017 году, изучая архивы NIST. Их биометрические коллекции довольно обширны. Более пятидесяти лет NIST сотрудничает с Федеральным бюро расследований в области автоматического распознавания отпечатков пальцев и разрабатывает методы оценки качества сканеров отпечатков и систем визуализации[193]. После террористических атак 11 сентября 2001 года NIST стал частью национальных мер по созданию биометрических стандартов для проверки и отслеживания людей, въезжающих в США[194]. Это стало поворотным моментом для исследований в области распознавания лиц; они расширились с фокуса на правоохранительные органы до контроля людей, пересекающих государственные границы[195].


Изображения, взятые из специальной базы данных NIST 32-Multiple Encounter Dataset (MEDS). Национальный институт стандартов и технологий, Министерство торговли США


Сами по себе снимки выглядят ужасно. У некоторых людей видны раны, синяки и подбитые глаза; другие расстроены и плачут. Кто-то безучастно смотрит в камеру. База содержит тысячи фотографий умерших людей с многочисленными арестами, поскольку они неоднократно сталкивались с системой уголовного правосудия. Люди представлены как точки данных; здесь нет ни историй, ни контекста, ни имен. Поскольку снимки сделаны в момент ареста, нам неясно, виновны они, оправданы или заключены в тюрьму. Все они представлены одинаково.

Включение этих снимков в базу данных NIST изменило их значение с использования для идентификации лиц в системах правоохранительных органов до превращения в техническую основу для тестирования коммерческих и академических систем искусственного интеллекта. В своем исследовании Аллан Секула утверждает, что фотографии являются частью традиции технического реализма, цель которого – «предоставить стандартный физиогномический портрет преступника»[196] В истории полицейской фотографии, отмечает Секула, существует два различных подхода. Такие криминологи, как Альфонс Бертильон, который изобрел фоторобот, рассматривали его как своего рода биографическую машину идентификации, необходимую для выявления рецидивистов. С другой стороны, Фрэнсис Гальтон, статистик и основоположник евгеники, использовал составные портреты заключенных как способ выявления биологически обусловленного «преступного типа»[197]. Гальтон работал в рамках физиогномистской парадигмы, целью которой являлся поиск обобщенной внешности и выявление черт характера по внешним признакам. Когда фотороботы используются в качестве обучающих данных, они больше не являются инструментом идентификации, а скорее служат для тонкой настройки автоматизированной формы видения. Они используются для выявления основных математических компонентов лиц, чтобы «свести природу к геометрической сущности»[198].

Снимки являются частью архива, используемого для тестирования алгоритмов распознавания лиц. Лица в базе данных Multiple Encounter Dataset стали стандартизированными изображениями, технической основой для сравнения точности алгоритмов. NIST в сотрудничестве с исследовательским агентством Intelligence Advanced Research Projects Activity (IARPA) проводит соревнования с фотографиями, в ходе которых исследователи конкурируют за самый быстрый и точный алгоритм. Команды стремятся победить друг друга в таких задачах, как установка идентичности или извлечение лица из кадра видеозаписи с камер наблюдения[199]. Победители гордятся победами, поскольку они способны принести славу, предложения о работе и признание в отрасли[200].

Ни люди, изображенные на фотографиях, ни их семьи не имеют права голоса в отношении применения снимков и, скорее всего, даже не подозревают, что стали частью испытательного полигона ИИ. О людях, изображенных на фотографиях, редко задумываются, и лишь немногие инженеры когда-либо пристально их рассматривают. Как говорится в документе NIST, они существуют исключительно для «совершенствования инструментов, методов и процедур распознавания лиц в рамках поддержки идентификации следующего поколения (NGI), судебно-медицинского сравнения, обучения, анализа, соответствия изображений лиц и стандартов межведомственного обмена»[201]. В описании базы отмечается, что на многих людях заметны следы насилия, такие как шрамы, синяки и повязки. Но в документе делается вывод, что эти признаки «трудно интерпретировать из-за отсутствия базовой истины для сравнения с „чистым“ образцом»[202]. Эти люди рассматриваются не как личности, а как часть общего технического ресурса – всего лишь один компонент данных программы проверки распознавания лиц, золотого стандарта в этой области.

Я просмотрела сотни данных за годы исследований, выясняя, как создаются системы искусственного интеллекта, но базы данных NIST особенно тревожны, потому что они представляют собой модель того, что должно было произойти. Дело не только в непреодолимом пафосе самих изображений. Дело не только во вторжении в частную жизнь (подозреваемые и заключенные не имеют права отказаться от фотографирования). Дело в том, что базы данных NIST предвещают появление логики, которая сегодня прочно проникла в технологический сектор: непоколебимая вера в то, что все кругом – это данные, и их всегда можно взять. Неважно, где сделана фотография, отражает ли она момент уязвимости или боли или представляет собой форму пристыжения объекта. В индустрии стало настолько нормальным брать и использовать все, что доступно, что мало кто задумывается о лежащей в основе политике.

Снимки с места преступления являются уртекстом современного подхода к созданию ИИ. Контекст, который представляют изображения, считается неважным, потому что фотографии больше не существуют как отдельные элементы. Считается, что они не несут ни смысловую, ни этическую нагрузку. Личные, социальные и политические смыслы представляются нейтрализованными. Я считаю, что этот переход от изображения к инфраструктуре – где значение или забота, которые можно было бы придать изображению отдельного человека или контексту, – стирается в тот момент, когда снимок становится частью совокупной массы в обширной системе. Все это рассматривается как данные, которые нужно прогнать через функции ради улучшения технических характеристик. Это основная предпосылка идеологии извлечения данных.