Нынешняя повсеместная культура извлечения данных продолжает расти, несмотря на опасения по поводу конфиденциальности, этики и безопасности. Изучая тысячи наборов данных, которые находятся в свободном доступе для разработки ИИ, я получила представление о возможностях технических систем распознавания, а также о способах отображения мира для компьютеров, крайне редких для человека. Существуют гигантские базы данных, полные селфи людей, татуировок, родителей, гуляющих с детьми, жестов рук, людей за рулем автомобилей, людей, совершающих преступления на камерах видеонаблюдения, и сотен повседневных действий человека, таких как сесть, помахать рукой, поднять бокал или заплакать. Любая форма биоданных, включая криминалистические, биометрические, социометрические и психометрические, фиксируется и заносится в базы данных, чтобы системы искусственного интеллекта могли находить закономерности и делать оценки.
Учебные базы данных поднимают сложные вопросы с этической, методологической и эпистемологической точек зрения. Многие из снимков сделаны без ведома или согласия людей и собраны из таких онлайн-источников, как Flickr, поиск изображений Google и YouTube, или предоставлены правительственными агентствами, такими как ФБР. Эти данные используются для расширения систем распознавания лиц, регулирования тарифов медицинского страхования, наказания водителей, отвлекающихся от управления транспортным средством, а также для создания инструментов предиктивного полицейского контроля. Однако практика извлечения данных проникает все глубже в те сферы человеческой жизни, которые раньше были недоступны или слишком дороги. Чтобы завоевать новые рубежи, технологические компании используют различные подходы. Голосовые данные собираются с устройств, расположенных на кухонных стойках или тумбочках в спальне; физические данные поступают с часов на запястьях и телефонов в карманах; данные о прочитанных книгах и газетах поступают с планшетов и ноутбуков; жесты и мимика собираются и оцениваются на рабочих местах и в аудиториях.
Сбор данных о людях для создания систем искусственного интеллекта вызывает явные опасения в отношении конфиденциальности. Возьмем, к примеру, сделку, которую британский фонд Royal Free National Health Service Foundation Trust заключил с дочерней компанией Google DeepMind, чтобы поделиться данными о пациентах (1,6 миллиона человек). Национальная служба здравоохранения в Великобритании является почитаемым учреждением, которому доверено предоставлять бесплатное медицинское обслуживание для всех, обеспечивая при этом безопасность данных пациентов. Но когда соглашение с DeepMind расследовали, выяснилось, что компания нарушила законы о защите данных, недостаточно информировав пациентов[264]. В своих выводах комиссар отметила, что «ценой инноваций не должно служить разрушение основных прав на частную жизнь»[265].
Однако существуют и другие серьезные проблемы, которым уделяется меньше внимания, чем конфиденциальности. Практика извлечения данных и создания учебных баз данных основана на коммерческом захвате того, что ранее являлось частью общего достояния. Эта особая форма эрозии представляет собой приватизацию исподтишка, извлечение ценности знаний из общественных благ. Набор данных может оставаться общедоступным, но их ценность при этом является частной собственностью. Безусловно, с помощью открытой информации можно сделать много полезного. Но существует социальное и, в некоторой степени, техническое ожидание того, что ценность данных, распространяемых через общественные учреждения и общественные пространства в Интернете, должна возвращаться к общественному благу в других формах пользования. Вместо этого мы видим горстку частных компаний, которые сегодня обладают огромными возможностями для извлечения информации и прибыли из этих источников. Новая золотая лихорадка ИИ состоит в том, чтобы заключить различные области человеческого знания, чувств и действий – все типы доступных данных – в экспансионистскую логику бесконечного сбора. Это превратилось в разграбление общественного пространства.
По сути, практика накопления данных на протяжении многих лет способствовала формированию мощной экстрактивной логики – логики, которая сегодня является основной характеристикой работы в области ИИ. Эта логика обогатила технологические компании с самыми большими массивами данных, в то время как пространство, свободное от сбора данных, резко сократилось. Как предвидел Ванневар Буш, у машин огромные аппетиты. Но то, как и чем их кормят, оказывает огромное влияние на их восприятие мира, а приоритеты их хозяев всегда будут определять способы монетизации этого видения. Рассматривая слои обучающих данных, которые формируют модели и алгоритмы ИИ, мы видим, что сбор и маркировка информации о мире – это социальное и политическое вмешательство, даже если оно маскируется под чисто техническое.
Способ понимания, фиксации, классификации и наименования данных – это, по сути, акт создания и удержания мира. Он имеет огромные последствия с точки зрения функционирования искусственного интеллекта в мире и того, на какие сообщества он оказывает наибольшее влияние. Миф о сборе данных как о благотворной практике в компьютерных науках затушевывать операции власти, защищая тех, кто получает наибольшую выгоду, избегая ответственности за их последствия.
Глава 4Классификация
Меня окружают человеческие черепа. В этой комнате их почти пятьсот, собранных в первые десятилетия 1800-х годов. Все они покрыты лаком, а на лобной кости черными чернилами написаны номера. Аккуратные каллиграфические круги отмечают участки черепа, ассоциирующиеся в френологии с определенными качествами, включая «Благожелательность» и «Почитание». Некоторые описания сделаны большими буквами, например, слова «Голландец», «Перуанец из расы инков» или «Лунатик». Каждый из них был тщательно взвешен, измерен и промаркирован американским краниологом Сэмюэлем Мортоном. Мортон был врачом, естествоиспытателем и членом Академии естественных наук Филадельфии. Он собирал человеческие черепа со всего мира, сотрудничая с сетью ученых и охотников за черепами, которые приносили образцы для его экспериментов, иногда разграбляя могилы[266]. К концу своей жизни в 1851 году Мортон собрал более тысячи черепов – самую большую на тот момент коллекцию в мире[267]. Большая часть архива сейчас хранится в отделе физической антропологии Пеннского музея в Филадельфии.
Мортон не принадлежал к классическим френологам, поскольку не верил, что характер человека можно узнать по форме головы. Скорее, его целью являлась «объективная» классификация и ранжирование человеческих рас путем сравнения физических характеристик черепов. Для этого он разделил их на пять «рас» мира: африканскую, коренную американскую, европеоидную, малайскую и монгольскую – типичная таксономия того времени и отражение колониалистского менталитета, который доминировал в его геополитике[268]. Это была точка зрения полигенизма – вера в то, что различные человеческие расы развивались отдельно в разное время – узаконенная белыми европейскими и американскими учеными, и приветствуемая колониальными исследователями как оправдание расистского насилия и лишения собственности[269]. Краниометрия стала одним из их ведущих методов, поскольку претендовала на точную оценку различий и достоинств человека[270].
Череп из коллекции черепов Мортона с надписью «Лунатик». Фотография Кейт Кроуфорд
Многие из черепов, которые я вижу, принадлежат людям, родившимся в Африке, но умершим в рабстве в Америке. Мортон измерял их, заполняя черепные полости свинцовой дробью, затем заливая дробь обратно в цилиндры и измеряя объем свинца в кубических дюймах[271]. Он опубликовал результаты исследований, сравнив их с теми черепами, которые он приобрел в других местах: например, он утверждал, что у белых людей самые большие черепа, а чернокожие люди находятся в нижней части шкалы. Таблицы Мортона со средним объемом черепа в зависимости от расы считались передовым достижением науки того времени. На его работы ссылались до конца века как на объективные, неопровержимые данные, доказывающие относительный интеллект человеческих рас и биологическое превосходство европеоидной расы. Эти исследования использовались в США для поддержания законности рабства и расовой сегрегации[272]. Считаясь научным достижением того времени, они использовались для оправдания расового угнетения еще долгое время после того, как на эти исследования перестали ссылаться.
Однако работа Мортона оказалась не тем доказательством, каким изначально планировала быть. Как описывает Стивен Джей Гулд в своей книге «Неправильное измерение человека»:
Одним словом, если говорить начистоту, резюме Мортона – это лоскутное одеяло из подтасовок и махинаций в явных интересах контроля априорных убеждений. Тем не менее – и это самый интригующий аспект его дела – я не нахожу никаких доказательств сознательного мошенничества. С другой стороны, распространенность бессознательного мошенничества позволяет сделать общий вывод о социальном контексте науки. Ведь если ученые могут честно обманываться до такой степени, как Мортон, то предварительные предубеждения можно найти где угодно, даже в основах измерения костей и подсчета сумм[273].
Гулд и многие другие после него повторно взвесили черепа и перепроверили доказательства Мортона[274]