Атлас искусственного интеллекта: руководство для будущего — страница 18 из 57

Системы машинного обучения ежедневно тренируются на подобных изображениях – изображениях, взятых из Интернета или государственных учреждений без контекста и без согласия. Они не являются нейтральными. Они отражают личные истории, структурное неравенство и всю несправедливость, которая сопровождает наследие полицейской и тюремной систем в Соединенных Штатах. Но предположение, что эти изображения каким-то образом могут служить аполитичным, инертным материалом, влияет на то, как и что «видит» инструмент машинного обучения. Система компьютерного зрения способна определить лицо или здание, но не то, почему человек находится в полицейском участке, или какой-либо социальный и исторический контекст, окружающий этот момент. В конечном счете, конкретные случаи данных – например, фотография лица – не имеют значения для обучения модели ИИ. Все, что имеет значение, – это достаточно разнообразная совокупность. Любое отдельное изображение может быть легко заменено другим, и система будет работать так же. Согласно этому мировоззрению, из постоянно растущей и глобально распределенной сокровищницы интернета и платформ социальных сетей всегда можно собрать больше данных.

Человек, стоящий перед камерой в оранжевом комбинезоне, дегуманизируется как «данные». История этих изображений, то, как они получены, их институциональный, личный и политический контекст даже не рассматриваются. Коллекции снимков используются как любой другой практический ресурс свободных, хорошо освещенных изображений, как эталон для работы таких инструментов, как распознавание лиц. И, подобно затягивающемуся храповику, лица умерших, подозреваемых и заключенных собираются для улучшения систем полиции и пограничного контроля, которые затем используются для наблюдения и задержания большего количества людей.

Последнее десятилетие ознаменовалось резким увеличением объема цифрового материала для производства ИИ. Эти данные являются основой для осмысления, но не как классические представления мира с индивидуальным значением, а как массовый сбор данных для машинных абстракций и операций. Этот процесс стал настолько фундаментальным для сферы ИИ, что не вызывает сомнений. Как же мы к этому пришли? Какие способы восприятия способствовали лишению данных контекста, смысла и специфики? Как учебные данные приобретаются, понимаются и используются в машинном обучении? Каким образом обучающая информация ограничивает ИИ?

В этой главе я показываю, каким образом данные стали движущей силой успеха ИИ и его мифологии, и как они приобретаются. Стоит отметить, что более глубокие последствия этого стандартного подхода редко рассматриваются, хотя он способствует дальнейшей асимметрии власти. Индустрия ИИ поощряет своего рода безжалостный прагматизм, с минимальным контекстом, осторожностью или согласием на использование данных, в то время как продвигается идея, что массовый сбор необходим и оправдан для создания систем прибыльного вычислительного «интеллекта». Все это привело к тому, что любые формы изображения, текста, звука и видео являются просто необработанными данными для систем искусственного интеллекта, и считается, что цель оправдывает средства. Но мы должны задаться вопросом: кто выиграл от этой трансформации, и почему доминирующие нарративы о данных сохранились? Как мы видели в предыдущих главах, логика добычи, определившая отношение к земле и человеческому труду, также является определяющей чертой того, как данные используются и понимаются в ИИ. Внимательно рассмотрев обучающие данные как центральный пример в ансамбле машинного обучения, мы можем начать понимать, что стоит на кону в этой трансформации.

Обучение машин видеть

Будет полезно рассмотреть, почему системы машинного обучения требуют огромных объемов данных. Одним из примеров является компьютерное зрение – область искусственного интеллекта, занимающаяся обучением машин распознаванию и интерпретации изображений. По причинам, которые редко признаются в области компьютерных наук, проект интерпретации картинок является очень сложным и реляционным. Изображения – удивительно трудные элементы, отягощенные множеством потенциальных значений, неразрешимых вопросов и противоречий. Тем не менее, в настоящее время на первых этапах создания системы компьютерного зрения принято брать тысячи или даже миллионы изображений из интернета, создавать и упорядочивать их в ряд классификаций, и использовать это в качестве основы для того, как система будет воспринимать наблюдаемую реальность. Эти обширные коллекции называются обучающими наборами данных, и они представляют собой то, что разработчики ИИ часто называют «базовой истиной»[203]. Истина, таким образом, – это не столько фактическое представление или согласованная реальность, сколько нагромождение изображений, взятых из различных доступных онлайн-источников.

При контролируемом машинном обучении инженеры предоставляют компьютеру маркированные обучающие данные. Затем в игру вступают два различных типа алгоритмов: обучающие и классифицирующие. Обучающий алгоритм – это алгоритм, который учится на помеченных данных; он сообщает классификатору, как лучше проанализировать связь между новыми входными данными и желаемым конечным результатом (или предсказанием). Например, он может определить: содержится ли на изображении лицо, является ли электронное письмо спамом. Чем больше маркированных примеров, тем точнее будет алгоритм. Существует множество видов моделей машинного обучения, включая нейронные сети, логистическую регрессию и деревья решений. Инженеры выбирают модель в зависимости от того, что они создают – будь то система распознавания лиц или средство определения настроений в социальных сетях, – а затем подбирают ее под свои вычислительные ресурсы.

Рассмотрим задачу создания системы машинного обучения, способной определять разницу между изображениями яблок и апельсинов. Сначала разработчику необходимо собрать, пометить и обучить нейронную сеть на тысячах помеченных изображений яблок и апельсинов. С программной стороны алгоритмы проводят статистический анализ и разрабатывают модель для распознавания разницы между двумя классами. Если все идет по плану, обученная модель сможет различать изображения яблок и апельсинов, с которыми она никогда раньше не сталкивалась.

Если все учебные изображения яблок красные и ни одного зеленого, то система машинного обучения может сделать вывод, что «все яблоки красные». Это так называемый индуктивный вывод – открытая гипотеза, основанная на имеющихся данных, а не дедуктивный вывод, который логически следует из предпосылки[204]. Учитывая то, как обучалась система, зеленое яблоко вообще не будет распознано как яблоко. Таким образом, обучающие наборы данных лежат в основе того, как большинство систем машинного обучения делают выводы. Они служат первичным исходным материалом, который системы ИИ используют для формирования основы своих прогнозов.

Обучающие данные определяют не только характеристики алгоритмов машинного обучения. Они также используются для оценки работы. Подобно породистым лошадям, алгоритмы машинного обучения постоянно соревнуются друг с другом на соревнованиях, чтобы выяснить, какие из них показывают наилучшие результаты при работе с определенным набором данных. Эти эталонные наборы становятся алфавитом, на котором основывается язык общения, когда множество лабораторий из разных стран сходятся вокруг канонических систем и пытаются превзойти друг друга. Одно из самых известных соревнований – ImageNet Challenge, где исследователи соперничают в том, чьи методы наиболее точно классифицируют и обнаруживают объекты и сцены[205].

Успешные обучающие наборы адаптируют, строят на их основе и расширяют. Как мы увидим в следующей главе, возникает своеобразная генеалогия: они наследуют логику обучения от предыдущих примеров, а затем порождают последующие. Например, ImageNet опирается на таксономию слов, унаследованную от лексической базы данных 1980-х годов, известной как WordNet; а WordNet наследует многие источники, включая Brown Corpus из одного миллиона слов, опубликованный в 1961 году.

Учебные базы данных стоят на плечах более старых классификаций и коллекций. Подобно расширяющейся энциклопедии, старые формы остаются, а новые элементы добавляются в течение десятилетий. Таким образом, обучающие данные – это фундамент, на котором строятся современные системы машинного обучения[206]. Они определяют эпистемические границы, регулирующие работу ИИ, и, в этом смысле, создают границы того, как ИИ может «видеть» мир. Однако обучающие данные – это хрупкая форма базовой истины, и даже самые большие массивы данных не могут избежать фундаментальных ошибок, которые возникают, когда бесконечно сложный мир упрощается и нарезается на категории.

Краткая история спроса на данные

«Мир вступил в эпоху дешевых сложных устройств большой надежности; и из этого обязательно что-то выйдет». Так сказал Ванневар Буш, изобретатель и администратор, который руководил Манхэттенским проектом в качестве директора Управления научных исследований и разработок, а позднее участвовал в создании Национального научного фонда. Шел июль 1945 года; бомбы еще не были сброшены на Хиросиму и Нагасаки. У Буша имелась теория о новом виде системы передачи данных, которой еще только предстояло родиться. Он представлял себе «передовые арифметические машины будущего», которые будут работать на чрезвычайно высокой скорости, «выбирать собственные данные и манипулировать ими в соответствии с инструкциями». Но этим устройствам потребуются огромные объемы информации: «У них будет непомерный аппетит. Одна из таких машин будет принимать инструкции и данные от целой комнаты девушек, вооруженных клавиатурами, и каждые несколько минут выдавать листы с вычисленными результатами. В делах миллионов людей, занимающихся сложными задачами, всегда найдется множество вычислений»