Технология распознавания покупок в магазинах может заменить кассиров. Amazon так описывает механизм работы пилотных магазинов Go:
Совершение покупок в отсутствие кассы обеспечивается технологиями того же типа, который используется в беспилотных автомобилях, – компьютерным зрением, сочетанием датчиков и глубоким обучением. Наша технология Just Walk Out автоматически фиксирует, когда покупатель берет продукты с полок или возвращает их на место, и ведет их учет в виртуальной корзине. Закончив покупки, вы можете просто выйти из магазина. Вскоре после этого мы спишем деньги с вашего счета на Amazon и пришлем вам чек[91].
Озвучивались разные предположения о количестве сотрудников, необходимых для работы магазинов Amazon Go, но компания пока не раскрывает эту информацию. При посещении магазина в Сиэтле я пришел к выводу, что сотрудники нужны там, чтобы помогать покупателям входить в магазин с приложением Go, проверять документы при покупке алкоголя и производить уборку помещения. Зейнеп Тон, которая занимается исследованиями занятости и условий труда в розничном секторе и других отраслях, отмечает, что машины вряд ли будут выполнять всю работу в таких магазинах:
Даже если большинство покупателей будет оплачивать покупки на кассах самообслуживания, большая часть работы в розничных магазинах по-прежнему будет выполняться людьми. Покупателям не позволят самим получать товары в зоне разгрузки, расставлять их по полкам на складе, переносить товары со склада в торговые залы или менять цены[92].
Технология распознавания фотографий в интернете пока не оказала значительного влияния на профессии и организации. Само собой, такие компании, как Facebook и YouTube, уже разработали алгоритмы обнаружения порнографических или террористических изображений, однако обычно они маркируют потенциально проблемные изображения и сообщают о них модераторам, которые продолжают проверку. Несмотря на такой двухуровневый процесс, компания по-прежнему время от времени совершает ошибки[93]. Конечно же, вполне вероятно, что в отсутствие алгоритмов ИИ для проверки контента потребовалось бы значительно большее количество людей, однако такие профессии появились относительно недавно, поэтому число занятых в этой сфере пока растет, а не сокращается. Так, в YouTube заявили о планах увеличить штат «модераторов контента», численность которого в 2018 г. должна превысить 10 000 человек[94].
Как правило, технология не оказывает существенного влияния на организации по двум причинам. Во-первых, она еще не достигла зрелости. Есть основания полагать, что технология восприятия и распознавания изображений на основе глубокого обучения в какой-то момент станет распознавать изображения не хуже, а порой даже лучше человека, но пока она не достигла такого совершенства, а маркированных данных для тренировки слишком мало.
Во-вторых, существенные изменения организационных структур и профессий потребуют от солидных компаний перестройки процессов. Компания Amazon не зря решила протестировать новые процессы в специально созданной организации – Amazon Go. Внедрить их в работу приобретенной сети супермаркетов Whole Foods будет, несомненно, гораздо сложнее.
Любая организация столкнется с рядом препятствий при широком внедрении технологии распознавания изображений. Одна из главных преград – сложные пограничные условия. Например, в сфере беспилотного транспорта любая доступная сегодня технология будет испытывать трудности с распознаванием пешеходов, других автомобилей, дорог, дорожной разметки и знаков при снегопаде.
Проблема пограничных условий возникает и при применении технологии распознавания изображений в розничной торговле. Есть сведения, что на ранних этапах с ней столкнулись и в Amazon Go:
Компания Amazon столкнулась с проблемой одновременного отслеживания действий более 20 покупателей, а также с проблемой учета товаров при перемещении их с конкретного места на полках[95].
Вполне вероятно, что по мере совершенствования технологии глубокого обучения проблема пограничных условий станет менее острой. Однако организациям, внедряющим технологию распознавания изображений, важно понимать, с какими ограничениями им придется иметь дело сейчас.
Препятствовать широкому внедрению технологии распознавания изображений также могут вопросы приватности и «фактор жути». Чаще всего они возникают при использовании технологии распознавания лиц. Вопросы приватности обсуждаются при ее применении в розничной торговле, разведке, борьбе с преступностью и государственных структурах, а также в технических устройствах личного пользования. Технически сети магазинов могут уже сегодня внедрить технологию распознавания лиц, чтобы узнавать постоянных покупателей, однако этому мешают озабоченность вопросами приватности и «фактор жути». Опасения из-за использования технологии в государственном секторе сформулировал Американский союз защиты гражданских свобод:
Опаснее всего, что эта технология будет использоваться в обычных системах профилактического наблюдения. Государственные автотранспортные ведомства располагают высокочеткими фотографиями большинства граждан, которые представляют собой естественный источник изображений для программ распознавания лиц. Если интегрировать их в системы видеонаблюдения, государство получит полноценную систему идентификации и слежения[96].
На текущем уровне развития технология уже способна распознавать лица в толпе, что дает поводы для опасений при государственном наблюдении за протестами и акциями гражданского неповиновения.
Наконец, еще одна проблема заключается в том, что системам глубокого обучения необходимы (в случае с большинством коммерческих применений) маркированные изображения для тренировки. Маркировка изображений – трудоемкий процесс, а заниматься ею приходится людям. Некоторые базы данных с открытым кодом, например ImageNet, уже вобрали в себя ранее маркированные людьми изображения, однако они ограничиваются лишь определенными типами (так, среди них много изображений кошек). Если ваша организация планирует использовать глубокое обучение с учителем для распознавания принадлежащих организации изображений (скажем, фотографий одежды), вам придется найти способ маркировки большого количества изображений.
Целенаправленное и беспилотное перемещение по миру
Появление новых форм ИИ, использование новых или более дешевых датчиков и совершенствование традиционной робототехники привели к тому, что умные машины все чаще могут ориентироваться в мире и выполнять мобильные задачи без человеческого вмешательства. Самым очевидным примером служат, конечно, беспилотные автомобили, но не стоит забывать и о роботах, которые перемещаются по заводам и складским помещениям. В мобильном мире способность перемещать людей и грузы без человеческого вмешательства сулит грандиозные перемены, что и объясняет огромное внимание к этой категории технологий искусственного интеллекта.
Концепция беспилотных автомобилей вполне понятна, но пока неясно, какого уровня автономности они достигнут и когда именно. Например, автономность третьего уровня, которую уже предлагают несколько автопроизводителей, предполагает, что автомобиль может во многих обстоятельствах работать автономно, однако за рулем по-прежнему должен сидеть водитель, который при необходимости может взять управление на себя. Автомобили четвертого уровня автономности функционируют полностью автономно, но только в определенных условиях – например, на низких скоростях или на дорогах определенного типа. Автономность пятого уровня предполагает полностью автономное функционирование автомобиля при любых обстоятельствах. Хотя максимальную выгоду компаниям и потребителям приносит полная автономность, частичная автономность также дает преимущества: например, грузовик может ехать по шоссе без участия спящего водителя, но водитель будет брать управление при въезде в город.
Помимо беспилотных автомобилей, большими шагами вперед в этой категории идут и роботы. Компании уже используют их для приготовления пищи, предоставления помощи покупателям, обслуживания гостиничных номеров и сортировки очередей в банках. Роботы передвигаются не только по офисам, заводам и складским помещениям (что широко распространено, например, в распределительных центрах Amazon), но и по улице и по неровным поверхностям в незнакомой обстановке. Так, роботы Boston Dynamics передвигаются по ландшафту на двух ногах, на четырех ногах или на колесах и ногах – в зависимости от модели. Они даже умеют подниматься после падений, хотя совсем недавно роботы этого еще не умели.
Роботы также становятся более расположенными к сотрудничеству. Раньше на заводах они работали отдельно от людей, поскольку любой контакт человека с машиной был опасен (для человека). Однако новое поколение роботов малой мощности может работать вместе с людьми. Кроме того, их могут обучать даже неспециалисты.
Быстрое совершенствование робототехники в последние годы также объясняется распространением операционных систем для роботов с открытым кодом, появлением дешевых датчиков и сближением перцепционных и логических способностей роботов с компетенциями других более мощных и крупных систем ИИ[97]. По прогнозу IDC, расходы на роботов к 2019 г. достигнут $135 млрд[98].
Само собой, этим технологиям найдется множество применений как на уровне компаний, так и на уровне потребителей. Одни доступны уже сегодня, в то время как другие не заставят себя ждать. Вот неполный список: