Кому принадлежит будущее? — страница 9 из 35

Взгляд сверху

Тот, кто неправильно использует большие массивы данных, выглядит смехотворно

Заходят как-то в бар три ботана…

Вечно удивленному автору этой книги довелось поработать в составе комиссии Калифорнийского университета в Беркли. Комиссия оценивала импровизированные бизнес-планы выпускников программы подготовки предпринимателей. Трое студентов представили следующую схему.

Предположим, вы в субботу вечером ходите по барам и ночным клубам Сан-Франциско. Вы заходите в бар и видите там много-много симпатичных одиноких девушек, к которым на первый взгляд можно подкатить и которые зашли именно в это заведение в надежде найти компанию. Ну вы хватаете мобильник и пишете в сеть: «Эй, тут есть девчонки!» И все парни вроде вас будут знать, куда идти. Этот сервис будет зарабатывать, возможно, на рекламе баров и производителей алкогольных напитков.

Я посмотрел на эту чудаковатую троицу и задал очевидный вопрос: «А будет ли вообще хоть когда-нибудь шанс, что ваш сервис предоставит корректные данные?» Повисла напряженная пауза. Был ли это очередной пример потрясающего технического творчества в совокупности с ужасающе наивными представлениями о людях на грани синдрома Аспергера?

Они ответили: «Нет, конечно же. Достоверных данных никогда не будет. Всё будет держаться только на чьей-то надежде».

Я поставил им высший балл, причем не потому, что хотел вдохновить их на применение столь непросто доставшихся им навыков к столь непродуктивному плану, а потому, что они продемонстрировали понимание, как на самом деле работает информация в сетевых технологиях в применении к людям[49].

Если у вас нет частной жизни, кто-то на этом наживается

Иногда миллионеры увлекаются каким-либо новым символом богатства и раздувают его ценность. Замечательный пример – рынок произведений искусства. Дорогие картины стали по сути валютой, которая в ходу среди очень богатых людей. Чем лучше у художника получается создавать картины, которые будут выполнять эту функцию, тем ценнее они станут. В качестве примера первыми приходят на ум работы Энди Уорхола, хотя Пабло Пикассо и другие художники наверняка играли в эти игры до него. Картина должна быть написана в определенной стилистике и быть доступной для приобретения очень узким кругом лиц. Она становится своего рода аналогом денег и распознается так же мгновенно, как стодолларовая купюра.

Вот еще одна похожая современная тенденция. Информация о частной жизни и душевном состоянии обычных людей безостановочно собирается по всем цифровым сетям и становится валютой элитных кругов. Актуальность фактических данных в этих массивах не проверяется. Это и к лучшему, ведь актуальные данные подразумевают реальные обязательства.

Но иллюзия того, что мы храним чужие секреты, работает так же, как и современная живопись. Это новый аналог ценных бумаг, которыми торгуют богатые люди, и его ценность естественным образом возрастает. Обычным людям вход в эту сферу закрыт.

Немногие понимают, как глубоко проникает слежка ради создания этой новой разновидности валюты. На эту тему уже написано множество книг [1], а активисты развернули бурную деятельность [2], так что представлю ситуацию лишь в общих чертах, но дам нужные ссылки.

Даже безобидное посещение сайта авторитетного крупного издания, например «New York Times», приводит к тому, что целая стая конкурирующих между собой сервисов отслеживания начинают бороться за шпионские данные о вас. Ghostery, один из плагинов для запрета шпионской слежки, в настоящее время блокирует более тысячи подобных сервисов [3], а истинное их количество никому не известно.

Не существует и подробной карты шпионских сетевых сервисов. Их цели и роли сложны и разнообразны [4]. Никто не знает реального положения дел, хотя бытует распространенное мнение, что Google [5] исторически лидировала в сборе шпионских данных о пользователях открытого интернета [6], а в Facebook разработали способ толпами загонять людей под уникальный микроскоп [7]. При этом другие компании, о которых вы могли никогда и не слышать, например Acxiom [8] и eBureau [9], также целенаправленно собирают на вас досье.

Поскольку сегодня шпионская слежка за вами официально признается основным видом деятельности информационной экономики, любая попытка избежать этой слежки, например использование плагинов типа Ghostery [10], будет казаться покушением на саму идею интернета [11].

Большие массивы данных в науке

То, что кажется магией использования сетевых данных, находит разное применение в бизнесе и науке. Для работы с большими массивами данных в обеих этих сферах все чаще применяются почти неотличимые друг от друга инструменты, но действуют они по разным правилам. В науке важнее всего точность и контроль измерений. В бизнесе и культуре они в целом не столь важны.

Ученые используют новые технологии, чтобы изучить природу во всех подробностях, которые прежде были недоступны, но их так много, что без мощных компьютеров и цифровых сетей не стоит даже пытаться их изучить. Например, геномика – это раздел биологии, но она в то же время является и разделом информатики. Это же можно сказать и о дисциплинах на стыке материаловедения и энергетики.

В науке появление новых источников массивов данных означает тщательную работу исследователей, независимо от доступности технологии[50]. В медицине новые массивы данных регулярно меняют наши передовые гипотезы о лечении тех или иных заболеваний. И все же на появление новых способов лечения уходят годы. В науке большие массивы данных – словно магия, но она дается нам нелегко. Мы сражаемся с ней и ожидаем, что в начале останемся в дураках. Инструменты тщательной работы с большими массивами данных все еще активно дорабатываются.

Ни один ученый не считает большие массивы данных волшебной палочкой-выручалочкой. И подтверждений этому хватает. Самый яркий пример – медицина. Она совершенствуется, но катастрофически медленными темпами. Прогнозы погоды стали точнее по сравнению с прошлым, и их точность продолжает расти. Со спутников поступает информация, которую раньше не было возможности использовать в компьютерных моделях, способных обрабатывать большие объемы данных. В результате получаются более точные прогнозы погоды на следующую неделю и даже на весь следующий год. И все же погода преподносит сюрпризы. Большие массивы данных постепенно расширяют наши возможности по мере работы с ними, но не делают нас всеведущими. Гонка за статистическим результатом, который постоянно улучшается, но никогда не достигнет совершенства, лежит в основе современной облачной вычислительной среды. Большие массивы данных необходимо осваивать, чтобы они приносили пользу. Это не автоматический рог изобилия и не альтернатива человеческой проницательности.

Распространение вспышки гриппа можно отследить через интернет быстрее, чем с помощью традиционных медицинских систем [12]. В ходе исследовательского проекта Google обнаружилось, что вспышки гриппа можно эффективно отслеживать, отмечая соответствующую статистику поисковых запросов по географическим регионам. Если в каком-либо регионе внезапно повышается количество поисковых запросов о симптомах гриппа, вероятно, там началась вспышка заболевания. Этот сигнал можно наблюдать даже до того, как пойдет первая волна обращений к врачам.

ПОСКОЛЬКУ СЕГОДНЯ ШПИОНСКАЯ СЛЕЖКА ЗА ВАМИ ОФИЦИАЛЬНО ПРИЗНАЕТСЯ ОСНОВНЫМ ВИДОМ ДЕЯТЕЛЬНОСТИ ИНФОРМАЦИОННОЙ ЭКОНОМИКИ, ЛЮБАЯ ПОПЫТКА ИЗБЕЖАТЬ ЭТОЙ СЛЕЖКИ, НАПРИМЕР ИСПОЛЬЗОВАНИЕ ПЛАГИНОВ ТИПА GHOSTERY, БУДЕТ КАЗАТЬСЯ ПОКУШЕНИЕМ НА САМУ ИДЕЮ ИНТЕРНЕТА. последовательность и изменить стимулы, движущие вперед науку и коммерцию.

Яркий пример из недавнего прошлого – зарождение чтения мыслей. В самом начале века сообщалось о ряде все более впечатляющих экспериментов, связанных с «чтением мозга». Например, человек мог попытаться контролировать руку робота, и при этом можно было напрямую измерить показатели его мозговой активности. Но будет ли возможно посредством чтения мыслей измерить, что человек видит или представляет себе? Именно это больше подходит под определение «чтения мыслей».

Результаты начали появляться в начале 2010-х. Психолог Джек Галлант и другие исследователи из Калифорнийского университета в Беркли сообщили, что им почти удалось отследить, куда направлен взгляд человека, всего лишь проанализировав мозговую деятельность подопытного. Благодаря этому сложилось впечатление, что компьютеры стали медиумами. Но именно изучение проблем, связанных с использованием больших массивов научных данных, лучше всего поможет понять, как получается этот результат.

В ходе эксперимента Галланта на основании того, что видел человек, ученые проводили вычисления и создавали фильм. Показатели активности мозга они измеряли при помощи ФМРТ[51]. Изображения расплывались и выглядели странно, но действительно во многом совпадали с тем, что видел человек.

Работало это примерно так: каждому участнику эксперимента показывали несколько видеороликов. Их картины активности мозга каждый раз записывались. Затем подопытный смотрел новый ролик, который раньше не видел, и картины активности снова записывались. Затем эти ролики в нужной пропорции смешивались, в зависимости от того, насколько картина активности мозга каждого из подопытных для нового ролика совпадала с картиной для каждого из роликов, показанных в начале. Когда набиралось достаточно роликов, просмотренных до этого один за другим, при их объединении получался новый разнородный видеоматериал, непохожий на то, что раньше смотрел участник эксперимента.

Этот выдающийся результат был чрезвычайно важен, но это лишь первый этап научного исследования. Он не объяснял, как мозг кодирует визуальные воспоминания. Но действительно важно то, что ученым удалось измерить показатели активности мозга, которые соответствовали определенному типу визуального восприятия. Более того, подобные техники работают и со звуком, и с текстом, и с другими видами действий и переживаний. Эра высокотехнологичного чтения мыслей началась.

Джек Галлант первым отметил, что каким бы впечатляющим ни было их достижение, это не конец, а только начало. Есть надежда, что полный цикл научного осмысления пополнится новыми теориями и догадками.

В ожидании метода

Никогда не знаешь, сколько времени уйдет на формирование научных выводов о больших массивах данных. Наука жертвует знаковыми событиями, но поставляет их в совершенно произвольном порядке.

Большие массивы бизнес-данных появляются настолько быстро, насколько люди могут их принимать, но обычно даже быстрее. Благодаря ускоренным циклам обратной связи, значимость больших массивов бизнес-данных возрастает. Мы привыкли считать их обоснованными, несмотря на то что они могут всего лишь казаться таковыми из-за своего особого положения в сети. Подобные данные достоверны только за счет невероятного числа повторов.

Наука требует иного подхода к большим массивам данных, и мы его ищем. Для обработки этих массивов в области науки еще не выработана окончательно четкая процедура. И когда для работы с ними появятся проверенные практики, мы получим точные ответы на вопросы:

• Какие стандарты должны быть соблюдены для публикации тиражирования результата? До какой степени тиражирование должно требовать сбора разнообразных, но при этом похожих больших массивов данных, а не просто повторно использовать одни и те же данные, применяя к ним разные алгоритмы?

• Что такое публикация? Описание используемого кода? Сам код? Код в некой стандартной разновидности структуры, благодаря которой становится возможным использовать его повторно и вносить в него поправки?

• Должен ли анализ таких данных предполагать применение стандартных практик метаанализа?

• Какая документация в условиях непрерывного документального учета данных должна приводиться к единому стандарту?

Должны ли утверждаться новые практики, аналогичные двойному слепому методу или плацебо, помогающие ученым, работающим с большими массивами данных, не одурачить самих себя? Должны ли разработчики кода для получения независимых результатов работать небольшими группами, чтобы анализировать большие массивы данных, которые остаются в полной изоляции друг от друга?

В ближайшее время мы получим ответы на все эти вопросы, но пока что научные практики постоянно меняются. Но несмотря на то что детали еще не проработаны, ученых объединяет стремление проверять гипотезы, независимо от объемов данных, с которыми они работают.

Мудрые или внушающие страх?

В мире бизнеса большие массивы данных зачастую работают независимо от их достоверности. Люди платят деньги за пользование сайтами знакомств. Но алгоритмы, якобы подбирающие идеального партнера, на самом деле, скорее всего, не работают. Не имеет значения, права ли наука, пока клиенты за нее платят. А они платят.

Таким образом, нет нужды определять, достоверна ли статистика в собственно научном смысле, или кто-то лишь создал видимость достоверности, прибегнув к техникам социальной инженерии. Вот пример такого обмана: двое встречаются, зарегистрировавшись на сайте знакомств, потому что оба ожидают, что алгоритмы надежны. Люди адаптируются под информационные системы. Не важно, осознают ли они адаптацию и функционирует ли информационная система так, как ожидалось. Наука в этой системе ставится под сомнение.

Древний парадокс в новых обстоятельствах: сложно сказать, мудр ли правитель, или он просто внушает страх. Если то, что предсказывает правитель, действительно происходит, любое объяснение сгодится.

Предположим, некий продавец электронных книг рекламирует свой товар, и пользователь планшета проходит по ссылке для оплаты. В некоторой степени это может произойти, потому что продавец использует облачные сервисы, содержащие по-научному точный алгоритм прогноза, и составленная им модель целевой аудитории верна. Или же это может произойти, потому что пользователю сказали, что алгоритмы работают. Или потому что пользователь следует рекомендациям конкретного производителя планшетов. Возможно, пользователь в равной степени был готов купить сколько угодно других книг. Сложно сказать, какая причина важнее.

Инженеры решат, что роль сыграли умные программы. У них здорово получается дурачить себя верой в то, что это всегда так. В предыдущей книге я рассказывал о том, как сложно эмпирически отличить успех искусственного интеллекта от самовнушения, что программа работает.

Когда владельцы сервера-сирены убеждены в том, что этот сервер занимается научно обоснованными вычислениями – то есть анализом и прогнозированием событий, просвещающих человечество, – а сервер набирает все больше влияния, ничего полезного из этого не выйдет.

Иногда объективная проверка больших массивов бизнес-данных показывает, что эти замки в облаках никогда не существовали на самом деле. Поток хвастовства соцсетей, пытающихся продать рекламу, нескончаем. Продавцы громко заявляют, что их система способна создать подробнейшую модель целевой аудитории и выявить ее так же точно, как военный дрон – боевиков Талибана. Но эту же систему смогут легко и просто обмануть дети, выдающие себя за взрослых.

И все же фантазия о точности никуда не исчезает. В момент запуска сервера-сирены можно почти физически ощутить сладостное упоение властью. Это ваш пост перехвата информации. Информационное превосходство у вас в руках. Одна из сильнейших иллюзий нашего времени – считать, что это ты ведешь игру, а с тобой никто не играет.

Природа больших массивов данных бросает вызов человеческому восприятию

Говоря по-простому, стоит признать, что на Facebook существует две версии вас: на поддержание имиджа первой вы бросаете все усилия, вторая же – величайшая в мире тайна, а именно данные о вас, которые продаются третьим лицам, например рекламодателям. Этих данных о себе вы никогда не получите.

Но дело даже не в том, что их от вас скрывают. Сами по себе они не будут иметь никакого смысла. Они неотделимы от всех остальных глобальных данных, которые собирает Facebook. Исходя из поведения современных людей, самые ценные и охраняемые данные – это результаты статистических корреляций. Эта информация нужна для работы алгоритмов, но люди редко видят ее и еще реже могут ее осмыслить.

Возможно, люди с кустистыми бровями, которые осенью собирают мухоморы, действительно захотят добавить острый соус в картофельное пюре весной. Не исключено, что это правдивая информация, обладающая коммерческой ценностью, но никто и никогда не сообщит о подобном совпадении, если его обнаружит. Вместо этого продавец соуса теоретически сможет разместить рекламную ссылку прямо на виду у пользователя, повысив шанс, что она попадется правильному человеку, и никому не нужно знать, почему именно.

Коммерческие корреляции больших массивов данных почти всегда скрыты. Это крошечные математические составляющие программ, обеспечивающих прибыль или влияние тем или иным корпорациям – владельцам облачных серверов. Если ту или иную корреляцию отделить от остальных и раскрыть, какой от нее толк? В отличие от крупиц научных данных, это не компоненты четкой структуры, и они не обязательно сохранят смысл в отрыве от контекста.

Проблема с магией

Большие массивы данных, хотя и кажутся волшебством, запросто могут сбить с толку. Разве это не очевидно? Углядеть в чем-то магию – значит достигнуть пределов собственного понимания.

Когда статистическую корреляцию путают с пониманием, за это приходится дорого расплачиваться. Примером такой путаницы стала череда финансовых кризисов в начале двадцать первого века. Гигантские инвестиционные пакеты, созданные за счет корреляций, оказались пустышками. Из-за них весь мир оказался в долгах, что привело к введению жестких экономических мер. И все же виноваты в этом далеко не всегда финансисты, хотя бы потому что финансовые механизмы были сложными и почти полностью автоматизированными.

Можно задать закономерный встречный вопрос, почему в большие массивы бизнес-данных все еще верят и продолжают их применять, даже несмотря на то, что они уже доказали свою полную несостоятельность. Ответ очевиден: потому что большие массивы бизнес-данных помогают очень быстро и в большом масштабе получить влияние и деньги.

Игра началась

Почему большие массивы бизнес-данных часто оказываются несостоятельными? Их ненадежность – коллективный проект, в котором мы все принимаем участие. Все дело в коллективном разуме.

Владелец потенциального сервера-сирены сначала может выгодно пользоваться честным доступом к данным в качестве невидимого наблюдателя. Но если ему повезет преуспеть и его сервер действительно станет сиреной, все изменится. Поднимется волна манипуляций, и собранные данные станут сомнительными.

Если работа сервера основана на отзывах, среди них появится множество фальшивых. Если в основе его работы лежит стремление к известности, то внезапно там окажется множество фальшивых заискивающих поклонников, поддерживающих иллюзию популярности. Если сервер пытается вычислить самых кредитоспособных или привлекательных людей, ждите, что их профили окажутся по большей части липовыми. Подобные иллюзии создают или умные третьи лица, чтобы внести в работу сервера какое-то оживление, или же те, кто хочет извлечь из сетевой жизни пусть и небольшую, но выгоду.

В любом случае, как только сервер-сирену дурачат фальшивыми данными, игра начинается. Владельцы сервера нанимают математиков и специалистов по искусственному интеллекту, которые пытаются отфильтровать ложь, заочно оперируя чистой логикой. Но не нужно путать ложь и глупость. Тут же неизбежно стартует «гонка вооружений», в которой коллективный разум обманщиков пытается перехитрить нескольких умных программистов, и баланс сил с каждым днем меняется.

Примечательно не то, что люди продолжают играть в цифровых сетях в старые как мир игры, а то, что предприниматели все еще верят иллюзии, что именно они – единственные, кто ведет игру, а все остальные пассивно мирятся с ролью объектов, изучаемых ради выгоды удаленного наблюдателя. Ничего никогда не бывает просто.

Неожиданный поворот

Долгое время меня волновала проблема, связанная с тем, что интернет уничтожил больше рабочих мест, чем создал. Потому я живо интересовался проектами, которые могли бы обратить этот процесс вспять. Kickstarter – важный в этом отношении эксперимент. Первоначально основатели проекта хотели, чтобы благотворительность работала эффективнее. Мы же сейчас сосредоточимся на том, как Kickstarter помогает в финансировании новых бизнес-проектов. Предприниматели получают деньги от множества людей, обещая им результат своей работы, но способ, которым они этого добиваются, не имеет ничего общего с традиционными представлениями о финансировании[52]. Первые поддержавшие кампанию не получают доли в капитале, но зачастую им достается что-нибудь конкретное, например «первое издание» или новый продукт. Разве не замечательный пример того, как сеть помогает новаторам-оригиналам добыть деньги нетрадиционными способами? Что же тут не так?

На самом деле мне нравится этот проект и особенно нравится, что мой друг Кит Макмиллен смог с его помощью выпустить на рынок специальную клавиатуру для использования с музыкальными программами, так называемый пэд-контроллер. Кит – известный мастер по изготовлению музыкальных инструментов с многолетним опытом, и у него возникла идея нового музыкального устройства, получившего название QuNeo. Вместо того чтобы по старинке представлять материал инвесторам, он воспользовался платформой Kickstarter и представил его непосредственно будущим покупателям. Они оценили материал, и проект контроллера QuNeo стал одной из первых историй успеха на Kickstarter. Множество людей заплатили деньги вперед и встали в очередь, чтобы приобрести устройство, которого еще даже не существовало, став одновременно и покупателями, и псевдоинвесторами.

Kickstarter неидеален как инструмент финансирования разработок новых продуктов. Было бы даже лучше, если бы он поддерживал создание страховых пулов для многочисленных проектов, а также систему страхования или управления рисками для пользователей. Серверы-сирены страдают от заблуждения, что кто-то другой всегда может принять на себя риск и что игнорируемый риск никогда по тебе не ударит. Даже если так, это просто замечательный пример расширения границ капитализма с помощью интернета.

Но все не так уж и здорово. В тот же месяц, когда первые контроллеры QuNeo отправились к первым покупателям, в тематическом блоге об информационных технологиях Gizmodo появился анонс о бойкоте кампаний на Kickstarter[53]. Причиной стало огромное множество низкокачественных предложений на сайте. Поиск по-настоящему ценных проектов в этой куче фальшивок и откровенного мусора потерял всякий практический смысл.

Это тот случай, когда переход к цифровым технологиям отодвинул в сторону классическую проблему рынков до-цифровой эпохи. Предполагаемая прозрачность, заложенная в структуру современной информационной экономики, оказалась совершенно бесполезной.

Эта проблема известна как «рынок лимонов», по названию знаменитой научной работы, за которую ее автор Джордж Акерлоф получил Нобелевскую премию [13] по экономике. Лимоны, о которых идет речь в этой работе, совершенно не имеют отношения к ларьку с лимонадом, с которым вы познакомились несколькими главами раньше. Речь в ней шла о торговле подержанными автомобилями с заводскими дефектами, которые также называют «лимонами». В исследовании подробно рассказывалось, как засилье на рынке низкокачественных подержанных автомобилей запустило механизм рыночной асимметрии, нарушив рыночные процессы.

ПРЕДПРИНИМАТЕЛИ ВСЕ ЕЩЕ ВЕРЯТ ИЛЛЮЗИИ, ЧТО ИМЕННО ОНИ – ЕДИНСТВЕННЫЕ, КТО ВЕДЕТ ИГРУ, А ВСЕ ОСТАЛЬНЫЕ ПАССИВНО МИРЯТСЯ С РОЛЬЮ ОБЪЕКТОВ, ИЗУЧАЕМЫХ РАДИ ВЫГОДЫ УДАЛЕННОГО НАБЛЮДАТЕЛЯ. НИЧЕГО НИКОГДА НЕ БЫВАЕТ ПРОСТО.

Покупатели волновались, что продавцы знали о дефектах больше, чем рассказывали. Это постоянно усложняло рыночные процессы, мешало их ходу и снижало их эффективность. Действительно прозрачная разновидность цифрового рынка, возможно, могла бы затормозить подобный спад. По крайней мере, во времена первых сетевых исследований, до появления серверов-сирен, такая надежда еще была.

На самом деле цифровые сети помогли частично избавиться от страха получить «лимоны» на физическом рынке подержанных автомобилей. Например, сейчас вы можете мгновенно получить информацию о состоянии машины [14]. Но серверы-сирены избегают подобных усовершенствований. Их стремление возложить риски на кого-то другого только усугубляет проблему с «лимонами».

Каждая кампания, подобная QuNeo, используется как прикрытие для кучи дрянных проектов, которые постепенно становятся пятнами на репутации новых проектов уровня того же QuNeo. Что делать, если проект не будет закончен? И если человек, поддержавший его деньгами, никогда не получит своего устройства? Есть ли какие-то ресурсы? Может ли инновационный центр перекладывать риск на других?

Kickstarter экспериментировал с изменением правил, которые помогли бы снизить риски для людей, поддерживающих кампании. Например, изобретателям в какой-то момент внезапно запретили размещать реалистичные изображения конечного продукта. Подобное правило, предположительно, снижало риск впасть в заблуждение, что проект ближе к завершению, чем это есть на самом деле. Даже если это правило и дает желаемый результат, не абсурдно ли отказывать изобретателям в возможности показать, что же именно они намерены создать? Но эта стратегия не поможет серверу-сирене избежать возможных рисков. Вот вопрос и ответ с сайта Kickstarter о политике проекта.

– Как Kickstarter узнает о том, что перед нами имитация или модель [… а не фотография или физический прототип]?

– Мы не можем узнать этого. Мы лишь проводим быструю проверку на соответствие проекта нашим указаниям.

Я хотел бы увидеть, как Kickstarter перерастет Amazon, поскольку он воплощает более фундаментальный механизм всеобщего экономического роста. Он не снижает цены, а превращает покупателей в спонсоров инноваций. Но при масштабах, подобных Amazon, неизбежно придется иметь дело с куда большим наплывом мошенников и дилетантов.

На Kickstarter продолжают появляться как невероятно успешные проекты, так и великое множество мошеннических предложений или проектов, обреченных на неудачу. Возможно, сайт, если его масштабы вырастут, будет вести бесконечную борьбу с обманщиками и дилетантами и в конечном итоге потеряет всякую ценность. А может, у него появится система голосования или автоматические фильтры, которые будут отсеивать мусор. Правда, потом выяснится, что этот мусор сможет подстроиться под требования сайта и все же добьется своего. А может, стоимость пользования Kickstarter вырастет, он перестанет быть наивным и «демократичным», и уже живые люди начнут блокировать бесполезные предложения. Может быть, его основатели научатся вместе с выгодой принимать на себя хоть и небольшой, но риск. Что бы ни произошло, успех будет зависеть от того, удастся ли найти жизнеспособный компромисс, пусть он и не будет идеальным.

Природа нашего замешательства

Масштабным и успешным сетевым проектам в конечном итоге приходится противостоять наплыву мошенников. Недобросовестные «контент-фермы» оказываются информационным мусором и размещают ссылки на самих себя, чтобы занять верхнюю строку в выдаче результатов поиска Google. Блогеры, которых крупнейшие медиакорпорации сгоняют в один уголок сети, начинают приправлять свои посты ключевыми словами и фразами, не для того чтобы привлечь внимание читателей, а чтобы их обнаружили алгоритмы Google.

К чести Google, компания начала бороться с подобными злоупотреблениями, но эта война никогда не закончится. Когда Google измеряет людей и от результата измерений иногда зависит распределение богатства и власти, люди не будут сидеть и ждать беспристрастной оценки. Они начнут свою игру

На сайтах с отзывами полно фальшивок. Когда образование функционирует за счет больших массивов данных, преподаватели должны не просто готовить учеников к тестам. Но в системе образования нередко вскрываются факты масштабного обмана.

Странно, что подобное часто шокирует как программистов, так и предпринимателей в области технологий. Мы, гики, предпочитаем, чтобы мир пассивно ждал, пока наши навыки его обгонят, но такого никогда не происходит.

Мы заблуждаемся, главным образом представляя себе большие массивы данных как природный ресурс, который надо добывать. Мы поддерживаем эту иллюзию, регулярно используя термин «добыча данных». И на самом деле некоторые данные действительно можно сравнить с полезными ископаемыми. Например, большие массивы научных данных о возникновении галактик, погоде или вспышках гриппа можно при определенном старании добывать как золото.

Большие массивы данных о людях имеют совершенно другую природу. Они не укладываются в это представление и играют против вас. Эти данные напоминают не материал под микроскопом, а скорее диспозицию фигур на шахматной доске.

Понять их особенность поможет оптическая иллюзия.



Это знаменитая иллюзия фигуры и фона, которая стала популярной в 1915 году благодаря датскому психологу Эдгару Рубину. Контур принимает вид или золотой вазы, или двух лиц. Ни одна из интерпретаций не будет единственно правильной. (В данном случае я поместил на рисунок лицо Адама Смита.)

Точно так же облачная информация, создаваемая людьми, может восприниматься либо как ценный ресурс, который можно украсть, например как золотую вазу, или же как волны человеческого поведения, направленные в основном против вас. В абстрактном смысле оба варианта восприятия имеют право на существование.

Однако если вы заинтересованный участник игры, в ваших же интересах в первую очередь обратить внимание на эти лица.



Вот еще одна формулировка главной идеи этой книги: данные, касающиеся людей, лучше всего воспринимать как замаскированных людей, которые постоянно что-то замышляют.

Наивность элитных кругов

Внимательные читатели заметят постоянный сдвиг точек зрения, когда я высмеиваю заблуждения, касающиеся больших массивов данных о людях. Иногда я пишу с точки зрения рядового человека, как будто жалуясь на то, что меня анализируют и рассматривают как пешку в информационной игре. Но бывает, что я пишу так, как будто сам веду эту игру, и меня раздражает, что ее портят мои соперники.

Никто не мог предсказать, как будут взаимодействовать технологии цифровых сетей и экономика. Вместо истории о негодяях я вижу историю техногиков и предпринимателей, ставших первопроходцами. И на их успехах и ошибках нам предстоит учиться.

Я говорю не столько о необходимости «бороться против власти», сколько о том, что более глубокое понимание технологий пойдет на пользу большинству населения, в том числе и тем амбициозным людям, которые планируют великие свершения. Так что я выступаю и с позиции важной фигуры, и с позиции обычного человека, поскольку любое решение должно учитывать обе эти точки зрения.

Большие массивы данных, то самое свободное пространство в форме вазы, – основное средство разрешения конфликтов влияния и власти нашего времени. Финансовая деятельность перестала быть решением уникальных задач финансистов и сейчас связана с тем, насколько эффективно они могут предоставить выгодную работу ученым, работающим с большими массивами данных, и техногикам. Политики вычисляют свою аудиторию, используя те же алгоритмы, которые оценивают людей для выдачи кредитов или страховых полисов. Список постоянно пополняется.

По мере совершенствования технологий серверы-сирены будут все больше становиться объектами борьбы за власть и богатство, поскольку они – единственные звенья в цепи, которые не станут общедоступными. Если современные тенденции сохранятся, у вас всегда будет возможность добиваться информационного превосходства, как магнаты старых времен добивались превосходства во владении землей и природными ресурсами. В новом энергетическом цикле нефть рано или поздно перестанет быть ключевым фактором геополитики, а информационная система, управляющая новой разновидностью энергии, сможет легко превратиться в неприступную крепость. Иллюзорная золотая ваза обретает все большую ценность.

Третья интерлюдия