Десять уравнений, которые правят миром. И как их можете использовать вы — страница 34 из 49

».

Такие категории оставляли у многих пользователей Facebook ощущение дискомфорта, и, что важнее для выгоды компании, они не были полезны рекламодателям. К 2019 году Facebook пересмотрел свою категоризацию, сделав ее более ориентированной на конкретный продукт. Знакомства, воспитание, архитектура, ветераны войн, защита окружающей среды – вот некоторые из нескольких сотен категорий, которые использует компания для описания пользователей.

Одна из возможных реакций на такую типизацию – говорить, что все это неправильно, и кричать: «Я не наблюдение, не точка данных, я человек, личность!» Не хочу вас огорчать, но вы не так уникальны, как вам может показаться. Вас разоблачает то, как вы ведете себя в интернете. Есть и другие люди с тем же сочетанием интересов, что и у вас, с тем же любимым фильтром для фотографий, которые делают столько же селфи, что и вы, подписаны на тех же знаменитостей и щелкают по той же рекламе. По сути, это не один человек, а много людей, объединенных Facebook, Snapchat или другими используемыми приложениями.

Бессмысленно расстраиваться или сердиться на то, что вы наблюдение в матрице. Вы должны принять это. Чтобы понять почему, необходимо подумать о группировании людей с какой-нибудь другой точки зрения, об ином способе разделения на категории.

Представьте, что матрица M содержит не социальные интересы Мэдисон, Тайлера и других детей, а их гены. Современные генетики действительно рассматривают нас как отдельные наблюдения: матрицы из 1 и 0, которые указывают, есть ли у нас определенные гены. Взгляд на людей с помощью такой корреляционной матрицы спасает жизни. Этот подход позволяет ученым определять причину заболеваний, подбирать лекарства, подходящие для вашей ДНК, и лучше понимать развитие различных форм рака.

Это также помогает нам ответить на вопросы о наших предках. Ной Розенберг со своими коллегами из Стэнфордского университета построили матрицу из 4199 различных генов и 1056 людей со всего мира. Для любого из этих генов в исследовании найдутся минимум два человека, у которых они отличны. Это важно, поскольку у всех людей есть множество общих генов (они делают нас людьми). Розенберг специально искал различия между людьми и то, как на них влияет место рождения и проживания. Чем африканцы отличаются от европейцев? А выходцы из разных частей Европы? Можно ли объяснить различия в генах тем, что мы обычно называем расой?

В поисках ответа Ной сначала использовал уравнение 7, чтобы найти корреляцию между людьми в терминах общих генов[139]. Затем он применил метод, который называется дисперсионным анализом (ANOVA, от Analysis of Variance), чтобы посмотреть, объясняются ли эти различия географическим местом происхождения. На такой вопрос не бывает ответов «да» или «нет». ANOVA дает ответ в виде определенного процентного соотношения – от 0 до 100 процентов. Хотите попробовать угадать, какая часть нашей генетики объясняется нашими предками? 98 процентов? 50? 30? 80?

Ответ – примерно 5–7 процентов. Не больше. Результаты Ноя подтверждены и другими исследованиями. Да, некоторые гены создают весьма заметные изменения между расами, самые яркие примеры – гены, регулирующие производство мелатонина и цвет кожи. Но когда дело доходит до категоризации людей, концепция расы приводит к путанице. Географическое происхождение наших предков не объясняет различия между нами.

Возможно, с моей стороны слегка снисходительно объяснять наивность расовой биологии в XXI веке, но, к сожалению, некоторые верят, что определенные расы по своей природе обладают, например, сниженным интеллектом. Эти люди расисты, и они ошибаются. Есть и другие типы – «Я не расист, но…» – которые считают, что признание равенства между расами нам навязано учителями или обществом. Одним из таких людей был ушедший на пенсию профессор, который писал для Quillette (см. главу 3). Они считают, что мы подавляем дискуссии о различиях между расами ради политкорректности.

По сути, место, откуда пришли наши предки, отвечает только за крохотную часть разнообразия наших генов. Более того, гены не полностью определяют нашу личность. Наши ценности и поведение формируются опытом и встреченными людьми. То, кем мы стали, имеет мало общего с биологической расой или нашими предками.

Люди, не достигшие двадцати лет, – как мои воображаемые тинейджеры Джейкоб, Алисса, Мэдисон и Райан, – представляют новое поколение Z, следующее за миллениалами. Для них крайне важно быть личностями. Они явно не желают, чтобы на них смотрели с точки зрения гендера или сексуальной ориентации. Один из опросов 300 представителей поколения Z в США показал, что только 48 % из них идентифицировали себя как абсолютных гетеросексуалов, а треть опрошенных предпочли отвести себе место на шкале бисексуальности[140]. Более трех четвертей согласились с утверждением, что «гендер не определяет человека в той степени, как раньше». Можно слышать, как моя возрастная группа – поколение X – выражает скептицизм по поводу «отказа» поколения Z видеть гендерные различия. Опять же есть мнение, что представители Z пытаются быть политкорректными и при этом отрицают биологические факты.

Существует другой способ увидеть эту смену поколений. У поколения Z гораздо больше информации, чем было в молодости у моего поколения. «Иксы» росли в рамках ограниченного количества типов, предоставленных телевидением и умеренным личным опытом, а «зеты» засыпаны примерами разнообразия и индивидуальности.

Поколение Z считает эту индивидуальность более важной, чем поддержание гендерных стереотипов.

Успех рекламных категорий Facebook, основанный на корреляции наших интересов, предполагает, что взгляд поколения Z на мир статистически правильный. Дуглас Коэн, который работал в рекламной службе Facebook до перехода в Snapchat, рассказал мне, что рекламодатели его бывшего работодателя конкурируют друг с другом за гипертаргетинг своей рекламы по небольшим группам по интересам, определенным в матрице корреляций компании. Цена за охват целевой аудитории может удваиваться или утраиваться, поскольку рекламодатели конкурируют за право общаться непосредственно с любителями рукоделия, боевиков, серферами, игроками в онлайн-покер и многими другими группами. Для рекламодателей идентификация людей стоит больших денег.

Верная категоризация пользователей в соответствии с тем, что они реально любят, и деятельностью, которая им нравится, может быть крайне эффективной и справедливой. Корреляции помогут нам найти группы с общими интересами и целями, так же как ученые используют корреляции между генами, чтобы установить причины заболеваний.

* * *

Парламент может быть страшным местом для молодого специалиста по данным.

– Прошло не так много времени с тех пор, как таблички в Вестминстере называли обычных граждан «посторонними», – сказала мне Николь Нисбетт, когда я встретился с ней в Лидсском университете. – Все меняется, и персонал Вестминстера активно обращается к общественности и исследователям, но эти таблички показывают историческую настороженность по отношению к посторонним.

Николь уже два года работает над диссертацией, проводя половину времени в Лидсе, а половину – в Палате общин. Теперь у нее есть пропуск с «доступом к большинству мест» в Палате. Ее задача – улучшить то, как члены парламента и остальной постоянный персонал прислушиваются к внешнему миру и взаимодействуют с ним. До того как Николь начала свой проект, многие сотрудники, занятые в повседневной работе правительства, ощущали, что все комментарии, оставленные публикой в Facebook или даже на их собственных дискуссионных форумах, были слишком обременительными, чтобы с ними работать.

– Оставалось также ощущение, будто они уже знали, что люди собираются им сказать, – сказала Николь, – и отсеивание всех негативных комментариев и оскорблений было трудной задачей.

Работа с данными дала Николь опыт и, соответственно, другую точку зрения. Она понимала, что количество комментариев в Twitter и Facebook может быть ошеломительным для любого, но также умела находить корреляции. Николь показала мне созданную ею карту, в которой резюмировались споры о запрете изделий из натурального меха. Она заложила в матрицу все слова, употребленные в дискуссии, и посмотрела, как коррелировалось их использование. Связями соединялись слова, которые использовались вместе. «Мех» обнаруживался в одном кластере с «продажей», «торговлей», «промышленностью», которые далее соединялись с терминами «варварский» и «жестокий». Другой кластер объединял слова «страдание», «убийство» и «красивый». Третий связывал «благосостояние», «законы» и «стандарты». В каждом кластере объединялась определенная ветвь аргументации.

В одной области карты Николь рядом стояли слова «смерть от тока» и «анальный». Их соединяла толстая линия. Я уставился на них, пытаясь понять, какой вывод от меня желает услышать Николь.

– Сначала мы думали, что эти слова используют тролли, – сказала она.

В любой дискуссии всегда найдутся люди, которые пытаются накручивать оппонентов, часто с помощью оскорбительной лексики. Однако в спорах с руганью, как правило, наблюдалась меньшая корреляция между словами – оскорбления были буквально случайны, – а эти два слова повторялись широким кругом разных людей. Когда Николь взглянула на фразы, их содержащие, она обнаружила информированную группу людей, обсуждавших реальную проблему: выращенных на ферме лисиц и енотов убивали, вставляя в тела электроды и подавая высокое напряжение. Это добавило новое измерение в обсуждение парламентского персонала, которое они никогда бы не заметили без работы Николь.

– Я избегаю предположений о том, что напишут люди; моя работа – объединить тысячи мнений, чтобы парламент мог быстрее реагировать на такую дискуссию, – говорит Николь.

В ее анализе собраны разные взгляды – не потому, что «политически корректно» выслушивать все стороны в споре, а потому, что статистически верно выделять важные мнения. Взгляды меньшинства получают свое выражение, потому что они реально способствуют разговору. Корреляции дают беспристрастное представление обо всех сторонах дискуссии, нам не нужно занимать какую-то политическую позицию, решать, какие взгляды стоит или не стоит рассматривать.