– Это детские шаги. Нельзя с помощью статистики решить всё, – заметила Николь. И рассмеялась: – Никакой анализ данных не сможет помочь с брекситом!
Социологи делают всё возможное, чтобы найти статистически верное объяснение данным. Я познакомился с Би Пуранен из Института исследований будущего в Стокгольме, когда мы вместе ехали в Санкт-Петербург на конференцию по политическим переменам. Исследователи в институте, который мы посетили, финансировались непосредственно из средств, выделенных Дмитрием Медведевым, который был президентом России, когда Владимир Путин занимал пост премьер-министра. Однако настроения молодых докторантов были направлены резко против истеблишмента. Они нуждались в демократических переменах и страстно рассказывали, как подавляют их взгляды. Я сам был свидетелем, как тщательно Би разбиралась в конфликтах, симпатизируя собеседникам, но принимая при этом реалии проведения исследовательского проекта в современной России.
Для Би было жизненно важно, чтобы российские исследователи, с которыми она работала, безотносительно к их политическим взглядам вели проект «Всемирный обзор ценностей» точно так же, как и во всех странах-участницах (их почти сто). Задавая людям со всего мира один и тот же набор вопросов, многие из которых относились к таким деликатным темам, как демократия, гомосексуальность, иммиграция и религия, Би и ее коллеги хотели понять, как меняются ценности в разных странах планеты[141]. Даже самый политически мотивированный исследователь быстро понимал: данные нужно собирать как можно более нейтрально.
В обзоре было 282 вопроса, поэтому корреляции давали удобный способ обобщать сходства и различия между ответами. Двое из коллег Би – Рональд Инглхарт и Кристиан Вельцель – обнаружили, что люди, делающие упор на семейные ценности, национальную гордость и религию, чаще имеют моральные возражения против разводов, абортов, эвтаназии и самоубийства. Корреляции в ответах на такие вопросы позволили Инглхарту и Вельцелю классифицировать граждан разных стран по шкале традиционализм – светскость[142]. Такие страны, как Марокко, Пакистан или Нигерия, склонны к традиционализму, а Япония, Швеция и Болгария более светские. Этот результат ни в коем случае не означает, что все люди в какой-то стране придерживаются одинаковых взглядов; однако он дает статистически верную суммарную сводку мнений, доминирующих в этом государстве.
Крис Вельцель нашел еще один вариант корреляции вопросов и ответов. Люди, которых беспокоит свобода слова, тоже склонны ценить воображение, независимость и гендерное равенство в образовании, а также терпимы к гомосексуализму. Ответы на эти вопросы, которые Вельцель отнес к эмансипационным ценностям, коррелировали положительно. К странам с высокими эмансипационными ценностями относятся, например, Великобритания, США и Швеция.
Действительно важным моментом здесь оказалось то, что первая ось (традиционализм – светскость) не коррелировала со второй – эмансипацией. Например, в начале нового тысячелетия русские и болгары отличались высокими светскими ценностями, но не ценили эмансипацию. В США свобода и эмансипация важны почти для всех, но при этом страна остается традиционалистской в том смысле, что многие граждане отдают приоритет религиозным и семейным ценностям. Скандинавские страны – яркие примеры государств и со светскими, и с эмансипационными ценностями, а Зимбабве, Пакистан и Марокко находятся на противоположном конце спектра, где ценят и традиции, и послушание властям.
Разделение ценностей по двум независимым осям натолкнуло Би Пуранен на одну идею. Она захотела узнать, как изменились ценности мигрантов после их появления в Швеции. В 2015 году в стране попросили убежища 150 тысяч человек, в основном из Сирии, Ирака и Афганистана (это примерно 1,5 % населения Швеции); и все они прибыли из трех стран с совершенно иным набором культурных ценностей по сравнению с ценностями их нового дома.
Когда уроженцы западных стран смотрят на этих иммигрантов, то часто замечают проявления, связанные с их традиционными ценностями (хиджабы, новые мечети). Такие наблюдения приводят некоторых к выводам, что, например, мусульмане не могут приспособить свои ценности к новой родине. Внешний вид может демонстрировать, как иммигранты пытаются сохранить свои традиции, однако единственный статистически верный способ понять их внутренние ценности – поговорить с ними и спросить, что они думают. Именно этим занимались Би и ее коллеги. Они опросили 6501 из тех людей, которые приехали в Швецию за последние десять лет, задавая им вопросы об их ценностях.
Результаты были поразительными. Многие иммигранты разделяли типичное европейское стремление к гендерному равенству и терпимость к гомосексуальности, не принимая при этом крайнего шведского секуляризма. Они сохраняли свои традиционные ценности – те, что видны посторонним, – которые касаются важности семьи и религии. По сути, типичная иракская или сомалийская семья, живущая в Стокгольме, имеет очень схожие ценности с обычной американской семьей, проживающей в Техасе.
Мусульмане не единственная группа меньшинств, которую не воспринимают статистически верно. Я часто слышу, как в разговоре об американцах-христианах смешивают противников абортов и гомофобов. Мишель Дилон, профессор социологии из Университета Нью-Гэмпшира, показала, что одни религиозные группы, выступающие против абортов, одобряют однополые браки, а другие против них[143]. В целом аборты и права сексуальных меньшинств внутри религиозных групп рассматриваются как разные вопросы.
По мере того как наша жизнь все больше перемещается в интернет, доступные данные о нас также расширяются: с кем взаимодействуем в Facebook, что нам нравится, куда ходим, что покупаем – и список можно продолжать. Facebook, Google и Amazon сохраняют все социальные взаимодействия, все запросы и потребительские решения. Это мир больших данных. Нас теперь определяют не возраст, гендер или место рождения, а миллионы наблюдений, фиксирующих все наши действия и мысли.
«Десятка» быстро приступила к проблеме больших данных. Ее участники составили матрицу населения мира. Они объединяли людей по интересам. Им казалось, будто расизм и сексизм ушли в прошлое. Они измеряли, как общество развивается, чтобы стать более толерантным: справедливым и уважающим личность людей. «Десятка» действовала статистически правильно.
Новый порядок во многом финансировался рекламой, адаптированной под конкретного человека. Рекламодатели начали тендерные войны за право показывать свои продукты небольшим целевым группам пользователей Facebook. Чтобы доставлять информацию с хорошей точностью, стали привлекать других статистиков и специалистов по данным. Родилась новая область – реклама с микротаргетированием. Сначала выявляются потенциальные клиенты и им подается только нужная информация в нужное время – чтобы максимизировать их заинтересованность.
Участники «Десятки» снова победили, добавив к списку решенных ими задач рекламу и маркетинг. На этот раз даже кажется, что отчасти мораль на их стороне. Но возникла одна проблема. На числа в этой матрице смотрели не только участники «Десятки». И не все люди, видевшие ее корреляции, правильно понимали наблюдаемые закономерности…
Исследование Ани Ламбрехт посвящено правильной интерпретации больших данных. В качестве профессора маркетинга в Лондонской школе бизнеса она изучала, как данные используются повсюду – от брендовой одежды до спортивных сайтов. Аня объяснила мне в электронном письме, что, несмотря на очевидные выгоды от использования больших массивов данных в рекламе, важно учитывать и ограничения. «Данные без умения извлекать надлежащие выводы не особо полезны», – сказала она.
В одной из своих научных статей, из которой взят следующий пример, Ламбрехт с коллегой Кэтрин Такер объясняет возникающие проблемы, используя сценарий из торговли в интернете[144]. Представьте себе розничного продавца игрушек, обнаруживающего, что пользователи, которые видят больше его рекламы в Сети, покупают у него активнее. При этом он установил корреляцию между рекламой и приобретением игрушек, в итоге его маркетинговый отдел «больших данных» пришел к выводу, что кампания работает.
А теперь посмотрим на эту рекламу под другим углом. Возьмем Эмму и Джулию: они незнакомы друг с другом, но у них есть семилетние племянницы. Бродя в Сети в последнее воскресенье перед Рождеством, они, независимо друг от друга, видят рекламу компании игрушек. Эмме предстоит напряженная рабочая неделя, у нее нет времени на магазин. Джулия в отпуске и большую часть свободного времени тратит на поиски рождественских подарков. Увидев три-четыре раза рекламу игры «Четыре в ряд», Джулия переходит по ссылке и решает приобрести ее. Эмма же отправляется в какой-то магазин днем 23 декабря, видит модель дома на колесах фирмы Lego и покупает ее.
Джулия видела рекламу гораздо чаще Эммы, но можно ли сказать, что та эффективна? Нет. Мы понятия не имеем, что делала бы Эмма, будь у нее время смотреть рекламу. Те специалисты по «большим данным», которые заключили, что их кампания действует, перепутали корреляцию с причинностью. Мы не знаем, реклама ли заставила Джулию купить игру «Четыре в ряд», и поэтому не можем сделать вывод об ее эффективности.
Разделить корреляцию и причинно-следственную связь сложно. Та корреляционная матрица, которую я заполнил выше для Мэдисон, Райана и их друзей, основана на очень малом числе наблюдений, и мы не можем делать глобальных выводов только из нее (помните уравнение уверенности?). Однако представьте, что такую матрицу построили по очень большому количеству пользователей Snapchat, и мы обнаружили, что Пьюдипай коррелирует с Fortnite. Можно ли сделать вывод, что р