Внутри Instagram, Snapchat и Facebook создается матрица наших интересов. Это набор чисел в виде таблицы, где в строках – люди, а в столбцах – типы «постов» или «снимков», на которые они нажимают. В математике мы представляем таблицу подростковых кликов в виде матрицы, которую обозначим M. Вот пример для иллюстрации в гораздо меньшем масштабе: так выглядит матрица некой соцсети для двенадцати пользователей.
Каждое число в матрице показывает, сколько раз подросток кликнул по конкретному типу постов. Например, Мэдисон посмотрела 8 постов о еде, по 6 о косметике и Кайли Дженнер, ни одного о ютьюбере Пьюдипае и видеоигре Fortnite и 2 публикации о рэпере Дрейке.
Просто глядя на эту матрицу, мы можем получить хорошее представление о том, что за человек Мэдисон. Попробуйте представить ее себе, а потом потратьте несколько секунд, чтобы вообразить некоторых других персонажей, которых я ввел здесь, используя в качестве ориентиров просмотренные ими снимки. Не беспокойтесь. Это не настоящие люди. Вы можете быть сколь угодно категоричными.
В матрице есть еще несколько человек, похожих на Мэдисон. Например, Сэм любит косметику, Кайли Дженнер и еду, но проявляет незначительный интерес к другим категориям. Есть и люди, которые резко отличаются от Мэдисон. Джейкоб, как и Лорен, предпочитает Пьюдипая и Fortnite. Некоторые не совсем вписываются в два этих типа. Скажем, Тайлер любит Дрейка и косметику, но интересуется Пьюдипаем.
Уравнение рекламы – математический способ автоматически определять тип людей. Оно имеет следующую форму:
Оно измеряет корреляцию между различными категориями снимков. Например, если люди, которые обычно ставят лайк Кайли Дженнер, также ставят лайк и косметике, то rкосметика, Кайли будет положительным числом. В этом случае мы говорим, что существует положительная корреляция между Кайли и косметикой. Но если люди, которые ставят лайки Кайли, обычно не ставят их Пьюдипаю, rПьюдипай, Кайли будет отрицательным числом, и мы назовем это отрицательной корреляцией.
Чтобы понять, как работает уравнение 7, разберем его шаг за шагом начиная с Mi,x. Это число в строке i и столбце x нашей матрицы M. Мэдисон 6 раз просматривала посты о косметике, поэтому MМэдисон, косметика = 6: у нас строка i = Мэдисон, а столбец x = косметика. В общем случае каждый раз, когда мы смотрим на число в строке i и столбце x матрицы, то видим Mi,x. Взглянем на Эта величина – среднее число постов в категории x, приходящееся на одного пользователя. Например, среднее число просмотренных публикаций о косметике для наших подростков таково: = (6 + 6 + 0 + 0 + 9 + 6 + 7 + 3 + 0 + 4 + 7 + 0)/12 = 4.
Если мы вычтем среднюю заинтересованность в косметике из общего числа публикаций, просмотренных Мэдисон, то получим Mi,x – = 6–4 = 2. Это говорит нам, что Мэдисон интересуется косметикой выше среднего. Аналогично, вычислив = 5, мы видим, что она также (слегка) выше среднего интересуется Кайли Дженнер, поскольку Mi,y – = 6–5 = 1, если i = Мэдисон, а y = Кайли.
А теперь переходим к мощной интересной идее, лежащей в основе уравнения 7: если мы перемножим (Mi,x – ) ∙ (Mi,y – ), то определим те интересы, которые, как правило, у людей общие. Для Мэдисон мы получаем:
= (6–4) ∙ (6–5) = 2 ∙ 1 = 2.
Это говорит нам о том, что между ее интересом к Кайли и косметике существует положительная корреляция.
Для Тайлера взаимоотношения между косметикой и Кайли отрицательные – (6–4) ∙ (1–5) = 2 ∙ (–4) = –8, – поскольку он проявляет интерес только к первой. Для Джейкоба величина снова положительна: (0–4) ∙ (0–5) = (–4) ∙ (–5) = 20, так как ему не нравятся ни первая, ни вторая (см. рис. 7). Обратите внимание на один нюанс. И у Джейкоба, и у Мэдисон положительное значение, хотя у них противоположные взгляды на Кайли и косметику. Однако их взгляды предполагают, что Кайли и косметика коррелируют между собой, хотя Джейкоб вообще никогда не смотрел ни на ту ни на другую. Поведение Тайлера в социальной сети не соответствует такой закономерности.
Рис. 7. Иллюстрация к вычислению корреляции между Кайли и косметикой
Мы можем произвести расчеты для каждого из подростков и сложить все такие величины. Получится сумма
Знак Σi указывает, что мы берем сумму по всем двенадцати тинейджерам. Сложив все произведения, где перемножены отношения подростков к косметике и к Кайли, получим:
2 – 8 + 20–16 + 10 + 8 + 6 + 2 + 20 + 0 + 9 + 16 = 69.
Большая часть слагаемых положительна: это показывает, что дети имеют схожее отношение к Кайли и косметике. Среди тех, кто вносит свой положительный вклад в сумму, – Мэдисон и Джейкоб: 2 и 20 соответственно. Исключения – Тайлер, которому не нравится Кайли, и Райан, которому не нравится косметика; зато Кайли Дженнер по душе. Именно эта пара дала слагаемые –8 и – 16.
Математики не любят больших чисел вроде 69. Мы предпочитаем, чтобы они были меньше, лучше между 0 и 1, так их удобно сравнивать. Для этого мы добавим в уравнение 7 знаменатель (нижнюю часть дроби)[135]. Я не стану подробно разбирать это вычисление, но если мы подставим все наши числа, то получим
Мы получили одно-единственное число 0,51, которое измеряет корреляционную зависимость между косметикой и Кайли. Значение 1 показывало бы идеальную корреляцию между этими двумя типами постов, значение 0 говорило бы об отсутствии связи[136]. Так что реальное значение 0,51 дает нам среднюю корреляцию между любовью к косметике и к Кайли Дженнер.
Я понимаю, что провел уже довольно много вычислений, но мы нашли только одно из пятнадцати важных чисел, отражающих предпочтения подростков! Нам бы хотелось узнать корреляцию не только между косметикой и Кайли, но и между всеми категориями: еда, косметика, Кайли, Пьюдипай, Fortnite и Дрейк. К счастью, мы уже в курсе, как вычислить один коэффициент корреляции с помощью уравнения 7, – остается только подставлять в это уравнение каждую пару категорий. Именно это я сейчас и сделаю. Получится то, что известно под названием корреляционной матрицы, которую мы обозначим как R. Если вы посмотрите на пересечение строки «Кайли» и столбца «Косметика», то увидите найденное нами ранее число 0,51. Точно так же заполняются и остальные строки матрицы – для всех пар категорий. Например, Fortnite и Пьюдипай дают корреляцию 0,71. Но есть и такие пары, как Fortnite и косметика, которые дают коэффициент –0,74, то есть коррелируют отрицательно. Это означает, что геймеры, как правило, не особо интересуются косметикой.
Корреляционная матрица группирует людей по типам. Когда я просил вас представить себе этих подростков и не стесняться быть категоричными, я предлагал вам самим построить такую матрицу. Корреляция Кайли/косметика относит к одному типу таких подростков, как Мэдисон, Алисса, Эшли и Кайли, а корреляция Пьюдипай/Fortnite относит к другой группе Джейкоба, Райана, Моргана и Лорен. А вот Тайлер и Мэтт не вполне подходят под такую простую категоризацию.
В мае 2019 года я спрашивал Дуга Коэна, специалиста по данным из Snapchat, о той информации о пользователях, которую они хранят в корреляционных матрицах. «Ну, это почти всё, что вы делаете в Snapchat, – отвечал он. – Мы смотрим, как часто наши пользователи разговаривают в чатах с друзьями, сколько у них полос общения, какими фильтрами пользуются, как долго разглядывают карты, в скольких групповых чатах сидят, сколько времени тратят на просмотр контента или когда читают истории своих друзей. И мы смотрим, как эти действия коррелируют друг с другом».
Данные анонимны, поэтому Дуг не знает, чем занимаетесь конкретно вы. Но такие корреляции позволяют Snapchat категоризировать пользователей – от «одержимых селфи» и «документалистов» до «див макияжа» и «королев фильтров», если пользоваться внутренней терминологией компании[137].
Как только компания узнаёт, что привлекает определенного пользователя, она дает ему это в большом количестве. Слушая, как Дуг описывает свою работу по привлечению людей, я не мог не прокомментировать: «Погодите! Я, как родитель, стараюсь, чтобы мои дети пользовались телефоном меньше, а вы трудитесь, чтобы повысить их вовлеченность!»
Дуг парировал, слегка уколов конкурентов: «Мы не просто стараемся максимизировать время, проведенное в приложении, как традиционно делал Facebook. Мы следим за уровнем участия, смотрим, как часто пользователи возвращаются. Мы помогаем им общаться с друзьями».
Snapchat не претендует на то, чтобы мои дети проводили у них всё свое время, но компания желает, чтобы они снова и снова возвращались. И по личному опыту могу сказать, что это работает.
Большинство хотели бы, чтобы их уважали как личностей, а не изображали в виде каких-то стандартных типов. Уравнение 7 полностью игнорирует наши желания. Оно сводит нас к корреляциям между вещами, которые нам нравятся.
Математики, работающие в Facebook, осознали силу корреляций еще на ранних стадиях разработки платформы. Каждый раз, когда вы ставите лайк на странице или комментируете какую-то тему, ваши действия предоставляют соцсети сведения о вас как о личности. Со временем Facebook стал использовать эти сведения иначе. В 2017 году, когда я впервые начал наблюдать, как аналитики отслеживают наши действия, категории казались забавными: среди коробок, по которым нас раскладывали, были «Брит-поп»[138], «королевские свадьбы», «буксиры», «шея» или «верхушка среднего класса