Десять уравнений, которые правят миром. И как их можете использовать вы — страница 24 из 49

* * *

Одно важное уравнение XXI века выглядит так:

A ∙ p = p (Уравнение 5).

Забудьте о миллиардных заработках при использовании логистической регрессии в азартных играх. Это уравнение – основа индустрии с триллионами долларов. Это Google. Это Amazon. Это Facebook. Это Instagram. Это суть любого интернет-бизнеса. Оно создает суперзвезд и подавляет повседневное и обыденное. Оно создает авторитетов и возводит на престол королей и королев социальных сетей. Оно причина нашей непрерывной потребности во внимании, одержимости восприятием себя, разочарования и увлечения модой и побудительными мотивами знаменитостей. Из-за него мы ощущаем себя потерянными в море рекламы и продакт-плейсмента. Оно сформировало все аспекты нашей онлайн-жизни.

Это уравнение влияния.

Вы можете подумать, что такое важное уравнение очень трудно объяснить или понять. Это не так. Фактически я уже объяснил его, когда представил, как стал Криштиану Роналду, Дуэйном Джонсоном или Уиллоу Смит. Достаточно связать символы A (обозначает переходную матрицу) и pt (вектор, определяющий вероятность оказаться тем или иным человеком в какой-то социальной группе в момент времени t) с тем путешествием, которое мы только что совершили по населению всего мира.

Чтобы наглядно представить переходную матрицу, вообразите себе электронную таблицу, в которой и строки, и столбцы подписаны именами людей. На пересечении стоит вероятность проснуться завтра другим человеком. Вообразите, что в мире живет всего пять человек: я, Дуэйн «Скала» Джонсон, певица Селена Гомес и еще двое, о ком я никогда не слышал: назову их Ван Фан и Ли Вэй. Если я предположу (как в своем первом мысленном эксперименте), что каждое утро просыпаюсь случайным человеком, то матрица A будет выглядеть так:



Столбцы и строки матрицы помечены инициалами пяти обитателей мира. Каждый день я смотрю на столбец того, кем сегодня оказался, а затем число в каждой строке сообщает мне вероятность того, что завтра я стану тем, с кем связана эта строка. Поскольку все числа равны 1/5, то это означает, что завтра я с равной вероятностью стану одним из пяти людей (включая меня самого).

Если я предположу (как во втором мысленном эксперименте), что буду просыпаться в теле того человека, на кого подписан в Instagram, то матрица A будет выглядеть иначе. Чтобы было интереснее, пусть Скала застрял на какой-то математической задачке и решил подписаться на меня в Instagram. Предположим, Селена Гомес познакомилась с Ван Фан и Ли Вэем на одном из своих концертов, подумав, что они здорово смотрятся вместе (я забыл упомянуть, что они пара), и подписалась на них. Разумеется, все подписаны на Селену и на Дуэйна. Тогда мы имеем:



Когда я Дэвид Самптер, для меня есть только два возможных варианта на завтрашний день: Селена или Скала. Поэтому в каждой из соответствующих клеток в моем столбце стоит 1/2. То же верно и для Скалы Джонсона. Остальные жители планеты могут перейти в трех других людей. Нули по диагонали матрицы отражают тот факт, что мы не можем остаться собой второй день подряд, потому что не подписаны на себя.

Теперь обратите внимание, что для создания моей модели я использовал марковское свойство (уравнение 4 из главы 4): предположил, что то, кем я был два дня назад, никак не влияет на то, кем оказался сегодня. По сути, матрица A определяет цепь Маркова: она дает нам переходные вероятности для перемещения из одного состояния в другое, при этом следующее состояние зависит только от нынешнего, но не более ранних.

Будем постепенно двигаться по дням с помощью нашей матрицы A. Предположим, в первое утро я проснулся Дэвидом Самптером. Теперь вычислим вероятности того, кем я стану завтра.



Я объясню, как умножаются матрицы, в примечаниях[107], но важнее всего обратить внимание на два столбца чисел в скобках по обеим сторонам от знака равенства. Они называются векторами, и каждый элемент вектора – число от 0 до 1, которое определяет вероятность того, что я окажусь определенным человеком в определенный день. В день 1 я Дэвид Самптер, так что число в моей строке равно 1, а остальные элементы вектора – 0. В день 2 я могу оказаться либо Селеной Гомес, либо Дуэйном Джонсоном (поскольку Дэвид Самптер подписан только на них), и в этом векторе есть два числа 1/2 для них, а остальные равны 0.

В день 3 все становится интереснее. Мы имеем:



Я могу оказаться кем угодно из пяти человек. Скорее всего, я буду Дэвидом Самптером или Селеной Гомес, но с вероятностью 1/6 могу оказаться также и Джонсоном, и одним из китайских френдов Селены. Давайте произведем умножение еще раз, чтобы найти, кем я могу оказаться в день 4.



Теперь мы видим, как знаменитости выходят на центральные роли. Глядя на вектор вероятностей, вычисленный для дня 4, мы обнаруживаем, что вероятность оказаться Скалой или Селеной Гомес – 23/72 – почти вчетверо выше, чем вероятность оказаться Дэвидом Самптером (всего 6/72).

Каждый раз, умножая нашу матрицу с переходными вероятностями на вектор очередного дня, мы переходим на один день в будущее. А теперь вопрос, который стал движущей силой для всех моих путешествий по населению мира: насколько часто я буду одним из этих пяти людей через очень большой промежуток времени?

Именно на этот вопрос и отвечает уравнение 5. Чтобы увидеть как, заменим матрицу и векторы символами. Матрицу мы уже назвали A, а вектор назовем pt и pt+1. Тогда наше умножение матриц примет сжатую форму:

A∙pt = pt+1,

где pt – вектор, определяющий вероятность быть тем или иным человеком в нашей социальной группе в момент t. Мы станем использовать индекс t, чтобы обозначать время, как в предыдущей главе. Мы уже видели, что



Переходим к уравнению 5, которое я повторю здесь:

A∙p = p.

Мы считаем, что прошло бесконечно много времени, поэтому разницы между t и t + 1 нет. Можем заменить эти индексы значком бесконечности ∞. Задумайтесь об этом. Отсюда следует, что если мы прыгали между телами достаточно много дней, то не имеет значения, прыгнем ли мы еще один раз: вероятность оказаться в некотором теле будет постоянной и определяться вектором p. Назовем его стационарным распределением. Оно дает нам неизменное распределение вероятностей нахождения в том или ином состоянии (в теле того или иного человека) через очень большое время, когда то, кем мы были изначально, уже забылось.

Уравнение 5 определяет вероятность того, что я буду определенным человеком в какой-то день в отдаленном будущем. Осталось решить уравнение. Для вселенной из пяти человек, в которой я сейчас обитаю, мы находим, что:



Обратите внимание, что два вектора слева и справа от знака равенства одинаковы. Это значит, что, сколько бы раз я ни умножал на этот вектор переходную матрицу A, результат не изменится. Именно таковы в отдаленной перспективе мои вероятности оказаться тем или иным человеком.

Вывод? У меня вдвое больше шансов проснуться Дуэйном Джонсоном, чем Дэвидом Самптером, и еще больше – Селеной Гомес. Больше даже шансов стать Ван Фан и Ли Вэем, чем Дэвидом. Если перевернуть вероятности, можно узнать, сколько времени мы проведем в телах всех жителей нашего мира. Шестьдесят дней – примерно два месяца, и стационарное распределение говорит нам, что в среднем 8 дней из них я буду Дэвидом, 16 – Джонсоном, 18 – Гомес, по 9 – Ван Фан и Ли Вэем. Когда время сдвигается к бесконечности, более половины жизни я проведу как знаменитость.

* * *

Ясно, что мы не просыпаемся каждое утро разными людьми, но Instagram дает нам возможность заглянуть в чужую жизнь. Каждая увиденная фотография – момент, когда подписчик несколько секунд ощущает, каково быть кем-то еще.

Twitter, Facebook и Snapchat тоже дают возможность распространять информацию и влиять на чувства и мысли подписчиков. Стационарное распределение p измеряет такое влияние; и не только с точки зрения того, кто на кого подписан, но и с точки зрения скорости, с которой тот или иной мем или идея распространяется среди пользователей. Люди с большими вероятностями в векторе p влиятельнее и распространяют мемы быстрее. Люди с маленькими вероятностями в векторе p менее влиятельны.

Вот почему уравнение 5 – уравнение влияния – так ценно для сетевых гигантов. Оно говорит им, кто в их соцсети самые важные люди, и при этом компании ничего не знают о том, кто они в реальности и чем занимаются. Измерение влиятельности – всего лишь вопрос матричной алгебры, и этим бездумно и некритично занимается компьютер.

Изначально уравнение влияния применила Google при разработке своего алгоритма ранжирования страниц PageRank – незадолго до рубежа веков. Компания вычисляла стационарные распределения для сайтов в предположении, что пользователи случайным образом щелкают по ссылкам на посещенных сайтах, чтобы выбрать следующий, на который перейдут. По этой причине в результатах поиска они выше ставили сайты с более высокими значениями p. Примерно в то же время Amazon стала создавать матрицу смежности A для своего бизнеса. В ней связывались те книги, а позже игрушки, фильмы, электроника и другие товары, которые люди покупали вместе. Определив тесные связи в матрице, компания смогла давать рекомендации для клиентов под заголовком вроде «Вам также может понравиться». Twitter использует стационарное распределение в своей соцсети, чтобы найти и предложить вам людей, на которых можно подписаться. Facebook применяет те же идеи при обмене новостями, а YouTube – чтобы рекомендовать видеоролики. Со временем подход развивался, появлялись дополнительные детали, но базовым инструментом для нахождения влиятельных лиц в соцсети остается матрица смежности