Форма реальности. Скрытая геометрия стратегии, информации, общества, биологии и всего остального — страница 55 из 82

Eigenwert, означающее по-немецки «собственная стоимость или значение»[473][474].

Мы не обязаны разделять пандемию по географическому признаку и можем использовать любые категории. Например, разделим дакотцев не на северных и южных, а на две (или пять, или десять) возрастные группы, отслеживая во всех случаях степень взаимодействия внутри каждой группы и между группами. В ситуации с десятью группами получается довольно много информации; чтобы упорядочить ее, вы можете взять таблицу 10 × 10 и, например, на пересечении третьей строки и седьмого столбца вписать число близких личных контактов между участниками третьей и седьмой возрастных групп. (Это может быть несколько избыточно, поскольку то же самое число вы поставите на пересечении седьмой строки и третьего столбца; однако если вы считаете, что молодые передают инфекцию пожилым с большей вероятностью (или наоборот), то вполне можете использовать для этих клеток разные числа.) Такую таблицу чисел Сильвестр назвал матрицей, и название прижилось. Вычисление собственного значения матрицы – скрытого числа, которое определяет рост системы, состоящей из многих частей и описываемых такой таблицей чисел, – математики стали считать одним из фундаментальных. Большинство математиков вычисляют собственные значения ежедневно.

Собственные значения могут дать вам гораздо более точную картину развития пандемии и ее предполагаемого будущего, нежели базовые модели, обсуждавшиеся ранее. В частности, если некоторые подгруппы населения заражаются и передают вирус с гораздо большей вероятностью по сравнению с другими, то первоначальное высокое значение показателя R0 не обязательно означает пандемию, которая распространится на большую часть популяции. Возможно, начальные высокие показатели обусловлены большим количеством заболевших в самой восприимчивой подгруппе населения, а как только вирус охватит всю эту небольшую часть населения (и она, возможно, временно приобретет иммунитет), в оставшейся части его передача замедлится настолько, что ее не хватит для поддержания роста пандемии. Вы можете создать подобные модели[475], где пандемия останавливается после заражения очень небольшой части людей, всего 10 или 20 %, даже при высоком значении R0. Чтобы узнать эти количества, придется вычислять собственные значения для различных подгрупп, но вы можете уловить основную идею, представив себе простой пример. Допустим, для вируса уязвимы всего 10 % популяции (а 90 % имеют иммунитет), но каждый из инфицированных во время периода заразности может в среднем заразить двадцать человек. Однако рост инфекции будет соответствовать показателю R0 = 2, а не R0 = 20, потому что каждый больной человек хотя и встретится с двадцатью людьми, заразит только двоих, наиболее уязвимых. Когда же среди 10 % населения заразятся практически все, у вируса закончатся потенциально восприимчивые жертвы.

Как мы уже знаем, геометрические прогрессии не описывают всей истории. Показатель R0 во время эпидемии может меняться в результате действий правительства или отдельных лиц. Кроме того, есть подъем и спад, которые предсказывает модель Росса – Хадсон и Кермака – Маккендрика, когда вирус охватывает популяцию, приходит к точке коллективного иммунитета и медленно болезненно исчезает. Вы можете провести такой анализ для популяции, разделенной на пространственные или демографические подгруппы, и тогда изучите не столько одну эпидемию, сколько целый набор, где каждая влияет на другие. В итоге, когда вы сложите все результаты, получится нечто, выглядящее смутно реалистичным: вспышки и затишья в разных популяциях в различное время.

При этом, чтобы ваше моделирование оказалось правильным, оно должно быть стохастичным. Это означает, например, что вы не просто присваиваете каждому человеку его персональное точное значение R0 – как если бы вы на этой неделе определенно заразили шесть своих сверстников и одного пожилого человека, – а считаете этот параметр случайной величиной. И если она меняется не очень существенно, то это, возможно, не будет иметь значения: половина инфицированных заразят одного человека, половина – двух, и вы не много потеряете, если положите, что число инфекций на следующей неделе будет в полтора раза больше, чем на этой, и построите модель с параметром R0 = 1,5. Но что, если 90 % не заражают никого, 9 % заражают по десять человек, а 1 % – по шестьдесят? Это по-прежнему дает в среднем 1,5 новые инфекции на человека, но динамика эпидемии будет другой. Возможно, эта небольшая доля людей сверхзаразна по какой-то биологической причине, а может, они предпочитают посещать многолюдные мероприятия в помещении; неважно – математика будет одинаковой. Такие сверхраспространения – масштабные события, но при этом они редки. В любом конкретном регионе какое-то время может не наблюдаться ни одного такого события, болезнь какое-то время потихоньку будет протекать, но если извне и проникает инфекция, то взрыва не происходит. Но вдруг подряд случаются несколько крупных событий со сверхраспространением, и внезапно происходит локальный всплеск заболевания. Однако вы не уверены в причинах. Если в двух разных местах болезнь протекает по-разному, то, возможно, потому, что в одном из них проводилась соответствующая политика. Но это может быть и просто стохастичность. Чем выше степень доминирования сверхраспространения над инфекцией, тем сильнее влияние глупой случайности в распределении болезни.

Это не означает, что местные органы здравоохранения должны опустить руки, отказаться от действий и молиться, чтобы судьба оказалась к ним благосклонной. Знание, что причина эпидемии – сверхраспространение, может быть полезным. Вы можете подавить передачу, подавляя сверхраспространение. Никаких многолюдных свадеб в помещениях, никаких баров, никакого хорового пения – и, возможно, вам удастся обойтись более мягкими ограничениями в отношении остальных форм контактов между людьми.

КАК РАБОТАЕТ GOOGLE, ИЛИ ЗАКОН ДОЛГИХ БЛУЖДАНИЙ

Появление Google разделило интернет на до и после. Людям, впервые вышедшим онлайн после середины 1990-х, практически невозможно объяснить, насколько радикально все тогда поменялось. Внезапно, вместо того чтобы знать, по какой последовательности ссылок переходить, или вручную набирать HTML-адрес, чтобы добраться до нужной информации, вы могли просто… спросить. Это казалось чудом. На самом деле это были собственные значения.

Лучший способ увидеть, как это работает, – вернуться к пандемии. Предположим, у вас есть усовершенствованная модель, где население делится не просто на две Дакоты или на десять возрастных групп. Вы идете дальше и дробите его на все более мелкие категории, пока каждый человек не становится отдельной категорией. Это называется агентным моделированием, и это прекрасная штука, если вы каким-то образом можете отслеживать (или разумно аппроксимировать) огромный массив данных о взаимодействиях каждого конкретного человека со всеми остальными. Такая модель во многом похожа на случайные блуждания, которые изучал Рональд Росс. Но теперь блуждает не зараженный комар, а сам вирус, перепрыгивая с какой-то вероятностью с инфицированного человека на восприимчивого, с которым тот контактирует. Далее применяется такой же анализ собственных значений, просто размер вашей матрицы колоссален: число строк и столбцов в ней равно числу людей в популяции!

Вы можете подумать, что вероятность заражения в подобных моделях зависит от количества контактов с другими людьми. В какой-то степени это так. Но важно и то, с кем именно вы контактируете. Супруги, разумеется, взаимодействуют друг с другом практически каждый день. Но если они редко общаются с другими людьми, то их контакты не влияют на общее распространение инфекции. Если вы сведете социальное общение к минимуму, ограничившись, скажем, лучшим другом, это может показаться весьма безопасным; но если ваш лучший друг регулярно посещает места большого скопления людей, где не носят масок, вы подвергаетесь высокому риску заболеть, несмотря на небольшое количество контактов.

В реальности агентные модели не доминировали при моделировании COVID-19, поскольку на самом деле у нас нет (и не может быть!) ничего похожего на такие детализированные данные об отдельных контактах людей, без которых агентное моделирование не будет работать.

Но мы говорим уже не о COVID-19, а о поиске в интернете. Сеть ссылок между веб-страницами гораздо легче измерить, чем сеть контактов между людьми. Однако структура схожа. Есть множество отдельных страниц, и каждая пара либо связана, либо нет.

Если ваш поисковый запрос – пандемия, то вам вовсе не нужна случайная страница, выбранная наугад из всех страниц интернета, где упоминается это слово. Вы хотите лучшую! Естественно, вы можете решить, что лучшая страница по этой теме – с наибольшим количеством ссылок на нее. Однако это не всегда так. Распространитель какого-нибудь текста типа «Пандемии – это всего лишь побочные эффекты муниципального фторирования воды» вполне может создать сто сайтов на эту тему, и все они будут ссылаться друг на друга. Если вы на основании этого присвоите высокий рейтинг странице «Чистка зубов или смерть?!», то сделаете большую ошибку.

Важно, откуда идут ссылки. Страницы о фторировании, активно ссылающиеся друг на друга, но без ссылок извне, подобны живущим изолированно супругам, контакты которых замкнуты. Наличие друга – завсегдатая вечеринок – это аналог ссылки на вашу страницу компании CNN; ссылка должна иметь большой вес, если она исходит со страницы, на которую ведет много ссылок. Вы можете смоделировать важность в интернете с помощью случайного блуждания, подобно агентному моделированию распространения болезни. Если вы случайно бродите по интернету, следуя наугад выбранной ссылке на каждой странице, то какие страницы будете посещать часто, а на какие вообще никогда не зайдете?