Когда дело доходит до клеточной химии, методы Байеса и Монте-Карло можно сочетать, чтобы найти наиболее вероятный набор параметров, лежащих в основе клеточных сетей связанных химических процессов – реакционных сетей. Каждый параметр контролирует скорость одного процесса в сети, и, как правило, их огромное количество. Методы Монте-Карло позволяют найти наилучшее соответствие всех этих параметров экспериментальным данным, а именно тому, как отдельные химические соединения увеличиваются и уменьшаются внутри клетки. В целом поиск параметров по методу Монте-Карло можно представить как случайные скачки по ландшафту возможностей или пространству поиска с целью найти самую низкую точку, что эквивалентно наилучшему соответствию экспериментальным данным.
Получив эти оценки параметров скорости, нам необходимо принять во внимание закон действия масс, который восходит к работам норвежских химиков Като Гульдберга (1836–1902) и Петера Вааге (1833–1900) 1864 г.[268] Этот закон XIX в. является здравым утверждением о том, что скорость химической реакции прямо пропорциональна произведению активности или концентрации реагентов в клетках: чем больше химических веществ, тем больше химических реакций. Полученные дифференциальные уравнения, снабженные численными значениями всех необходимых параметров, можно использовать для описания того, насколько изменяются концентрации на каждом этапе клеточных химических процессов.
Этот закон, несмотря на простоту, может дать глубокое понимание, например, химической передачи сигналов. В 1926 г. Альфред Кларк (1885–1941) из Университетского колледжа Лондона, известный в свое время разоблачением шарлатанских и патентованных лекарств[269], опубликовал исследование действия нейромедиатора ацетилхолина и препарата атропин на сердце лягушки[270]. Кларк использовал законы действия масс, разработанные американским химиком и лауреатом Нобелевской премии Ирвингом Ленгмюром (1881–1957), чтобы выяснить, как молекулы газа прилипают к поверхностям, и сделал вывод о существовании того, что сегодня мы знаем как рецептор белка, способный принимать и передавать сигналы. Молекулы лекарства соединяются с рецепторами со скоростью, пропорциональной концентрации молекул в растворе и числу свободных рецепторов. Сегодня мы знаем, что атропин блокирует, например, рецепторы ацетилхолина и что его можно использовать, среди прочего, для лечения отравлений нервно-паралитическими веществами и пестицидами.
Виртуальные вирусы
Из миллионов различных химических реакций, происходящих внутри клетки, давайте сосредоточимся на моделировании одной цепочки реакций, которая возникает, когда в наши тела вторгается то, что нобелевский лауреат и английский биолог Питер Медавар (1915–1987) однажды назвал «плохие новости, завернутые в белок».
Мы постоянно сталкиваемся с вирусами. По одной из оценок, общая масса нониллионов вирусов на Земле эквивалентна массе 75 миллионов синих китов[271]. Вирусы, обычно имеющие диаметр около 100 миллиардных долей метра, оживают только тогда, когда сталкиваются с живыми клетками. До тех пор они представляют собой не более чем инертный пакет генетических инструкций (они могут иметь форму ДНК или РНК), обернутых слоем жира и белка, часто с белковыми шипами, которые позволяют им цепляться за клетку-хозяина и проникать внутрь. Как только вирус проникает в клетки, его искаженные гены управляют нашей собственной клеточной биохимией с единственной целью: размножаться. После размножения вирус собирается в вирион, который вырывается из клетки, обычно вызывая ее гибель, чтобы нанести еще больший ущерб.
С ростом мирового населения, приводящим к глубоким изменениям в землепользовании, вирусы, циркулирующие среди животных, все чаще распространяются и вызывают серьезные заболевания у людей[272] – такова была история ВИЧ, атипичной пневмонии, MERS, Эболы и величайшего кризиса здравоохранения последних десятилетий – SARS-CoV-2. Используя технологию цифровых двойников и знания о размножении вирусов, полученные за последнее столетие, мы теперь можем моделировать эти инфекции на компьютере.
Например, когда дело доходит до разработки противовирусных препаратов, нам необходимо знать, как выглядит вирус на атомном уровне. Здесь компьютеры также играют важную роль, будь то в понимании дифракции рентгеновских лучей или расширении электронной микроскопии, называемой крио-ЭМ, которая достигла атомного разрешения[273] и может выявить трехмерную молекулярную структуру по двумерным томографическим проекциям отдельных молекул (рис. 26)[274].
Благодаря исследованиям с использованием этих и многих других техник у нас есть огромное количество информации о том, как работают вирусы. Однако, хотя они и являются простыми объектами, с иммунной системой организма они взаимодействуют тонкими и сложными способами. Например, в случае с SARS-CoV-2 во время пандемии внимательно отслеживался рост и падение числа различных мутаций, но невозможно было предсказать, как генетическое изменение повлияет на способность нового штамма распространяться и убивать. Не случайно предисловие нашей второй книги написал Барух Бламберг, получивший Нобелевскую премию за работу над вакциной, предотвратившей миллионы смертей от гепатита В и рака печени. Он оценил ценность науки о сложности для медицины.
Рисунок 26. Слева – криоэлектронная микроскопия вируса SARS-CoV-2. Справа – крупный план шипов, которые он использует для проникновения в человеческие клетки (© 2022 Mrc Laboratory of Molecular Biology)
Из-за сложной природы иммунной системы для создания виртуальной версии нам нужно начать с того аспекта вирусной инфекции, который хорошо изучен, и экспериментальные данные могут помочь нам понять причину, механизм и следствие. Хотя борьба с COVID-19 дала толчок к использованию высокопроизводительных компьютеров для моделирования инфекции и поиска противовирусных препаратов, в разработку которых мы смогли внести свой вклад, давайте начнем с рассмотрения вируса, который существует гораздо дольше, гораздо лучше изучен и уже имеет надежные компьютерные модели заражения.
Виртуальный ВИЧ
Вирус иммунодефицита человека, ВИЧ, также передался людям от животных. В случае СПИДа пандемия возникла из-за вируса, переданного от шимпанзе на юго-востоке Камеруна около столетия назад[275][276]. Воздействие вируса пагубно, поскольку поражает иммунную систему, которая должна защищать организм.
Десятилетиями исследователи изучали детали того, что происходит, когда ВИЧ атакует тип лейкоцитов, называемый иммунными клетками CD4. Сегодня мы знаем достаточно, чтобы смоделировать ключевые аспекты ВИЧ-инфекции для тестирования лекарств, вакцин, методов лечения и диагностики.
В принципе, можно смоделировать инфекцию «снизу вверх» и использовать моделирование молекулярной динамики для оценки подробной кинетики, исходя из того, как взаимодействуют большие деформируемые молекулы[277], наряду с многомасштабным моделированием (подробнее позже), чтобы понять колебания, которые происходят, когда белки сталкиваются друг с другом. Но воспроизвести последствия инфекции на миллионах белков на уровне клетки, которая примерно в 1000 раз больше, чем составляющие ее белки, – непростая задача[278][279]. Более того, эти процессы занимают до нескольких часов, что по молекулярным меркам – вечность.
Молекулярная динамика может моделировать движения огромного числа молекул, но временные шаги очень малы – часто не более 1–5 фс, где фемтосекунда равна одной квадриллионной доле или миллионной миллиардной доле секунды (грубо говоря, фемтосекунда к 1 с – это как 1 с к 30 миллионам лет). Для решения этой задачи необходим специально настроенный суперкомпьютер. Одним из примеров является проект Anton, созданный компанией D. E. Shaw Research в Нью-Йорке, который позволил моделировать миллионы атомов в миллисекундном диапазоне[280]. Эти симуляции занимают от миллиардов до триллионов временных шагов. Например, Фред Стрейц из Лос-Аламоса и Дуайт Ниссли из Национальной лаборатории Фредерика использовали суперкомпьютер Sierra в Ливерморской лаборатории для проведения крупномасштабного молекулярно-динамического моделирования возникновения рака, моделируя 300 белков RAS, которые при этом заболевании часто мутируют. В общей сложности они создали 100 000 микроскопических моделей поведения белков всего за 200 мс[281].
Но точно так же, как карта лондонского метрополитена может помочь нам достичь цели, не зная подробной географии города, так и мы можем продвинуться, моделируя ВИЧ-инфекцию, зная только молекулярных игроков и их поведение, фиксируя биохимические изменения в виде дифференциальных уравнений. Используя реалистичные параметры скорости, основанные на эмпирических данных и байесовских методах, мы можем изучить влияние виртуального заражения.
Мы можем воспроизвести ВИЧ-инфекцию с помощью математики. Например, в более ранних исследованиях Питер работал со своим аспирантом Кашифом Садиком и командой под руководством Виктора Мюллера из Будапештского университета Лоранда Этвеша над изучением сети химических реакций, описывающей производство белков вируса ВИЧ в клетке-хозяине, сведя его к обыкновенным дифференциальным уравнениям. Эта математическая модель хорошо согласовывалась со многими экспериментальными наблюдениями, такими как время, необходимое для созревания частицы вириона ВИЧ. Вооружившись своей моделью, они также смогли провести «анализ чувствительности», выявив относительную важность различных этапов формирования вируса