К 2012 г. команда из Стэнфорда сообщила о первой модели бактерии, учитывавшей все известные функции генов, и заявила, что проблема понимания того, как сложные фенотипы возникают из отдельных молекул и их взаимодействий, теперь может быть решена с помощью виртуальных клеток[352]. Когда они представили свою виртуальную бактерию, моделирование деления одной клетки заняло около 10 ч и сгенерировало полгигабайта данных. «Хотите верьте, хотите нет, но для деления настоящей клетки M.genitalium также требуется около 10 часов», – сказал нам Коверт[353].
Команда из Стэнфорда использовала этот виртуальный организм, чтобы выяснить детали клеточного цикла, который состоит из трех стадий – инициации, репликации и цитокинеза (деление клеток). Отсылая к реальному миру, продолжительность отдельных стадий виртуальных клеточных циклов варьировалась, в то время как продолжительность цикла в целом была относительно постоянной. Они обнаружили, что клетки, которым требовалось больше времени, чтобы начать репликацию ДНК, успели накопить пул свободных нуклеотидов – строительных блоков ДНК. В результате репликация цепей ДНК из этих нуклеотидов затем проходила относительно быстро. И напротив, клетки, которые прошли начальный этап быстрее, не имели избытка нуклеотидов, что задерживало репликацию.
Модель дает различную информацию, показывая, как хромосома связывается по крайней мере с одним белком в течение первых 6 мин клеточного цикла. Они смогли выяснить, что около 90 % генов были использованы или экспрессированы в течение первых 143 мин клеточного цикла и что в течение каждого цикла происходит 30 000 взаимодействий между белками. С помощью компьютера они смогли смоделировать последствия разрушения каждого из 525 генов в тысячах симуляций. Это показало, что 284 гена необходимы для поддержания роста и деления M.genitalium, а 117 из них несущественны, что в целом согласуется с экспериментальными данными[354]. Отключение метаболических генов вызвало наибольшие нарушения. При отключении синтеза определенного компонента клетки, такого как РНК или белок, модель предсказывала почти нормальный рост, за которым следовал спад.
Исследователи нашли захватывающие примеры избыточности. Согласно модели, удаление гена lpdA должно убить клетку. Однако эксперименты показали, что этот штамм остается жизнеспособным, хотя и растет на 40 % медленнее. Они пришли к выводу, что работу этого гена компенсирует другая клеточная подсистема. И действительно, команда обнаружила, что другой ген, Nox, выполняет функцию, аналогичную lpdA. Когда они скорректировали виртуальную клетку, смоделировав дополнительное использование Nox, в результате получилась жизнеспособная симулированная клетка. «Мы были удивлены способностью этих моделей предсказывать поведение на молекулярном уровне, впоследствии подтвержденное экспериментально», – сказал Коверт. Это впечатляет, хотя команда подчеркнула, что модель была лишь «первым наброском».
Одно из ключевых открытий, которое пришло к нам, в частности, от аспирантки Коверта Джайодиты Сангви, заключалось в возможности исходить из общего поведения виртуальных клеток (например, влияния разрушения генов на скорость роста), чтобы предсказать, что происходит на уровне ферментов, а не прибегать к данным об этих ферментах из других организмов, таких как E. coli[355]. «Это действительно невероятное достижение, которое часто недооценивают, – заметил Коверт. – Ранее работа заключалась в запуске симуляций, и эти симуляции были самоцелью. Работа Джайодиты была первой проведенной над клетками, в которой была показана точность как общих, так и очень детальных предсказаний модели. Впервые увидев результаты, я не мог поверить, – для меня эти новые данные были таким же Святым Граалем, как и сама модель!»[356]
Этот подход может стать благом для усилий по адаптации микроорганизмов для новых целей, будь то производство лекарств или топлива, а также для содействия усилиям по созданию синтетических клеток. В рамках применения технологии рекомбинантной ДНК и генной инженерии, направленной на идентификацию фундаментальных генов жизни и занявшей почти десятилетие, в 2016 г. команда Крейга Вентера объявила, что они создали в лаборатории хромосому и варианты M.genitalium и трансплантировали их в пустую бактериальную оболочку для получения синтетической клетки[357].
Эта виртуальная бактерия с ее 525 генами была только началом. Они автоматизировали процесс с помощью так называемого сборочного робота Gibson (названного в честь коллеги Вентера Дэна Гибсона[358]). В долгосрочной перспективе модели виртуальных клеток могут привести к рациональному проектированию новых микроорганизмов. Вентер, который подчеркнул, что работа Коверта была «фантастической», сказал нам, что в настоящее время возможности ограничены, потому что для полного понимания функции генов еще многое предстоит сделать: даже в случае маленькой M.genitalium роль трети генов изначально была неизвестна. Однако он добавил, что виртуальные клетки обладают «огромной полезностью», когда дело доходит до раскрытия этих деталей[359].
В качестве примера было проведено моделирование минимальной синтетической бактериальной клетки JCVI-syn3A, урезанного организма всего с 93 генами, созданного Институтом Дж. Крейга Вентера (JCVI) и Synthetic 4 Genomics, Inc. Клайд Хатчисон, Зайда (Зан) Люти-Шультен и коллеги из Университета Иллинойса в Урбане-Шампейне построили 3D-модель примерно двух миллиардов атомов, раскрывающих связи между метаболизмом, генетической информацией и ростом клеток, включая 148 известных метаболитов, 452 белка, 503 рибосомы и более 7000 реакций ДНК. Модель использовала графические процессоры для моделирования 20-минутного периода клеточного цикла – одного из самых длинных и сложных в своем роде на сегодняшний день. Обнадеживает тот факт, что модель показала: клетка тратит большую часть энергии на транспортировку молекул через свою мембрану, чего и следовало ожидать, учитывая, что это паразитическая клетка, и фундаментальное «эмерджентное поведение подтверждается несколькими экспериментальными результатами»[360].
Виртуальная E. Coli
Микоплазма и организмы с минимальным геномом намного проще, чем кишечная палочка E. coli, первоначальная цель «Проекта К» Крика и Бреннера, и организм, гораздо более важный для науки, медицины и биотехнологии. Эта бактерия также гораздо сложнее: E. coli имеет 4288 генов, делится каждые 20–30 мин. и имеет большее количество молекулярных взаимодействий, каждое из которых увеличивает время, необходимое для моделирования. По словам Коверта, других вдохновило стремление смоделировать эту более сложную клетку: «Пол Аллен (1953–2018), американский бизнес-магнат, исследователь и филантроп, был большим поклонником этой работы и финансово поддерживал все, что связано с E. coli»[361].
Чтобы справиться с E. coli, команда Коверта использовала подход, аналогичный M.genitalium, и опубликовала свои результаты в 2020 г.[362]. Они собрали более 19 000 значений параметров из литературы и баз данных и включили их во взаимозависимые математические уравнения – обычные дифференциальные уравнения, их стохастические варианты, вероятностные модели и т. д., – чтобы смоделировать взаимодействие клеточных процессов, связывающих экспрессию генов, метаболизм, репликацию и рост клеток. Вместо того чтобы строго обеспечивать соответствие реальным данным, они позволили модели изменяться.
Все белки в живом организме регулярно перестраиваются, и, хотя «Проект К» был далек от завершения («Было больше похоже на модель полуклетки», – признает Коверт), они обнаружили, что могут предсказывать периоды полураспада белков. Звучит тривиально, но Коверт так же скептически относится к экспериментальным данным (разные команды, использующие разные методы, могут получить разные параметры), как другие относятся к моделям, и верит, что исследуя различные источники экспериментальных данных с помощью своей модели – то, что он называет «глубоким курированием», – он может прийти к здравым выводам. Например, периоды полураспада белков традиционно рассчитывались по правилу, установленному много десятилетий назад[363]. Модель Коверта давала разные времена жизни и в каждом случае последующие наблюдения показали ее правильность. Это стало важно, когда дело дошло до прогнозирования скорости роста виртуального организма. Открытие, как заметил Коверт, «превзошло самые смелые ожидания».
Следующим шагом было введение в его бактерию географии. На сцене появляется «молекулярный художник» Дэвид Гудселл, который много лет потратил на создание акварелей белков («компьютерное моделирование не позволило создать те изображения, которые я хотел»), а затем на визуализацию молекул на компьютере для разработки лекарств в Лаборатории молекулярной графики Исследовательского института Скриппса в Ла-Хойе, Калифорния. По его словам, данные Коверта «показали нам детали и где их место». Используя эти данные, Гудселл, Арт Олсон и постдок Мартина Маритан нашли молекулярные структуры каждого отдельного белка и соединили их с помощью cellPACK, cellPAINT и cellVIEW – программного обеспечения, разработанного коллегой Маритан Людовиком Отином и использующего достижения игровой индустрии, которая лидирует в области современной компьютерной графики.
Таким образом, команда Скриппса разработала контейнер – виртуальную клетку – и поместила в него все его части, а также способы их взаимодействия, чтобы создать пастельные 3D-изображения всех белков, упакованных в микоплазму