На более фундаментальном уровне было немало попыток создать in silico виртуальную клетку – динамическую биологическую систему в форме «живущей» программы, которая могла бы показать, как все процессы, идущие в живой клетке, функционируют вместе как одна система. Хотя я напрямую не участвую в этих проектах, они выиграли от работы моего института. Базовое знание и идеи, добытые нами в ходе наших исследований генома микоплазм, дали другим возможность создавать подробные модели клетки Mycoplasma в компьютере.
В 1990-х попытка воплотить наши данные по геному в «электронную клетку» была предпринята командой во главе с Масару Томита в Университете Кейо в японском городе Фудзисава. Когда группа в Кейо начала свой проект, было секвенировано всего восемнадцать организмов. Они считали, что беспрецедентное на тот момент количество доступной молекулярной информации по широкому спектру модельных организмов дало бы урожай в виде новых идей относительно внутриклеточных молекулярных процессов. Если имитировать их на компьютере, это позволило бы предсказывать динамическое поведение живых клеток. В компьютере было бы можно исследовать функции белков, взаимодействия между белками и белков с ДНК, регуляцию генной экспрессии и другие детали функционирования клетки. Другими словами, виртуальная клетка могла бы дать новые перспективы в исследованиях как программ жизни, так и ее материальной основы.
Весной 1996 года Томита и его студенты из Лаборатории биоинформатики в Кейо начали исследовать молекулярную биологию Mycoplasma genitalium (которую мы секвенировали в 1995-м) и к концу этого года учредили проект E-Cell («Электронная клетка»). Японская команда сконструировала модель гипотетической клетки всего со 127 генами, которых было достаточно для транскрипции, трансляции и производства энергии. Большинство использованных ими генов они «списали» у Mycoplasma genitalium. В свою модель команда заложила сеть метаболических взаимодействий этого гипотетического генома, в который входили двадцать генов тРНК и два гена рибосомальной РНК. Согласно принятым ими допущениям, клетка пребывала в нереально благоприятных внешних условиях.
Состояние модельной клетки в любой произвольный момент отображалось списком концентраций входящих в нее веществ, а также значений объема клетки, кислотности (pH) и температуры. Для моделирования программы ДНК команда использовала существующее программное обеспечение и разработала сотни правил, которые действуют для многих, но не всех метаболических путей M. genitalium, включая гликолиз, ферментацию лактата, поглощение глюкозы, глицерина и жирных кислот, синтез фосфолипидов, транскрипцию генов, синтез белка, работу полимераз и рибосом, а также деградацию белков и мРНК. Для пущей верности модель была сконструирована так, что ферменты и прочие белки спонтанно деградировали со временем, так что для поддержания «жизни» клетки они должны были постоянно синтезироваться.
Японская команда проводила эксперименты на виртуальной клетке как на «симуляторе двигателя», работающем примерно в двадцать раз медленнее живого организма. Они могли заставить клетку «голодать», убирая из питательной среды глюкозу. При этом они наблюдали, как количество АТФ временно возрастает, но затем резко падает до тех пор, пока клетка наконец не «умирает», исчерпав горючее-АТФ. Если глюкозу возвращали, виртуальная клетка могла оправиться или нет, в зависимости от степени ее истощения. Модель позволяла одним кликом мышкой воспроизвести – миллисекунда за миллисекундой – эффект выключения гена при разных концентрациях разных клеточных веществ. Клетку также можно было «убить», вырубив важный ген, например управляющий синтезом белка, в результате чего все ферменты постепенно деградировали и в конце концов полностью исчезали.
Но в то время, в конце 1990-х, задача связать разные уровни клеточных процессов – от работы генов до обмена веществ и далее – все еще была довольно трудной. Кроме того, формат модели Кейо в 127 генов был меньше «минимального набора генов», установленного нашими генными нокаутами и сравнением последовательностей наших двух первых секвенированных геномов. В результате модельная клетка оказалась «самоподдерживающейся», но неспособной к размножению; ей не хватало биохимических путей для репликации ДНК, генной регуляции и клеточного цикла. И конечно, в то время (как и сегодня), функции многих генов были еще неизвестны, так что для восполнения отсутствующих метаболических функций ученым приходится полагаться на догадки экспертов.
За десять лет со времени создания исходной «электронной клетки» японская команда ушла далеко вперед. Помимо постоянного улучшения модели, они начали моделирование человеческих эритроцитов, нейронов и других типов клеток, а также перешли к задачам, дополняющим работу по виртуальным клеткам, – таким как определение ответов E. coli на генетические и экологические проблемы. Эти работы показывают, что сеть метаболических взаимодействий внутри клетки чрезвычайно прочна благодаря ее избыточности{198}.
Самая свежая работа на Mycoplasma genitalium была сделана в Америке системным биологом Маркусом Кавертом из Стэнфордского университета. Его команда использовала наши данные по геному, чтобы создать виртуальную версию, которая очень походила на живую микоплазму. Это достижение опиралось на синтез большого объема информации, включая данные из более чем 900 научных статей о геноме этого существа, его транскриптоме, протеоме, метаболоме[27] и всяких прочих «-омах», которые вы можете придумать. В результате M. genitalium стала первым организмом, смоделированным столь подробно – вплоть до каждого из 525 генов и всех известных генетических функций.
Чтобы создать свою виртуальную клетку, стэнфордская команда использовала несколько тысяч параметров, относящихся к трем десяткам модулей субклеточных процессов, каждый из которых моделировался разными способами. Ученые программировали отдельные модули – каждый со своим собственным управляющим алгоритмом, – а те, коммуницируя друг с другом, интегрировались в единую клеточную машину. Таким образом, имитация бактерии была создана как серия модулей, которые отражают разные функции клетки. Используя сеть из 128 компьютеров, стэнфордская команда могла планировать поведение клеток виртуальных M. genita-lium на молекулярном уровне, от их ДНК и РНК до белков и метаболитов{199}. Они смоделировали продолжительность жизни клетки на молекулярном уровне, расписав взаимодействия 28 категорий молекул. И, наконец, общая модель была проверена сравнением с базой знаний, объединяющей информационные базы данных по M. genitalium{200}.
Стэнфордская команда, в частности, использовала свой виртуальный организм для выяснения деталей клеточного цикла, который включает в себя три фазы: инициацию, репликацию и цитокинез (деление клетки). Они заметили большую изменчивость длительности первых фаз по сравнению как с последней, так и с продолжительностью всего клеточного цикла. Длина отдельных фаз клеточного цикла варьирует от одной виртуальной клетки к другой, в то время как длина всего цикла значительно более постоянна. На основании поведения модели стэнфордцы предположили, что устойчивость полного клеточного цикла – результат работы встроенного механизма отрицательной обратной связи, компенсирующего различия в длительности отдельных фаз. Клетки, приступающие к репликации ДНК позднее, имеют время, чтобы накопить большой запас свободных нуклеотидов. Сама фаза репликации, на которой эти нуклеотиды расходуются на создание новых цепочек ДНК, после этого проходит относительно быстро. С другой стороны, клетки, которые проходят начальную фазу быстрее, не имеют избытка нуклеотидов. В этом случае скорость репликации ограничивалась скоростью производства нуклеотидов.
Команда Стэнфордского университета имитировала последствия мутаций для всех 525 генов, чтобы определить, остаются ли мутантные клетки жизнеспособными. Примерно 80 % их предсказаний при сравнении с экспериментальными данными по реальным клеткам оказались верны. Но как раз там, где результаты отличались, это порождало интересные объясняющие идеи. Согласно модели, утрата гена lpdA должна убивать клетку; на самом же деле такой штамм остается жизнеспособным, хотя растет на 40 % медленнее, чем дикий тип. Команда решила, что какой-то другой белок должен выполнять задачу, близкую к таковой для lpdA. При внимательном рассмотрении они нашли подходящий ген – nox, сходный с lpdA по последовательности и функции. Когда они поправили свою модель, добавив эту дополнительную функцию nox, виртуальная клетка тоже стала жизнеспособной. Расхождения в темпах роста мутантов in silico и в реальности помогли команде тонко отрегулировать скорость наработки ферментов в электронных клетках, чтобы сделать модели более реалистичными и более похожими на M. genitalium.
Подобные модели в конечном счете позволят нам просчитывать сценарии типа «что будет, если…», обычные в области инженерии. Так же как инженер подбирает на компьютере ширину несущего элемента конструкции небоскреба, чтобы увидеть, что происходит с его сейсмоустойчивостью, системные биологи смогут манипулировать программным обеспечением жизни для изучения его влияния на жизнеспособность клеток. Будет интересно сравнить сконструированный нами минимальный геном с компьютерными моделями, чтобы увидеть, насколько мы способны предсказывать последствия изменений генов.
Понятно, что эта революция в биологическом моделировании потребует существенного увеличения мощности компьютеров. В настоящее время имитация деления одной клетки отнимает у стэнфордской команды около десяти часов и генерирует полгигабайта данных. Между тем первая виртуальная бактерия с ее 525 генами намного проще, чем