Точность секвенирования всегда была проблемой для геномики. Точность изрядной части ранних сиквенсов ДНК была намного ниже 99 % (одна ошибка на 100 оснований). Лишь немногие лаборатории придерживались «высокого» стандарта, установленного для человеческого генома, – одна ошибка на десять тысяч оснований. Между тем для написания генетического текста нужна точность на порядки выше, чем текущие стандарты для чтения ДНК. Поскольку оцифрованные последовательности ДНК должны стать основой для конструирования и синтеза генома, сиквенс, на котором она основана, должен быть чрезвычайно точным, чтобы организм с таким геномом мог жить. (Позже мы установили, что одна «опечатка» – выпадение всего одного основания – из 1,1 миллиона букв генетического текста может быть вопросом жизни и смерти, когда речь идет о создании первой синтетической клетки.)
Со времен работы Синшаймера мы знали, что геном phi X 174, чтобы стать заразным, должен быть кольцевым{115}. Чтобы синтезировать работающий кольцевой геном, мы разбили проблему на несколько этапов. Внеся в компьютер последовательность ДНК фага, мы затем разделили геном на перекрывающиеся куски, которые были достаточно малы, чтобы их мог сделать синтезатор ДНК. Чтобы синтезировать фага, мы сделали 259 олигомеров, каждый 42 основания в длину. Перекрываясь, они покрывали весь геном. Смысловая[12] цепочка должна была сформироваться из 130 этих олигомеров, а другие 129 должны были образовать антисмысловую цепочку. Поскольку геном phi X 174 состоит из 5384 пар оснований, в конструкции предусматривались области перекрывания между кусками из 42 оснований (мы их назвали «сорокдвамеры» – от греческого meros, т. е. часть, в данном случае нуклеотид), а также дополнительные последовательности, которые мы добавили к каждому концу генома, чтобы сдублировать место рестрикции (в геноме оно содержится только один раз – там, где фермент рестриктаза PstI может резать ДНК), чтобы создать перекрывающиеся концы, которые свяжутся друг с другом, заставив ДНК закольцеваться.
Зная, что лишь половина синтезированных «сорокдвамеров» будет правильной длины, мы рассудили, что сильно улучшим точность сборки, предварительно очистив олигонуклеотиды. Гели для секвенирования ДНК разделяют молекулы ДНК разной длины и способны различать молекулы с разницей всего в один нуклеотид. В процессе, который называется гель-электрофорез, отрицательно заряженные молекулы нуклеиновой кислоты двигаются сквозь агарозный гель под действием электрического поля. «Усеченные» олигомеры меньше и в силу этого двигаются быстрее, чем олигомеры правильного размера. Просто разрезав гель бритвенным лезвием, мы могли отделить полосу с молекулами нормальной длины, чтобы использовать их для сборки смысловой и антисмысловой цепочек phi X 174.
Теперь у нас были компоненты для сборки генома фага – очищенные олигомерные цепочки. После этого мы объединили смысловые и антисмысловые олигомеры, которые, благодаря перекрывающейся схеме, сами выстроились в правильном порядке, подобно самособирающимся блокам лего. Тогда мы связали их насовсем с помощью фермента ДНК-лигазы. Вместо того фермента, что был у Корнберга, мы выбрали более мощную лигазу из высокотемпературного организма, которая долго сохраняла активность. Оставив пул олигомеров на восемнадцать часов реагировать при температуре в 55 градусов, мы получили из олигомеров по 42 основания более крупные фрагменты: в среднем по 700 оснований, а некоторые – по две-три тысячи.
Из этих более длинных кусков ДНК мы смонтировали полноразмерную геномную последовательность phi X 174 методом полимеразной цикличной сборки (ПЦС). Это вариант полимеразной цепной реакции (ПЦР) – обычного метода размножения ДНК. С помощью ПЦР мы можем приумножить небольшие количества ДНК. При нагреве ДНК денатурируется или «тает»: двойная спираль разделяется на две одноцепочечные молекулы. Дальше термоустойчивая Taq-полимераза, используя эти цепочки как матрицы, делает две новых цепочки ДНК. Это удваивает исходную ДНК, так как каждая из новых молекул содержит одну старую и одну новую цепочки. Затем каждая из этих цепочек может быть использована для создания новых копий и так далее.
В варианте процесса ПЦС мы начали со всех более крупных кусков ДНК с первого этапа сборки (в которых было в среднем по 700 пар оснований). Мы снова расплавили двухцепочечную ДНК до одиночных цепочек. Вместо копирования одинарных цепочек ДНК-полимеразой мы позволили реакционной смеси остыть, чтобы одинарные цепочки слиплись с любыми комплементарными участками. Поскольку последовательности наших фрагментов частично перекрывались на концах, в такой смеси часть цепочек объединялась не со своей парой, а с парой «соседнего» фрагмента, сцепляясь с ним лишь концами – как если совместить только первые фаланги ваших указательных пальцев. Большая часть таких цепочек оставалась одинарной, и ДНК-полимеразы, используя их как матрицу, достраивали к ним комплементарные цепочки. В результате из двух фрагментов получался один, почти вдвое большей длины. Повторяя этот цикл, можно построить кусок ДНК длиной в несколько тысяч пар оснований, причем сделать это относительно быстро. Циклы продолжаются, пока растущие молекулы не перекрывают геном полностью. После этого для размножения полного генома используется обычная ПЦР. Чтобы превратить эти линейные геномы фага в способные заражать кольца, фермент PstI срезает по несколько нуклеотидов одной из цепочек на концах амплифицированных молекул. В результате на концах молекул образуются короткие одноцепочечные «хвосты». Они слипаются друг с другом, замыкая молекулу в кольцо.
Далее идет важный тест – проверка, удалось ли нам создать точный синтетический геном, способный к заражению. Чтобы вирус был заразным, синтетическая ДНК должна быть опознана ферментными системами в клетках E. coli, сначала будучи переписана на мРНК, а потом в вирусные белки посредством механизма синтеза белков E. coli. Чтобы гарантировать нашей синтетической ДНК попадание в целевую бактерию-хозяина E. coli, мы применяли метод электропорации, при котором электрическое поле пробивает маленькие временные дырочки в клеточной стенке E. coli. После заражения синтетическим phi X 174 бактерий помещали на агар (желеподобную смесь агарозы и агаропектина) в чашке Петри и оставляли инкубироваться при 37 градусах от 6 до 18 часов.
Если бы на слое E. coli появилось пятно лизиса – красноречивый четкий круг, – было бы ясно, что новая стратегия сработала. Пятно показало бы, что в бактерии успешно вырабатываются вирусные белки, самособираясь в полноценные копии вируса phi X 174, заставляющие клетки-хозяева лопаться, выпуская вирус и заражая окружающие клетки E. coli. Открыв инкубатор, Хэм позвонил мне, попросив как можно быстрее прийти в лабораторию. Когда он показал мне первую чашку, я был очень доволен: по всей поверхности были явные пятна лизиса. Синтетическая ДНК бактериофага действительно могла заражать, воспроизводиться и затем убивать бактериальные клетки. У Хэма и Клайда от волнения кружились головы. Весь процесс создания синтетического генома и заражения клеток занял у нас две недели.
Чтобы представить контекст наших опытов, надо сказать о еще более отважной попытке создать хотя бы отчасти жизнеспособный вирус путем пошагового процесса, предпринятой годом раньше Экардом Уиммером из Университета штата Нью-Йорк в Стони-Бруке. У его команды получение первого синтетического РНК-вируса путем сборки генома вируса полиомиелита в семь тысяч оснований из небольших синтетических олигомеров ДНК, следуя расшифровке, которую он и его коллеги опубликовали в 1981 году, заняло три года. Синтетическая ДНК была с помощью РНК-транскриптазы переведена в заразную вирусную РНК. Этот первый синтетический РНК-вирус полиомиелита страдал той же самой неточностью синтеза олигомеров, которая подкосила наши собственные опыты, и в результате его активность была сильно снижена{116}. У достижения Уиммера был один негативный аспект: он предпочел опубликовать это скорее как предостережение научному сообществу, чем как обычный научный результат, породив тем самым споры и беспокойство в обществе.
Следуя за работой Уиммера, мы сократили сроки создания вируса с годов до дней. Поскольку эта работа финансировалась МЭ, я связался с Ари Патриносом, чтобы уведомить правительство о нашем успехе. Вскоре поступил официальный ответ, который я приводил в автобиографии «Расшифрованная жизнь».
Прямо на следующий день я обнаружил себя сидящим в ресторане на Пенсильвания-авеню (в нескольких кварталах от Овального кабинета), куда был призван всего за два часа до этого на срочный деловой ланч Ари Патриносом, работавшим в биологическом отделе министерства энергетики, которое спонсировало мои исследования, и сыгравшим в свое время важную роль в совместном представлении первого человеческого генома в Белом доме. Позже к нам присоединились его босс, Рэймонд Ли Орбах, директор Управления науки и техники МЭ; Джон Марбургер III, советник президента по науке и директор Управления науки и технической политики; и Лоуренс Керр, директор по исследованиям, развитию и проблеме биотерроризма Управления внутренней безопасности Белого дома. После того как в октябре 2001 года нескольким политикам были присланы по почте споры сибирской язвы, убившие пять человек, правительство США всерьез занялось подготовкой к отражению будущих биологических терактов{117}.
Я объяснил им, насколько быстро мы создали phi X 174 нашим методом исправления ошибок и что сейчас мы запросто могли бы сделать это еще быстрее. Керр выглядел понимающим, и вопросы, вытекающие из возможности создавать синтетические вирусы, видимо, прошли весь путь в Белый дом – вплоть до решения о возможных ограничениях публикации наших результатов.