И вот я говорю с Джонатаном и с Майклом Эгхольмом, датским ученым, менеджером 454, по трехсторонней электронной связи, — и волнуюсь. Да, Джонатан энергичен и напорист, как и следовало ожидать от предпринимателя такого масштаба, но его явно интересует только одно — прочитать геном динозавра! Как же мне быть и как себя вести? Ведь я всегда во всеуслышание заявлял, что секвенировать ДНК динозавра невозможно ни сейчас, ни в будущем. Я попытался как-то помягче, чтобы Джонатан не занес меня сразу в черный список, еще раз пройтись на эту тему и одновременно намекнуть на существование других презанятных геномов, особенно — продолжал намекать я — неандертальского. К счастью, Джонатана сразу же заинтриговала идея выяснить с помощью его аппарата, что делает человека человеком. Мне даже удалось убедить их с Эгхольмом, что начинать нужно с пещерных медведей и мамонтов.
И уже через неделю почта доставила экстракты мамонтовой и медвежьей кости в 454 Life Sciences. В это же время к нам в лабораторию поступил на работу трудолюбивый и талантливый молодой специалист — биоинформатик Ричард Эд Грин. Он только что защитил диссертацию в Калифорнийском университете в Беркли. Эд выиграл очень престижную и к тому же щедро финансируемую стипендию от Национального научного фонда США: он должен был выполнить проект по сравнению РНК-сплайсинга у человека и обезьян. Сплайсинг — это процесс, при котором из копий РНК, считанных с ДНК, вырезаются ненужные кусочки, разрезанные концы соединяются и превращаются в зрелую матричную (или, по-другому, информационную) РНК, и она уже непосредственно используется в белковом синтезе. По предположениям Эда, разница в схемах соединения разрезанных концов РНК могла объяснить многие человеческие и обезьяньи особенности. Он как раз этим занимался, когда пришли первые результаты из 454.
Команда из 454 составила сотни тысяч последовательностей ДНК из костей мамонта и пещерного медведя. Я поручил Эду разобраться с первоочередной проблемой: разделить медвежьи цепочки нуклеотидов и те, что принадлежали занесенным бактериям и другим организмам. Задача была не из простых. Он сравнивал последовательности геномов мамонта и пещерного медведя с геномами собаки и слона, то есть с самыми близкими из их живущих ныне родичей. Но цепочки палео-ДНК были короткими и к тому же с большой вероятностью химически видоизменились за прошедшие тысячелетия. Плюс к этому плесень и бактерии на костях определялись не слишком хорошо. Эда так захватила эта задача — распознать эндогенные последовательности, — что он совсем забросил свой сплайсинг. В конце концов он написал письмо в администрацию Национального научного фонда, ведавшую его стипендией. Он честно сообщил, что задачи его проекта изменились и теперь его интересует другое. К сожалению, в фонде мыслили недостаточно широко, чтобы понять, какие прекрасные возможности для информационной биологии открывает проект по неандертальскому геному, и попросту закрыли финансирование Эда. Хорошо, что наш бюджет позволял оставить его с нами.
Тем временем Эд подсчитал, что 2,9 процента ДНК, выделенных из костей мамонта, и 3,1 процента из костей пещерного медведя — эндогенные, то есть их собственные, а не привнесенные извне. Это значило, что результаты нашей работы с Эдди Рубином, когда клонирование ДНК в бактериях показало 5 процентов эндогенных ДНК от пещерного медведя, в действительности очень хороши. На первый взгляд 3 или даже 5 процентов не слишком впечатляют, но в абсолютных цифрах это 73 172 разных фрагментов ДНК мамонта и 61 667 фрагментов ДНК пещерного медведя. То есть всего лишь один эксперимент по новой методике 454, в котором участвовала только часть экстракта, выдал в десять раз больше информации, чем мы получили от бактериального клонирования в лаборатории Беркли. Казалось бы, вот он, настоящий прорыв, но я видел проблемы, сопряженные с новым методом. Наш обычный путь ПЦР позволял повторить эксперимент много раз и, таким образом, проверить результат и выявить возможные ошибки. Новый же метод показывал определенную последовательность только один раз: так как геномы — и мамонта, и медведя — были очень большими, то вероятность поймать один и тот же сегмент второй раз сводилась к минимуму. И в результате мы лишались возможности определить, какие отклонения могут появиться в результате химических модификаций молекул, неизбежных из-за долгого “хранения”, а также выявить ошибки собственно секвенирования.
Определение подобных ошибок — задача не новая, и у нас уже были кое-какие наработки. Вот, например, Михаэль Хофрайтер, дипломник из моей лаборатории, в 2001 году вместе с другими коллегами показал, что самый распространенный дефект древних ДНК — потеря аминогруппы в цитозинах. Это получается неизбежно само собой, если в материале присутствует хоть капелька воды. Теряя аминогруппу, цитозин превращается в урацил, обычный нуклеотид РНК. ДНК-полимераза считает его тимином. Так вот, нужно сравнить число тиминов в мамонтовой или медвежьей ДНК с современной слоновьей или собачьей, в особенности в тех местах, где подозреваются цитозины. И мы увидим резкое преобладание тиминов. Так оно и вышло, но, к нашему удивлению, еще обнаружилось некоторое превышение гуанинов по сравнению с аденинами. Это означало, что древний аденин, как и цитозин, может по ходу дела потерять свою аминогруппу. Мы, конечно, проверили это предположение: синтезировали ДНК с цитозинами и аденинами, лишенными своих аминогрупп, и потом посмотрели, как с такой последовательностью справится ДНК-полимераза. ДНК-полимеразу взяли ту же, которую использовала 454 для пиросеквенирования. И в результате ДНК-полимераза прочитывала Ц как Т, но и вместо А она читала Г. Мы написали об этом статью[47] и опубликовали ее в PNAS в сентябре 2006 года: не только цитозины могут терять аминогруппы, но и аденины — вот как. Однако довольно скоро мы обнаружили, что ошиблись.
Между тем в отношениях с группой Эдди Рубина в Беркли наметилась некоторая напряженность. Нам в Лейпциге уже стало ясно, что пиросеквенирование по крайней мере в десять раз эффективнее, чем бактериальное клонирование. Еще раньше у нас создалось впечатление, что в процессе клонирования большое количество ДНК теряется и происходит это, когда бактерию “вынуждают” присоединить к себе чужую ДНК. Но Эдди спорил, что низкая эффективность опытов с пещерными медведями не более чем случайное стечение обстоятельств. Он, как всегда, был полон энтузиазма во время регулярных телефонных конференций между нашими группами. Я разрывался. С одной стороны, после многолетнего топтания на месте мы не только сможем прочитать неандертальский геном, но даже сделать это несколькими способами. А с другой — мы скорее примем на вооружение методики, требующие граммов исходного материала, а не килограммов, как у Эдди. Пиросеквенирование 454 отвечало всем требованиям эксперимента, но Эдди в конце концов убедил меня еще раз попробовать клонирование. И я решил параллельно провести два эксперимента по двум разным методикам на материале — да-да — реальной неандертальской ДНК.
Мы приготовили два экстракта из неандертальской кости самой лучшей сохранности, из образца, известного как Vi-80. Из него в 2004 году Давид Серр секвенировал высокополиморфную часть мтДНК. В середине октября 2005-го мы отправили вытяжки в 454 Майклу Эгхольму для прямого секвенирования и в лабораторию Эдди Рубина для клонирования в бактериях и последующего секвенирования. Вытяжки готовил Йоханнес Краузе в нашей “чистой комнате”. Мы все очень волновались, не занесут ли инородные ДНК в наши “чистые” экстракты при работе в “чужих” лабораториях в Калифорнии и Коннектикуте. Ведь предстоящие эксперименты должны показать, какая из методик лучше, и ее-то мы и развернем в наших “чистых” помещениях.
А в это время в лабораторию прибывает новый дипломник, Эдриан Бриггс. Приехал он прямиком из Оксфорда, где оканчивал начальные курсы, а дядя его, Ричард Рэнгем, был известным приматологом в Гарварде. Учитывая семейные связи и оксфордское образование, я ожидал появления высокомерного сноба, но все мои страхи оказались совершенно необоснованными. И даже больше: Эдриан обладал уникальной способностью мыслить в количественных категориях, не свойственной ни одному из членов моей команды. Но самым удивительным в его характере было то, что при нем человек никогда не чувствовал себя глупым, хотя Эдриан мыслил быстрее и объемнее, чем любой из нас. Например, если я опирался только лишь на экспертное чутье, когда говорил о потерях ДНК при клонировании в бактериях и при создании библиотек ДНК пещерного медведя, то Эдриан представил расчеты. Он определил, что в бактериальных библиотеках Эдди Рубина в конечном итоге оказывалось только около полпроцента ДНК из вытяжек костей пещерных медведей. Еще Эдриан посчитал, что для секвенирования трех миллиардов с гаком нуклеотидов из медвежьего или неандертальского генома нам понадобится выделить и секвенировать 600 миллионов бактериальных клонов. А это непосильная задача даже для всего Объединенного института генома Эдди. С этими расчетами мои сомнения обрели весомую базу: процесс клонирования по эффективности не отвечал задаче составления неандертальского генома. В январе 2006-го последовал трудный и напряженный телефонный разговор с группой Эдди. Эдриан тогда доложил результаты своих расчетов. Эдди продолжал настаивать, что в экспериментах с пещерным медведем и при составлении библиотек просто что-то пошло не так. Но мы не должны забывать, что тем временем наши параллельные опыты в 454 и у Эдди шли полным ходом.
Пиросеквенированием палео-ДНК занимались не мы одни. В начале 2006-го, пока Эд Грин анализировал информацию по пещерным медведям и мамонтам, в Science вышла статья, написанная Хендриком Пойнаром, моим бывшим студентом, работавшим к тому моменту в Университете Макмастера в Онтарио, и Стивеном Шустером из Пенсильванского университета. Они применили методику пиросеквенирования, прочитав все молекулярные цепочки из вытяжек, то есть сделали то же, что и мы в