Celera 8 декабря 1998 года и встречен с большим восторгом и всеобщим вздохом облегчения. Устройство извлекли из деревянного ящика, поместили в комнату без окон в подвале – его временное пристанище, и сразу приступили к пробным испытаниям. Когда он заработал, мы получили очень качественные результаты. Но эти первые экземпляры секвенаторов работали весьма нестабильно, а некоторые были неисправны с самого начала. С работающими тоже постоянно возникали проблемы, порой чуть ли не ежедневно. Например, в программе управления роботом-манипулятором появилась серьезная ошибка – иногда механическая рука робота на большой скорости выдвигалась над устройством и с размаху врезалась в стену. В результате секвенатор останавливался, и для его починки приходилось вызывать ремонтную бригаду. Некоторые секвенаторы выходили из строя из-за блуждающих лазерных лучей. Для защиты от перегрева использовались ленты из фольги и скотча, поскольку при высокой температуре из последовательностей испарялись окрашенные в желтый цвет фрагменты Gs.
Хотя устройства теперь поставлялись регулярно, около 90 % из них с самого начала были неисправны. В некоторые дни секвенаторы вообще не работали. Я твердо верил в Майка Ханкапиллера, однако моя вера сильно поколебалась, когда он стал винить в неудачах наших сотрудников, строительную пыль, малейшие колебания температуры, фазы Луны и так далее. Некоторые из нас от стресса даже поседели.
Не подающие признаков жизни 3700-е, ожидающие отправки обратно в ABI, стояли в кафетерии, и, в конце концов, дошло до того, что нам приходилось обедать практически в «морге» секвенаторов. Я был в отчаянии – ведь мне ежедневно нужно было определенное количество работающих устройств, а именно 230! За примерно 70 миллионов долларов компания ABI обещала предоставить нам или 230 абсолютно исправных устройств, работающих без перебоев целый день, или 460, которые работали хотя бы полдня. Кроме того, Майку следовало удвоить количество квалифицированного технического персонала для незамедлительного ремонта секвенаторов после поломки.
Однако какой интерес заниматься всем этим за те же деньги! К тому же у Майка появился еще один клиент – государственный геномный проект, руководители которого уже начали закупать сотни устройств безо всякого тестирования. Будущее Celera зависело от этих секвенаторов, но Майк, по-видимому, не понимал, что и будущее ABI от них зависело. Конфликт был неизбежен, что и проявилось на важном совещании инженеров ABI и моей команды, состоявшемся в Celera.
После того, как мы сообщили об огромном количестве дефектных приборов и о том, как много времени требуется на исправление поломок секвенаторов, Майк снова попытался свалить всю вину на моих сотрудников, но даже его собственные инженеры с ним не согласились. В конце концов вмешался Тони Уайт. «Мне все равно, сколько это стоит и кого нужно прибить за это», – сказал он. Тогда он в первый и последний раз действительно встал на мою сторону. Он приказал Майку как можно скорее обеспечить поставку новых секвенаторов, даже в ущерб другим клиентам и даже если пока неизвестно, во сколько это обойдется.
Тони также распорядился, чтобы Майк нанял еще двадцать специалистов для оперативного ремонта и определения причин всех проблем. На деле это было легче сказать, чем сделать, потому что опытных работников не хватало. Начать с того, что Эрик Ландер переманил двоих из самых квалифицированных инженеров, и по мнению Майка, тут тоже были виноваты мы. Повернувшись к Марку Адамсу, Майк сказал: «Вы должны были нанять их раньше, чем это сделал кто-то другой». После такого заявления я окончательно потерял к нему всякое уважение. Ведь согласно нашему договору, я не мог нанимать сотрудников ABI, в то время как Ландер и другие руководители государственного проекта генома имели на это право, поэтому очень скоро лучшие инженеры ABI начали работать на наших конкурентов. К концу совещания я понял – проблемы остались, но луч надежды на улучшение все-таки забрезжил.
Так и произошло, хотя и не сразу. Наш арсенал секвенаторов увеличился с 230 до 300 устройств, и если 20–25 % из них отказывали, мы все-таки имели около 200 работающих секвенаторов и кое-как справлялись с поставленными задачами. Технические сотрудники работали героически и неуклонно увеличивали темп ремонтных работ, сокращая простои. Все это время я думал об одном: то, что мы делаем, – выполнимо. Неудачи возникали по тысяче причин, но провал не входил в мои планы.
Мы всерьез взялись за секвенирование генома дрозофилы 8 апреля, примерно тогда, когда уже должны были завершить эту работу. Я, конечно, понимал, что Уайт хочет от меня избавиться, но делал все от меня зависящее ради выполнения главной задачи. Напряжение и беспокойство преследовали меня и дома, но с самым своим «доверенным лицом» я эти проблемы обсуждать не мог. Клэр откровенно демонстрировала свое презрение, видя, насколько я поглощен делами Celera. Ей казалось, что я повторяю те же ошибки, которые делал, работая в TIGR/HGS. К 1 июля я чувствовал себя глубоко подавленным, как это уже было во Вьетнаме.
Поскольку конвейерный метод пока у нас не работал, нам предстоял тяжелый изнурительный труд – заново «склеивать» фрагменты генома. Чтобы обнаруживать совпадения и не отвлекаться на повторы, Джин Майерс предложил алгоритм на основе ключевого принципа моего варианта метода дробовика: секвенировать оба конца всех полученных клонов. Поскольку Хэм получал клоны трех точно известных размеров, мы знали, что две концевые последовательности находятся на строго определенном расстоянии друг от друга. Как и прежде, этот способ «нахождения пары» даст нам прекрасную возможность снова собрать геном.
Но поскольку каждый конец последовательности секвенировался отдельно, для обеспечения четкой работы этого метода сборки нужно было вести тщательный учет – для абсолютной уверенности, что мы смогли правильно соединить все пары концевых последовательностей: ведь если хотя бы одна из ста попыток приведет к ошибке и не найдется соответствующая пара для последовательности, все пойдет насмарку и метод не сработает. Один из способов избежать этого – использование штрих-кода и датчиков для отслеживания каждого этапа процесса. Но в начале работы у лаборантов не было необходимого программного обеспечения и оборудования для секвенирования, поэтому приходилось делать все вручную. В Celera небольшая команда, менее двадцати человек, каждый день обрабатывала рекордное количество клонов – 200 тысяч. Мы могли предвидеть некоторые ошибки, например неправильное прочтение данных из 384 лунок, а затем использовать компьютер для нахождения явно ошибочной операции и исправить положение. Конечно, еще оставались отдельные недочеты, но это только подтверждало мастерство команды и уверенность, что мы можем устранять ошибки.
Несмотря на все сложности, мы сумели за четыре месяца прочесть 3156 миллионов последовательностей, всего около 1,76 миллиарда нуклеотидных пар, содержащихся между концами 1,51 миллиона клонов ДНК. Теперь настала очередь Джина Майерса, его команды и нашего компьютера – нужно было сложить все участки вместе в хромосомы дрозофилы. Чем длиннее становились участки, тем менее точным оказывалось секвенирование. В случае дрозофилы последовательности насчитывали в среднем 551 нуклеотидную пару, и средняя точность была 99,5 %. Если иметь 500-буквенные последовательности, почти любой может определить места совпадений, передвигая одну последовательность вдоль другой до тех пор, пока не обнаружатся совпадения.
Для секвенирования Haemophilus influenzae у нас было 26 тысяч последовательностей. Для сравнения каждой из них со всеми остальными потребовалось бы проделать 26 тысяч сравнений в квадрате, или 676 миллионов. Геном дрозофилы, с его 3,156 миллиона прочтений потребовал бы около 9,9 триллиона сравнений. В случае человека и мыши, где мы произвели 26 миллионов прочтений последовательности, требовалось около 680 триллионов сравнения. Поэтому не вызывает удивления, что большинство ученых весьма скептически относились к возможному успеху этого метода.
Хотя Майерс и обещал все наладить, у него постоянно возникали сомнения. Теперь он работал дни и ночи напролет, выглядел измученным и как-то посерел. К тому же у него были проблемы в семье, и он стал большую часть свободного времени проводить с журналистом Джеймсом Шривом, который писал о нашем проекте и как тень следил за ходом исследований. Пытаясь как-то отвлечь Джина, я взял его с собой на Карибы – расслабиться и походить под парусом на моей яхте. Но и там он часами сидел, скрючившись над ноутбуком, нахмурив черные брови и щуря свои черные глаза от яркого солнца. И, несмотря на невероятные трудности, Джин и его команда сумели за полгода сгенерировать более полумиллиона строк компьютерного кода для нового ассемблера.
Если бы результаты секвенирования были стопроцентно точными, без повторяющихся ДНК, сборка генома была бы относительно несложной задачей. Но в реальности геномы содержат большое количество повторяющихся ДНК разного типа, разной длины и частоты. С короткими повторами, состоящими из менее пяти сотен пар нуклеотидов, справиться относительно легко, с более длинными повторами – сложнее. Для решения этой проблемы мы использовали метод «нахождения пары», то есть секвенировали оба конца каждого клона и получали клоны разной длины для обеспечения максимального количества совпадений.
Алгоритмы, закодированные в полумиллионе строк компьютерного кода команды Джина, предполагали поэтапный сценарий – от самых «безвредных» действий, например простого перекрывания двух последовательностей, до более сложных, например использования обнаруженных пар для слияния островков перекрывшихся последовательностей. Это было похоже на сложение головоломки, когда небольшие островки собранных участков составляются вместе и образуют бо́льшие острова, а затем весь процесс повторяется снова. Только вот в нашей головоломке было 27 миллионов фрагментов. И было очень важно, чтобы участки брались из последовательности высокого качества сборки: представьте себе, что будет, если вы собираете пазл, а цвета или изображения его элементов нечеткие и размытые. Для дальнего порядка последовательности генома значительная доля прочтений должна быть в виде совпадающих пар. Учитывая, что результаты все еще отслеживались вручную, мы с облегчением обнаружили, что 70 % имевшихся у нас последовательностей именно такие. Специалисты по компьютерному моделированию объяснили, что при меньшем проценте собрать нашего «шалтая-болтая» было бы невозможно.