Концепции метаболического масштабирования сложно проверить опытным путем. Хоть мы здесь уже не раз представляли, как животные увеличиваются или уменьшаются в размерах, у настоящих слонов и мышей нет кнопок, позволяющих произвольно наращивать и снижать массу тела. Но у нас есть несколько хитроумных косвенных подходов. Например, Франк Юлихер, Йохен Ринк и их коллеги из Дрездена (Германия) недавно исследовали плоских червей, способных сильно – более чем в тысячу раз – увеличивать или уменьшать свою массу в зависимости от доступности пищи15. Примечательно, что зарегистрированная у них интенсивность обмена растет пропорционально массе тела в степени ¾, как и предсказывает закон Клайбера, и это не соответствует упомянутому выше показателю ⅔, характеризующему животных внутри вида. Ученые приписали эту форму масштабирования зависящим от массы изменениям в способах хранения жиров и сахаров внутри клеток червей. Нам только предстоит узнать, специфичен ли такой расклад для плоских червей или все животные приходят к закону Клайбера этим путем. Наша загадка остается загадочной. Чтобы разгадать ее, нам нужны новые данные, а может, новые животные.
Зависимости масштабирования, которые мы рассматривали в последних главах, отражают связи между клеточными механизмами, закодированными в геномах, и ограничениями действия физических законов на уровне больших масштабов. В третьей части книги мы увидим, как и зачем нам читать и переписывать геномы, перекраивая организмы так, чтобы это затрагивало их функции на разных масштабах. Можно предполагать, что изучение биофизических закономерностей масштабирования улучшает качество наших генетических предсказаний или что плоды генной инженерии позволяют нам лучше разбираться в законах масштабирования. Оба варианта могут быть справедливы.
Часть III. Конструирование организмов
Глава 13. Как мы читаем ДНК
Из предыдущих глав мы узнали, что жизнь предполагает тесное взаимодействие физических объектов и физических законов: молекулы, клетки и органы подчиняются принципам самосборки, регулирования, случайности и масштабирования. Категории объектов и законов не могут быть изолированы друг от друга. Например, белок такой, какой он есть, благодаря самосборке его аминокислот: подталкиваемые беспрестанным броуновским танцем, они исследуют возможности разных трехмерных форм. Геном организма связывает осязаемую материю с силами, которые придают ей форму, кодируя последовательности аминокислот и регуляторные мотивы, объединяющиеся физическими взаимодействиями. Следовательно, если изменить геном, изменится и создаваемый на его основе организм.
До сих пор в этой книге я подсвечивал главным образом проявления физических законов в естественных процессах живого мира. Теперь, в третьей части, мы рассмотрим, как полученные знания применяются для внесения минимальных либо выраженных изменений в жизнедеятельность существ. Физическая природа биологической материи имеет решающее значение не только для внедрения новых технологий, но и для следствий их применения. Например, выводы, которые мы можем сделать из различий между последовательностями ДНК, или спектры вероятных и невероятных исходов изменения этих последовательностей зависят от организации процессов считывания ДНК; от архитектуры белков, синтезируемых в клетках; от сил, направляющих и ограничивающих самосборку; от случайности, присущей микроскопической среде, и от иных биофизических факторов. Помня о физическом контексте жизни, мы научимся различать варианты с высокой и низкой вероятностью, осуществимые и надуманные, а это поможет нам составить реалистичное представление о влиянии биотехнологий настоящего и будущего.
В главе 15 мы доберемся до методов переписывания генома. Но прежде чем писать геном, нужно научиться его читать, распознавая последовательности A, Ц, Г и T, характерные именно для него. Мы овладели этим навыком, создав поразительные технологии, которые используют физические свойства молекулы жизни и созидательную силу самосборки вкупе с микроскопической случайностью.
Даже само по себе чтение ДНК дает нам ценные сведения, на основе которых можно делать практические выводы. Например, выявление необычных нуклеотидных последовательностей (мутаций), сопряженных с повышенной вероятностью развития рака или других серьезных заболеваний может подтолкнуть нас к принятию превентивных мер. Или, секвенируя геномы клеток злокачественных опухолей и находя в них специфические генетические «подписи», мы можем подбирать более подходящее лечение. Эти и многие другие применения прочтения ДНК требуют картирования молекулы диаметром два нанометра и длиной метр.
В главе 1 мы узнали, что молекула ДНК напоминает цепочку из звеньев всего четырех типов. Почему же тогда нам нелегко читать последовательность этих звеньев? Если я напишу слово «молекула», вы сразу увидите последовательность букв в нем: М-О-Л-Е-К-У-Л-А. Проблема ДНК в ее малом размере. Длина каждого нуклеотида составляет около трети нанометра, а нанометр – это миллиардная доля, или 10–9, метра. Такой размер очень мал не только для человеческого глаза, но и для любого светового микроскопа. Свет, как и радиоволны или рентгеновские лучи, представляет собой электромагнитную волну – распространяющееся в пространстве возмущение электрического и магнитного полей. У видимого света длина волны, то есть расстояние между ее гребнями, составляет несколько сотен нанометров, а точная величина зависит от цвета этого света. По законам оптики мельчайшие детали, которые можно различить, по размеру сопоставимы с длиной волны падающего на них света – и неважно, какие линзы, зеркала и микроскопы создает человек. Все, что меньше, сливается воедино. Даже если бы мы пометили A, Ц, Г и T разными цветами или маячками, метки отдельных нуклеотидов потерялись бы в море из тысяч соседних – не было бы никакой надежды прочитать ДНК.
Вы можете предположить, что выйти из затруднения позволит получение изображения с помощью не видимого света, а чего-то другого. Но и это не работает. Более короткие волны, несомненно, существуют. Так, длина волны рентгеновского излучения составляет от 0,01 до 10 нанометров. Электроны ведут себя как волны, и если направить их в электронные микроскопы, то длины их волн составляют десятые доли нанометра и даже меньше. Теоретически нуклеотиды ДНК позволила бы разглядеть любая из этих техник, однако на практике возникает множество проблем: рентгеновское излучение сложно фокусировать; высокие энергии рентгеновских лучей и электронных пучков разрушительны; к тому же разные типы нуклеотидов для рентгена и электронов почти идентичны, поэтому мы не смогли бы прочитать последовательность ДНК, даже если бы получили ее изображение. Тем, кто читал главу 1, может показаться странным, что рентгеновское излучение в этом случае бесполезно, ведь именно с его помощью в 1953 году была открыта двойная спиральная структура ДНК. Но для этого рентгеном просвечивали целый кристалл ДНК – решетку из триллионов идентичных молекул. При взаимодействии волн со всеми этими нитями ДНК обнажается общая для них структура винтовой лестницы, последовательность же отдельной нити различить нельзя.
Получается, читать ДНК нелегко. Через 15 лет после открытия пространственной структуры ДНК Рэй Ву и Дейл Кайзер сумели распознать 12 нуклеотидов в геноме вируса[49]. Весь этот геном содержит около 48 тысяч нуклеотидов. Пять лет спустя Аллан Максам и Уолтер Гилберт получили последовательность из 24 нуклеотидов ДНК – область lac-оператора (см. главу 4). Для этого потребовалось два года напряженной работы – на секвенирование с такой скоростью генома человека ушло бы 250 миллионов лет. Явно были нужны куда более эффективные методы.
И такие методы появились1. Несколько следующих страниц мы посвятим именно им – и не только из-за их значимости в современном мире, но и потому, что одним своим существованием они заявляют о важности познания физической природы ДНК и других биомолекул. Понятийным фоном для этой практической главы послужат такие свойства, как размер, жесткость и электрический заряд, и такие темы, как самосборка и предсказуемая случайность.
В 1976–1977 годах появились два остроумных метода определения последовательности ДНК: один разработали те самые Максам и Гилберт, а другой – Фредерик Сэнгер с коллегами. Метод Сэнгера оказался проще и в итоге доминировал в отрасли больше двух десятилетий. Я начну рассказ о техниках чтения ДНК именно с секвенирования по Сэнгеру.
Представьте, что у вас нет возможности последовательно, буква за буквой читать слово М-О-Л-Е-К-У-Л-А, но вы видите перед собой множество оборванных копий этого слова, в каждой из которых различима лишь последняя буква: «??Л», «?О», «?????У» и так далее. Заметив, что все трехбуквенные фрагменты оканчиваются на Л, все четырехбуквенные – на Е и так далее, вы установите, что вместе они образуют слово МОЛЕКУЛА. В принципе, в этом и состоит суть метода Сэнгера и еще нескольких подходов: чтение осуществляется путем распознавания отдельных кусочков, а не последовательного движения по цепи.
В главе 1 мы уже описывали несколько шагов из этого рецепта. Представьте себе не весь геном, а что-то более податливое – скажем, фрагмент ДНК размером несколько сотен пар нуклеотидов. Полимеразная цепная реакция (ПЦР) создает несметное число копий этого фрагмента, а тепло разделяет каждую двойную спираль на одноцепочечные половинки. Пока забудьте об одной из них и представьте миллионы идентичных одноцепочечных ДНК. Как вы помните, ДНК-полимераза создает идеальный комплемент любой цепи ДНК: руководствуясь принципом комплементарности, она сшивает из свободных нуклеотидов новую партнерскую цепь. А теперь представьте, что ученый применяет ДНК-полимеразу для репликации ДНК, как в нормальной ПЦР, но вводит в массив свободных нуклеотидов небольшое количество дефектных молекул: они мало отличаются от обычных A, Ц, Г, T и по-прежнему встраиваются в растущую цепь ДНК, но уже к ним новые нуклеотиды присоединиться не могут. Полимераза не умеет отбраковывать такое строительное сырье, и если ей попадается нормальный свободный нуклеотид, новая цепь удлиняется, если же встраивается измененный вариант, он блокирует дальнейший синтез и остается в цепи последним. Поскольку добавление терминирующих нуклеотидов происходит по воле случая и сравнительно редко, ученый получает множество цепочек ДНК, которые начинаются одинаково, но различаются по длине.