Кроме всего прочего, такая структура ДНК несет информацию. Основания A, T, Г и Ц могут располагаться вдоль цепи в любом порядке, например AATЦAГTЦAГГЦATT… — как сообщение, написанное четырехбуквенным алфавитом. Даже двоичный компьютерный код, простой двухбуквенный алфавит, может нести любой объем информации (в том числе всю эту книгу), а четыре буквы тем более способны передать всю наследственную информацию при условии, что сообщения достаточно длинные. Крик и Уотсон завершили создание своей модели 7 марта 1953 г. и отправили статью в журнал Nature через день после того, как две статьи Франклин прибыли в редакцию Acta Crystallographica. Когда Уилкинс увидел препринт их статьи (к тому времени Франклин уже перешла в Биркбек-колледж), он предложил, чтобы его команда опубликовала короткую статью параллельно со статьей Крика и Уотсона «с демонстрацией спиральности в общих чертах»{41}, и вскользь заметил, что поскольку Франклин и Гослинг также собирались кое-что опубликовать, то должны быть «как минимум три короткие статьи в Nature».
Эти «три короткие статьи» были опубликованы в номере журнала от 25 апреля 1953 г. Первой шла статья Крика и Уотсона, в которой утверждалось, что их модель была разработана благодаря правилам Чаргаффа и что она была подтверждена данными рентгеноструктурного анализа, тогда как на самом деле модель была разработана благодаря рентгеноструктурным данным и подтверждена правилами Чаргаффа[56]. Следующей шла статья Уилкинса, Стоукса и их коллеги Герберта Уилсона (1929–2008), в которой были суммированы сведения об исследованиях с применением рентгеновского излучения в качестве доказательства общей идеи о спиральной структуре ДНК. Последней шла статья Франклин и Гослинга с тем самым фото 51, которое сыграло ключевую роль в создании модели Уотсона — Крика. Никто, и точно не Франклин, не мог догадаться по содержанию этих статей, что фото 51 было так важно для Уотсона и Крика. Эта третья статья, по сути, являлась слегка измененной версией статьи, дописанной 17 марта, за день до того, как Уилкинс отправил в Кембридж предложение опубликовать «три короткие статьи». В статье приводились подробные сведения о строении двойной спирали, но без яркой идеи о принципе парной организации оснований.
В 1962 г. за эту работу Крик, Уотсон и Уилкинс получили Нобелевскую премию по физиологии и медицине. Иногда утверждается, что Франклин стала очередной жертвой сексизма Нобелевского комитета; но в 1958 г. она умерла от рака, которым заболела, скорее всего, из-за работы с рентгеновским излучением. Она бы не смогла получить эту награду, даже если бы комитет премии захотел признать ее заслуги, потому что Нобелевская премия не вручается посмертно. Если кто-то и нуждается в нашем сочувствии, то это, безусловно, Гослинг, чья работа по кристаллизации ДНК и получению дифракционных снимков была очень важна. Нобелевские премии присуждались и за гораздо меньшие заслуги.
Но на открытии того, что ДНК является носителем генетического кода, рассказ о развитии нашего понимания эволюции не заканчивается. Биологам еще предстояло расшифровать этот код и выяснить, как генетическая информация передается от содержащихся в хромосомах молекул ДНК в прочие части клеток. Это привело — и приводит по сей день — к новым открытиям в области эволюции, в том числе довольно неожиданным. Оказалось, что, хотя Ламарк был, мягко говоря, не совсем прав, неправ он тоже был далеко не полностью.
Глава 9. Новый ламаркизм
Как только выяснилось, что в ДНК содержится код жизни — набор инструкций, используемых клеткой для производства белков, которые в действительности и обеспечивают жизнедеятельность организма, а также формируют его части, ученые начали прилагать массу усилий, чтобы «взломать» этот код и выяснить, как работают эти механизмы. На решение этой задачи ушло много лет; над ней трудилось множество групп исследователей, которые проводили сложные биохимические эксперименты, хотя описать их подробно не позволяет формат этой книги. Но мы по крайней мере расскажем о принципах, лежавших в основе этих исследований, и о результатах всей этой работы.
Рассказ о расшифровке ДНК начинается с книги физика, а не биолога. Один из пионеров квантовой теории Эрвин Шредингер (1887–1961) был заинтригован идеей, что квантовые процессы могут играть важную роль при внесении изменений в молекулы, несущие код жизни, — то есть при мутациях. В то время, в 1940-е гг., носителями генетической информации все еще считались белки, но гипотезы Шредингера, опубликованные в 1944 г., не зависели от того, что конкретно это были за молекулы. Он проводил различие между кристаллом такого вещества, как поваренная соль, который состоит из бесконечного повторения одинаковых мотивов из атомов натрия и хлора, и кристаллом, который он назвал апериодическим, чье строение можно сравнить с «рафаэлевским гобеленом, который дает не скучное повторение, но сложный, последовательный и полный значения рисунок»[57], хотя этот рисунок и соткан из нитей ограниченного количества цветов. Информацию, переносимую молекулами жизни, Шредингер называл «шифровальным кодом» и указывал, как с помощью даже ограниченного числа символов (например, отдельных молекулярных групп) информацию можно передавать так же эффективно, как с помощью букв алфавита. Он отмечал, что «не нужно особенно большого количества атомов в такой структуре, чтобы обеспечить почти безграничное число возможных комбинаций» и что в азбуке Морзе два знака (точка и тире), объединенные в группы не более чем по четыре, дают тридцать различных кодирующих групп — достаточно, чтобы охватить весь английский алфавит и некоторые знаки препинания. Немного забегая вперед, скажем, что число перестановок четырех разных знаков равно 24 (4 × 3 × 2 × 1), а 20 разных знаков — приблизительно 24 × 1017 (24 с 17 нулями). Четырехбуквенного кода достаточно, чтобы описать все двадцать аминокислот в составе белков; 20 разных аминокислот вполне достаточно, чтобы описать все разнообразие белков в живых организмах.
Книга Шредингера «Что такое жизнь?» (What is Life?) оказала огромное влияние как на биологов, так и на физиков, которые во время Второй мировой войны насмотрелись на смерть и хотели исследовать жизнь. Среди тех, кто позже особо отмечал влияние идей Шредингера, были Морис Уилкинс, Эрвин Чаргафф, Фрэнсис Крик и Джеймс Уотсон. А сразу после публикации первых статей Уотсона и Крика о ДНК этой темой заинтересовался еще один физик, Георгий Гамов (1904–1968).
Его внимание привлекла скорее вторая статья кембриджской группы о ДНК, опубликованная в журнале Nature 30 мая 1953 г.{42} В то время он находился с визитом в Калифорнийском университете в Беркли, куда приехал из Вашингтона, где тогда работал. Позже он вспоминал:
Я шел по коридору радиационной лаборатории и наткнулся на Луиса Альвареса с журналом Nature в руках… Он сказал: «Взгляните, какую чудесную статью написали Уотсон и Крик». Так я ее впервые и увидел. А затем я вернулся в Вашингтон и начал размышлять о ней[58].
Плоды этих размышлений были опубликованы в журнале Nature в феврале 1954 г. Гамов ухватился за открытие, что ДНК состоит из четырех типов оснований, апериодически распределенных по ее нити, и подчеркнул, что молекулы белка могут строиться из цепочек аминокислот, удерживаемых рядом с ДНК так, что каждая аминокислота расположена напротив определенной кодирующей группы оснований ДНК. Детали предложенного им механизма были ошибочны, однако он объяснял:
Наследственные свойства любого конкретного организма можно выразить в виде длинного числа, записанного с использованием четырехзначной системы. С другой стороны, ферменты, чей состав должен полностью определяться молекулой дезоксирибонуклеиновой кислоты, являются длинными пептидными цепочками, образованными примерно двадцатью различными аминокислотами, и их можно считать длинными «словами», записанными 20-буквенным алфавитом.
В результате кропотливой работы, последовавшей за этим предположением, были установлены два ключевых факта. Во-первых, цепочки аминокислот не строятся непосредственно на ДНК. Когда клетке нужен конкретный белок (а как она «узнает», когда он ей нужен, до сих пор во многом остается загадкой), необходимый фрагмент ДНК высвобождается из двойной спирали одной из хромосом, используется как шаблон при синтезе цепочки РНК, а затем снова скручивается в спираль и упаковывается обратно в хромосому. Получившаяся цепочка РНК используется как шаблон для синтеза белка, после чего расщепляется для повторного использования ее компонентов. Во-вторых, хотя генетический код содержит четыре буквы, эти буквы используются для образования трехбуквенных слов (кодонов), каждое из которых обозначает конкретную аминокислоту или, в некоторых случаях, команды «старт» или «стоп» для строительства новой пептидной цепочки. Поскольку именно РНК, а не ДНК непосредственно участвует в синтезе белков, эти четыре буквы — A, У, Г и Ц. Например, тройка АГУ является кодоном аминокислоты серин, ГГУ — это валин, ЦЦА — пролин, а УАГ означает «стоп». Таким образом, последовательность оснований в молекуле РНК, например УЦЦAГУAГЦГГAЦAГ, следует читать как УЦЦ AГУ AГЦ ГГA ЦAГ.
Чтобы продемонстрировать, как это влияет на эволюцию, мы приведем пример из нашего алфавита. Вот предложение из трехбуквенных слов: КОТ БЫЛ СЫТ ПЕС БЫЛ ЗОЛ. За счет простой мутации, изменившей всего одну букву, в цепочке может появиться бессмысленное слово: КУТ БЫЛ СЫТ ПЕС БЫЛ ЗОЛ, и это может быть, а может и не быть важным для процессов, протекающих в клетке. Или может появиться новое правильное слово («правильное» в том смысле, что оно кодирует другую аминокислоту): КИТ БЫЛ СЫТ ПЕС БЫЛ ЗОЛ. В результате изменения одной аминокислоты в клетке может начаться синтез бесполезного белка. Или иногда может получиться белок даже более эффективный, чем исходный. Более резкие мутации могут менять целые слова — например, слово КОТ может превратиться в ЛЕВ — или вообще удалять слова: КОТ БЫЛ СЫТ БЫЛ ЗОЛ. А пропуск (или добавление) одной буквы может полностью изменить весь текст. Например, если убрать из исходного сообщения первую букву К, то мы получим ОТБ ЫЛС ЫТП ЕСБ ЫЛЗ ОЛ.