II.13. СВОЙСТВА ГЕНЕТИЧЕСКОГО КОДА
Белки выполняют огромное множество функций, и, в конечном счете, именно они определяют строение организма (фенотип).
Таким образом, информация передается в одном направлении — от ДНК к РНК и от РНК к белкам. Никаких механизмов переноса информации в обратную сторону — от белков к РНК или от РНК к ДНК — поначалу обнаружено не было, что и укрепило веру в невозможность такого переноса. Потом, правда, оказалось, что в природе существуют вирусы, у которых хранилищем наследственной информации служат молекулы РНК (а не ДНК, как у всех прочих организмов), и у них есть специальные ферменты, которые умеют осуществлять обратную транскрипцию, т. е. переписывать информацию из РНК в ДНК. Созданная таким путем ДНК встраивается в хромосомы клетки-хозяина и размножается вместе с ними. Поэтому с подобными РНК-вирусами очень трудно бороться (печально известный ВИЧ относится к их числу). Но вот обратной трансляции — переписывания информации из белков в РНК — не обнаружено и по сей день.
Генетический код обладает следующими свойствами:
A. Триплетность.
Б. Универсальность.
B. Вырожденность
Г. Отсутствие знаков препинания и наличие "стоп-кодонов"
Д. Неперекрываемость
А. ТРИПЛЕТНОСТЬ
Триплетность — каждая аминокислота кодируется тремя нуклеотидами. Кодон (триплет) — последовательность из трех оснований в ДНК, которая соответствует информационной матричной РНК и кодирует какую-либо аминокислоту. Кодоны действительно включают три азотистых основания (тройка или триплет нуклеотидов). Например, триплет ЦАТ кодирует аминокислоту гистидин.
Б. УНИВЕРСАЛЬНОСТЬ.
Генетический код одинаков, универсален для всех живых организмов на Земле: от Е. соП до человека, т. е. в клетке любого из существ одинаковая последовательность нуклеотидов будет кодировать ту же аминокислоту. Впрочем, правильнее утверждать, что генетический код практически универсален, т. к. в некоторых генетических системах (например, в генах митохондрий и хлоропластов) есть некоторые отличия от стандартного кода, присущего организмам.
При исследовании генетического кода в опытах in vivo были также получены доказательства универсальности кода. Однако в последнее время выяснены некоторые отличия кода в митохондриях эукариот животных, включая человека, отличающегося четырьмя кодонами от генетического кода цитоплазмы, даже тех же клеток. В частности, АУГ, являющийся обычно инициаторным, начинающим, кодоном, кодирует также метионин в цепи, и УГА, являющийся нонсенс-кодоном, кодирует в митохондриях триптофан. Кроме того, кодоны АГА и АГГ являются для митохондрий скорее терминирующими, а не кодирующие аргинин. Как результат этих изменений, для считывания генетического кода митохондрий требуется меньше разных тРНК, в то время как цитоплазматическая система трансляции обладает полным набором тРНК.
В. ВЫРОЖДЕННОСТЬ ИЛИ РАЗМЫТОСТЬ ГЕНЕТИЧЕСКОГО КОДА.
Генетический код для аминокислот является вырожденным. Вырожденность — это когда одна аминокислота может кодироваться несколькими разными триплетами. Это означает, что подавляющее число аминокислот кодируется несколькими кодонами, за исключением метионина и триптофана, по существу, все остальные аминокислоты имеют более одного специфического кодона. Вырожденность кода оказывается неодинаковой для разных аминокислот.
Так, если для серина, аргинина и лейцина имеется по 6 кодовых слов, то ряд других аминокислот, в частности глютаминовая кислота, гистидин и тирозин, имеют по два кодона, а триптофан — только 1. Следует отметить, что вырожденность чаще всего касается только третьего нуклеотида, в то время как для многих аминокислот первые два нуклеотида являются общими.
Вырожденность является следствием триплетности кода, т. к. четыре нуклеотида, взятые по 3, могут закодировать 43 = 64 разных объекта, тогда как аминокислот всего 20. Из 64 кодонов три кодона отведены для прекращения процесса и называются стоп-кодонами. Последовательность первых двух нуклеотидов определяет в основном специфичность каждого кодона, в то время как третий нуклеотид менее существен. В последнее время появились доказательства гипотезы "два из трех", означающей, что код белкового синтеза, возможно, является квази- или псевдодуплетным.
Из 64 триплетов 61 смысловые, то есть они кодируют 20 аминокислот, а три триплета, а именно УАГ, УАА, УГА, являются бессмысленными. Эти три триплета, которые обозначают конец транскрипции (стоп-кодоны). Еще один специальный кодон, стартовый (инициирующий) кодон, маркирует начало трансляции и кодирует метионин.
Для "перевода" с языка азотистых оснований нуклеиновых кислот (ДНК и РНК) на язык белков (последовательность аминокислот в полипептидной цепи) можно воспользоваться Таблицей генетического кода или онлайновой машиной-переводчиком созданной в Европейском институте биоинформатики.
До последнего времени считалось, что один кодон всегда кодирует одну аминокислоту. Зная последовательность нуклеотидов в матричной РНК, мы всегда можем выстроить последовательность аминокислот в белке. Однако оказалось, что вырожденность, а я бы назвал это свойство размытостью, развита ещё больше и в другую сторону — не только несколько кодонов могут кодировать одну и ту же аминокислоту, но и один и тот же кодон может кодировать несколько аминокислот. Недавно в ядерном геноме инфузории Euplotes crassus найдено целых три гена транспортных РНК, распознающих кодон УГА: селеноцистеиновая тРНК и два варианта цистеиновой тРНК. В митохондриальном геноме Euplotes кодон УГА (соответствует кодону ТГА в ДНК) кодирует триптофан, и в соответствии с этим имеется еще четвертая, митохондриальная триптофановая тРНК, распознающая этот кодон. Чтобы проверить, насколько универсальным является механизм кодирования селеноцистеина у разных организмов, исследователи пересадили селенопротеиновые гены инфузории в человеческие эмбриональные клетки. Оказалось, что человеческий аппарат синтеза белка правильно понимает смысл тех кодонов УГА в генах инфузории, которые кодируют селеноцистеин (46).
Человеческие клетки успешно синтезировали селенопротеины на основе генов инфузории, используя при этом человеческую селеноцистеиновую тРНК. Однако это произошло только с теми селенопротеиновыми генами инфузории, в которых кодон УГА один, и он кодирует селеноцистеин. Наткнувшись на кодон УГА, кодирующий у инфузории цистеин, человеческие клетки интерпретировали его как стоп-кодон и прекращали синтез белковой молекулы. Что и понятно, ведь у человека нет цистеиновых тРНК, распознающих кодон УГА. То есть, один и тот же ген может работать и у человека и у инфузории (230).
Вырожденность генетического кода ведет к возможности непроявляющихся мутаций (см. раздел 6.6).
Г. ОТСУТСТВИЕ ЗНАКОВ ПРЕПИНАНИЯ И НАЛИЧИЕ СТОП-КОДОНОВ
Триплеты не отграничены друг от друга, но есть сочетания нуклеотидов, обозначающих "точку", конец считывания — "стоп-кодоны". Другой отличительной особенностью генетического кода является его непрерывность, отсутствие знаков препинания, то есть сигналов, указывающих на конец одного кодона и начало другого. Другими словами, код является линейным, однонаправленным и непрерывающимся: АЦГУЦГАЦЦ. Если удалить первые два нуклеотида из нашей последовательности, то с данной последовательности будет синтезироваться другой пептид. Стоп-кодоны выполняют важную функцию в синтезе белка в рибосомах — функцию окончания (терминации) синтеза. Если они помещены 3 раза подряд, то полимеризация белка заканчивается.
Д. НЕПЕРЕКРЫВАЕМОСТЬ
Ранее считалось, что каждый участок ДНК хранит информацию не более чем об одном белке. Иными словами, если участок ДНК кодирует белок, то не может кодировать (начиная с какого-нибудь другого нуклеотида) другой белок. Однако открытие альтернативного сплайсинга и возможности редактирования мРНК показывает, что данное свойство устарело.
Итак, природа разработала специальные приемы кодирования информации, что позволяет переходить с одной буквенной системы, каковой являются нуклеотиды, к другой — аминокислотной.
II.14. СИНТЕЗ БЕЛКОВЫХ ЦЕПЕЙ
Белковый синтез, или процесс трансляции, может быть условно разделен на два этапа: активирование аминокислот и собственно процесс трансляции, то есть синтез цепи аминокислот. Трансляция требует высоких энергетических затрат. При присоединении одной аминокислоты к растущему полипептиду гидролизуется четыре макроэргические связи. Две молекулы АТФ гидролизуются при активации аминокислоты, и две молекулы ГТФ расходуются во время элонгации. Кроме того, при начале синтеза и его окончании на каждую полимерную молекулу белка расходуется по одной молекуле ГТФ.
Совокупность белковых машин, используемых для синтеза полипептидной цепи с определенной первичной структурой на основе зрелой мРНК, включает около 200 типов макромолекул — белков и нуклеиновых кислот. Среди них около 100 макромолекул, участвующих в активировании аминокислот и их переносе на рибосомы (все тРНК, аминоацил-тРНК-синтетазы), более 60 макромолекул, входящих в состав 70S или 80S рибосом, и около 10 макромолекул (называемых белковыми факторами), принимающих непосредственное участие в системе трансляции.
Синтез белка начинается с N-конца и завершается С-концом, т. е. процесс протекает в направлении NH2 → COOH. Процесс синтеза цепочки аминокислот можно разделить на три стадии. Первой стадией трансляции является связывание рибосомы со стартовым (инициирующим) кодоном мРНК вблизи так называемого 5'-конца мРНК. Затем к стартовому кодону, а это почти всегда у эукариотов триплет, кодирующий метионин, прикрепляется тРНК, несущая метионин. Молекула тРНК связывается в виде комплекса с ГТФ-содержащим белком, называемым фактором удлинения.
Затем вторая тРНК, соединенная с аминокислотой, соответствующей второму кодону, взаимодействует своим антикодоном с кодоном мРНК. Затем рибосомная "пептидилтрансфераза" катализирует (без потребления АТФ) сшивание аминокислот. Пептидилтрансферазная (то есть способносность полимеризовать аминокислоты) активность рибосом не зависит от белка. Эта реакция осуществляется рибосомными РНК. Каталитически активные РНК получили название рибозимов.