В табл. 3-2 описывается несколько примеров ключевых биологических функций, для которых два или несколько неродственных ферментов по-разному представлены в частично дополнительных, но обычно перекрывающихся группах эволюционных линий. Даже эти отдельные примеры показывают, что ЗНОГ происходит в самых различных функциональных системах и путях. В дальнейшем, с заметным увеличением числа секвенированных геномов, стало ясно, что ЗНОГ и утрата генов в отдельных линиях настолько широко распространены, что лишь малое число функций являются действительно мономорфными и вездесущими (то есть представлены ортологичными генами во всех организмах). Вместе с тем универсальное ядро жизни уменьшилось почти до исчезновения: все, что остается универсальным, — это около тридцати генов белков трансляции и три больших субъединицы РНК-полимеразы, а также примерно равное число генов структурных РНК (рРНК и тРНК).
Таблица 3-2
Примеры замещения неортологичных генов
Данные в основном по Omelchenko et al. 2010.
Даже при исключении паразитических бактерий перечень универсальных генов расширяется незначительно (Koonin, 2003). Таким образом, за исключением небольшого числа генов, участвующих в основных этапах передачи информации, не существует универсального генетического ядра жизни, в связи с повсеместными ЗНОГ и потерей генов. Концепция небольшого, универсального набора функций, необходимых для поддержания клетки, остается жизнеспособной, но, учитывая комбинаторику ЗНОГ, этот наименьший набор функциональных ниш может заполняться огромным разнообразием генных ансамблей.
Результаты сравнительной геномики приводят к ключевому обобщению, которое позволяет нам выполнять продуктивные эволюционные исследования: основные единицы эволюции могут быть довольно четко определены, и единицы эти — кластеры ортологичных генов, или эволюционные домены (КОГ), или, еще точнее, линии эволюционирующих ортологичных генов (доменов). Истории отдельных генов часто сложны (а во многих случаях даже чрезвычайно сложны) и включают в себя множественные утраты генов, дупликацию и горизонтальный перенос (ниже в настоящей книге мы обсудим эти явления подробнее, см. гл. 5 и 7). Предрасположенность генов к дупликации, утрате и переносу варьирует в широких пределах. Однако, невзирая на все эти осложнения, атомарное свойство наборов ортологичных генов твердо соблюдается: КОГ суть естественные элементы генетической вселенной.
Генетическая (геномная) вселенная (это только метафора, но удобная и, возможно, продуктивная) может быть представлена как развивающееся пространство-время, заполненное кластерами, состоящими из генов (то есть КОГ), или, точнее, эволюционирующими линиями ортологов, элементарными единицами эволюции. Ортология легче всего прослеживается между прокариотическими генами, так что здесь мы обсудим прокариотическую область геномной вселенной. Тенденции среди эукариотов в принципе похожи, но осложнены распространенной мультидоменной организацией белков и обширной паралогией. В нашем геномном пространстве заметно характерное распределение КОГ по геномам, хорошо аппроксимируемое тремя экспонентами с разными показателями, которые делят генную популяцию на три класса (см. рис. 3-13, а—в; Koonin and Wolf, 2008b).
1. (Почти) универсальные гены, те, что представлены в (почти) всех геномах клеточных форм жизни, составляют лишь малую часть генетической вселенной: это ядро клеточной жизни состоит, самое большее, из приблизительно 70 генов. В каждом конкретном геноме доля этих «ядерных» генов составляет не более 10 процентов, если говорить о самых маленьких геномах клеточных форм жизни (паразитических бактерий, таких как M. genitalium), но обычно ближе к 1 проценту или менее от общего числа генов (см. рис. 3-14).
2. Умеренно консервативная генная оболочка состоит из КОГ, представленных в самых разнообразных геномах, но не в подавляющем их большинстве. Недавний анализ имеющихся прокариотических геномов дает число КОГ оболочки около 5000. Гены оболочки составляют большую часть числа генов в любом геноме (см. рис. 3-14).
3. Малоконсервативное «облако» состоит из КОГ, встречающихся в узких группах организмов, и «генов-сирот» — генов в открытых рамках считывания (ОРС), обнаруженных пока что в одном-единственном геноме, но гомологи которых обычно обнаруживаются во вновь появляющихся геномных данных. Гены «облака» составляют переменную долю в каждом геноме, обычно в интервале 10–30 процентов от общего числа генов (см. рис. 3-14).
Примечательно, что эта структура является самоподобной, или фрактальной: те же три компонента — крошечное ядро, сравнительно большая оболочка и огромное «облако» — проявляются на любом уровне, где бы ни рассекалось генное пространство-время, от всего мира прокариот и до узких групп бактерий (см. рис. 3-14). Мы возвратимся к последствиям этой фрактальности геномного пространства-времени прокариот в главе 5. Заметим, однако, что эволюционная модель, которая объясняла бы наблюдаемую фрактальность, еще ожидает своей разработки[36].
Рис. 3-13 а. Глубокий уровень: 338 прокариот из базы данных EggNOG (Jensen et al., 2008)
Рис. 3-13 б. Средний уровень: 41 архей из базы данных arCOG (Makarova et al., 2007b)
Рис. 3-13 в. Мелкий уровень: 44 вида Escherichia, Shigella и Salmonella из базы данных COG (Tatusov et al., 2003). Регрессия данных экспоненциальными функциями на всех трех рисунках (Koonin and Wolf, 2008b) изображена пунктирными и непрерывными линиями.
Рис. 3-14. Вклад ядра, оболочки и «облака» в состав индивидуальных геномов и генной вселенной как целого. Расчет произведен по данным из базы EggNOG (Jensen et al., 2008). A. fulgidus — архея Archaeoglobus fulgidus; B. subtilis — бактерия Bacillus subtilis.
Следует обратить внимание на кажущийся парадокс в распределении КОГ в генном пространстве. Хотя в каждом геноме большинство генов относятся к оболочке, то есть являются общими с дальнородственными организмами, при рассмотрении всей генной вселенной оказывается, что гены (или, вернее, КОГ) ядра и оболочки составляют лишь незначительное меньшинство (см. рис. 3-14). Вполне очевидно, что эта разница возникает потому, что КОГ оболочки представлены во многих геномах, в то время как КОГ «облака», особенно «гены-сироты», являются редкими или уникальными. С учетом этой характерной структуры вселенной генов эволюционные реконструкции неизбежно приводят к картине динамичной эволюции генома, где многочисленные гены (в основном из «облака» и, в меньшей степени, из оболочки) утрачиваются, а многие другие приобретаются путем ГПГ (в основном у прокариот), а также в результате многочисленных дупликаций, в первую очередь у эукариот (см. ниже в этой главе).
Теперь, определив единицы геномной эволюции и разработав идею организации вселенной генов, мы можем осмысленно дополнить эти понятия списком основных операций, элементарных событий эволюции генома, которые можно будет сравнить с элементарными событиями эволюции отдельных генов. Алфавиты элементарных событий довольно кратки и фактически подобны (изоморфны) на соответствующих уровнях (см. табл. 3-3). Однако относительный вклад и частота различных типов событий разнятся в эволюции генов и геномов самым коренным образом. Существенное различие между эволюцией отдельных генов и целых геномов заключается в особой важности и высокой частоте дупликации генов, в отличие от много более ограниченного вклада внутригенных дупликаций. Далее, внутригенные рекомбинации редко закрепляются в эволюции, за исключением близких геномов, а важнейшие механизмы перестройки генома, такие как инверсии и транслокации, не играют особой роли в эволюции отдельных генов. В итоге различия в относительном вкладе разнообразных элементарных механизмов (см. табл. 3-2) лежат в основе значительно более динамичного характера эволюции геномов по сравнению с эволюцией отдельных генов.
Таблица 3-3
Сравнение элементарных событий эволюции гена и генома
Сравнительная геномика раскрывает примечательный контраст между относительной эволюционной устойчивостью отдельных генов, многие из которых сохраняют значительное сходство на протяжении сотен миллионов или даже миллиардов лет эволюции, и пластичностью состава и архитектуры генома, которые изменяются на несколько порядков быстрее. Отсюда возникает характерное устройство вселенной генов, в котором сравнительно небольшое число плотных кластеров образуют ядро, гены которого представлены в большинстве геномов, в то время как большую часть пространства-времени занимает огромное количество все более разреженных «туманностей», состоящих из редких генов. Поразительно, что организация генетической вселенной явственно фрактальна, то есть проявляется на всех масштабах эволюционных расстояний.
Атомарная сущность генов (или, точнее, КОГ, ортологичных эволюционных линий) лежит в основе всей исследовательской программы сравнительной геномики: сравнение геномов оказывается весьма информативным, несмотря на нетривиальные отношения между отдельными генами и геномами, обусловленные изменчивостью геномной архитектуры.
Геномные ландшафты различных форм жизни — распределение ограничений по геномным сайтам — разнообразны и сложны. Компактные геномы вирусов, прокариот и, в меньшей степени, одноклеточных эукариот в основном занимают «высокогорные плато», так что почти все сайты подвергаются существенным ограничениям. Геномные ландшафты многоклеточных эукариот состоят в основном из «долин» со слабыми ограничениями, разделенных редкими «гребнями» сильного отбора. Эти отличия отражают разные эволюционные режимы, которые мы обсудим в главе 8. Парадоксально, но именно «неэффективность» режима эволюции, характерного для многоклеточных эукариот, позволяет организационной сложности возникнуть. Этот парадокс должен заставить задуматься всех неравнодушных к идее эволюционного «прогресса». Мы вернемся к подробному обсуждению этого вопроса в главах 8 и 13.