Эволюция человека. Книга III. Кости, гены и культура — страница 20 из 94

Алан Роджерс, специалист по популяционной генетике и биоинформатике из Университета Юты, разработал пакет программ Legofit для реконструкции древней истории популяций по геномным данным (Rogers, 2019). В Legofit реализован новый подход к построению исторических реконструкций, учитывающий накопленный опыт и свободный от некоторых погрешностей, характерных для других методов.

Главная идея состоит в том, что надежную информацию о древних событиях можно извлечь из частоты встречаемости различных комбинаций примитивных и продвинутых аллелей в разных нуклеотидных позициях (nucleotide site patterns) в геномах изучаемых популяций.

Допустим, у нас есть генетические данные по четырем популяциям (рис. 3.5). В данном случае это современные африканцы (обозначены буквой X), современные европейцы (Y), неандертальцы (N) и денисовцы (D). Для каждой нуклеотидной позиции (сайта) берем по одному случайно выбранному аллелю (гаплоидному генотипу) из каждой популяции. Например, у современных африканцев в данной позиции может стоять нуклеотид А или Г, но мы выбираем один из вариантов случайно – допустим, это будет Г. То же проделываем и с остальными тремя популяциями. В итоге получаем для каждой популяции по одному варианту. Такой подход позволяет абстрагироваться от внутрипопуляционной изменчивости. Это, как утверждает Роджерс, может быть полезно, если мы хотим сосредоточиться на древних событиях в истории популяций, а не на недавних. В дальнейшем анализе учитываются только те сайты, в которых у одних популяций оказался примитивный аллель (такой же, как у шимпанзе), а у других – производный (то есть не такой, как у шимпанзе). Соответственно, для каждого отобранного сайта мы имеем ту или иную комбинацию (или паттерн распределения) примитивных и продвинутых аллелей. Например, может оказаться, что у первых трех популяций в данном сайте стоит такой же нуклеотид, как у шимпанзе (примитивный аллель), а у денисовцев – другой (производный аллель). Такая ситуация обозначается буквой d (см. рис. 3.5). Или, к примеру, может оказаться, что у первых трех популяций аллель производный и только у денисовцев – примитивный (комбинация xyn).


Рис. 3.5. Схематичное изображение генеалогии пяти человеческих популяций. Важно иметь в виду, что это не реконструкция реальных событий, а лишь схема, иллюстрирующая ход мысли Алана Роджерса и его коллег. X – современные африканцы, Y – современные европейцы, N – неандертальцы, D – денисовцы, S – неизвестная “сверхархаичная” популяция (superarchaics). Схема иллюстрирует идею о том, что частота встречаемости разных комбинаций примитивных и продвинутых аллелей несет информацию об истории изучаемых популяций. Нулями обозначены примитивные аллели, единицами – производные. Стрелки с греческими буквами – эпизоды привноса чужих генов в результате гибридизации. Разными линиями показана генеалогия одного конкретного нуклеотидного сайта. При такой генеалогии мутация, произошедшая на серой сплошной ветви, порождает комбинацию примитивных и производных аллелей d (0001), а мутация, произошедшая на черной сплошной ветви, – комбинацию xyn (1110). Прочие пояснения в тексте. Из Rogers et al., 2020.


На рисунке 3.5 показано схематичное генеалогическое дерево изучаемых популяций, отражающее современные представления о родственных связях (хронологическом порядке разделения) современных африканцев, современных европейцев, неандертальцев и денисовцев. На схеме есть еще пятая популяция S – это неизвестная популяция, которую Роджерс и его соавторы называют “сверхархаичной” (Rogers et al., 2020), чтобы противопоставить ее неандертальцам и денисовцам, часто называемым “архаичными людьми”. На самом деле это не очень удачные термины, потому что в тот момент, когда, например, сапиенсы гибридизовались с неандертальцами, никто из них не был ни более, ни менее архаичным, чем его партнер по скрещиванию, – обе популяции к тому времени прошли одинаковый по длительности эволюционный путь от общего предка. Поэтому и неандертальскую генетическую примесь в наших геномах не очень правильно называть “архаичной” примесью. Но так уж повелось. На самом деле “сверхархаики” – это просто некие люди, которые отделились от наших с неандертальцами общих предков раньше, чем мы отделились от неандертальцев.

На рисунке 3.5 также показаны четыре гипотетических эпизода привноса чужих генов в результате гибридизации (стрелки с греческими буквами). Три из них (α, β, γ) были установлены ранее[13], а четвертый (δ) вводится впервые в обсуждаемой работе. При этом ни один из четырех эпизодов в данном исследовании не рассматривался как изначально известная данность – ученые пытались оценить новым способом реальность каждого из них.

Внутри ветвей дерева разными линиями показана генеалогия одного конкретного нуклеотидного сайта. Если мутация произошла где-нибудь на черной сплошной ветке, то для данного сайта получится комбинация производных и примитивных аллелей xyn, а если на серой сплошной – d.

Ожидаемая частота встречаемости разных комбинаций зависит от параметров генеалогического дерева, а именно от порядка ветвления, длины ветвей (чем длиннее ветвь, тем выше вероятность, что где-то на ней произойдет мутация), числа эпизодов гибридизации, их интенсивности (доли привнесенной ДНК), динамики численности рассматриваемых популяций. Программа Legofit подбирает эти параметры таким образом, чтобы ожидаемые частоты встречаемости разных комбинаций примитивных и производных аллелей были максимально похожи на реально наблюдаемые.

Роджерс и его коллеги использовали этот метод для реконструкции популяционной истории сапиенсов, неандертальцев и денисовцев (Rogers et al., 2020). Неандертальцы были представлены геномами двух индивидов: из Денисовой пещеры (Denisova 5, “алтайский неандерталец”, см. раздел “Геном алтайского неандертальца” выше) и из пещеры Виндия в Хорватии. Как уже упоминалось, эти два неандертальских генома отсеквенированы наиболее качественно. Они представляют довольно далекие друг от друга популяции неандертальцев. Для денисовцев по-прежнему есть только один качественно прочтенный ядерный геном (Denisova 3), которым и была представлена денисовская популяция. Современную европейскую популяцию представляли геномы пяти французов и двух англичан, африканскую – геномы трех йоруба. В качестве внешней группы (для определения того, какие аллели являются примитивными) использовались геномы шимпанзе и гориллы. Реальные частоты встречаемости разных комбинаций примитивных и производных аллелей в рассматриваемых популяциях показаны на рисунке 3.6.

Самое общее представление об искомом дереве можно получить, просто разглядывая рисунок 3.6. Если не учитывать “синглетоны” (комбинации, в которых производный аллель есть только у одной из пяти популяций), то чаще всего встречается комбинация va, роднящая алтайских и хорватских неандертальцев, и комбинация xy, отражающая родство современных европейских и африканских сапиенсов. Стало быть, это концевые веточки дерева, разделившиеся в последнюю очередь. На третьем месте – комбинация vad, говорящая о родстве неандертальцев и денисовцев (они ближе друг к другу, чем к сапиенсам). Значит, предковая популяция (ее можно обозначить как XYVAD) сначала разделилась на ветви XY (сапиенсов) и VAD (общих предков неандертальцев и денисовцев, которых Роджерс с соавторами называет “неандерсовцами”). Затем ветвь VAD разделилась на VA и D (неандертальцев и денисовцев), VA – на V и A, а XY – на X и Y. Все так и было: это известная, надежно установленная топология родственных связей сапиенсов, неандертальцев и денисовцев.


Рис. 3.6. Частоты встречаемости разных комбинаций производных и примитивных аллелей у современных африканцев (x), современных европейцев (y), хорватского неандертальца (v), алтайского неандертальца (a) и денисовца (d). По рисунку из Rogers et al., 2020.


Чтобы продвинуться дальше, уже требуется моделирование. Сначала ученые испытали модели, вообще не учитывающие гибридизацию. Эти модели не смогли объяснить реально наблюдаемую картину (то есть воспроизвести частоты вариантов, показанные на рис. 3.6).

Добавление в модель одного эпизода гибридизации, а именно привноса генов неандертальцев в генофонд предков европейцев (стрелочка α на рис. 3.5), улучшило ситуацию, но не радикально. Тогда исследователи добавили еще два выявленных ранее эпизода, β и γ. Эпизод β – это привнос генов неизвестной “сверхархаичной” популяции в генофонд денисовцев, а эпизод γ – это гибридизация предков алтайских неандертальцев с какими-то древними сапиенсами.

Добавление эпизодов β и γ улучшает модель, но все-таки не позволяет удовлетворительно объяснить наблюдаемую картину. Модель с тремя эпизодами гибридизации (αβγ) выдает близкие к реальности частоты комбинаций лишь в том случае, если сверхархаики отделились от предков сапиенсов, неандертальцев и денисовцев целых 7 млн лет назад. Это, конечно, маловероятно – не могли же денисовцы в самом деле скрещиваться с шимпанзе.

Тогда Роджерс и его коллеги предположили, что модели для совпадения с реальностью не хватает еще одного эпизода гибридизации. Вот только кого и с кем?

Общие предки денисовцев и неандертальцев – “неандерсовцы” – отделились от предков сапиенсов то ли 500, то ли (по более популярным в последнее время оценкам) целых 750 тыс. лет назад. Позднее, где-то около 600–400 тыс. лет назад, предполагаемые предки неандертальцев появились в Европе, неся с собой ашельские орудия. В Азии, по идее, в это время должны были расселяться предки денисовцев. И те и другие селились не на безлюдных территориях. В Евразии уже давно жили представители рода Homo – потомки первой волны мигрантов, ранних Homo erectus, впервые покинувших африканскую прародину не позднее 1,8 млн лет назад (как мы помним, это датировка для людей из Дманиси). Неандерсовцы вполне могли поскрещиваться с евразийскими эректусами еще до того, как разделились