Кроме того, анализируя неандертальские и денисовские примеси в геномах современных людей, мы можем узнать много нового о неандертальцах и денисовцах. Например, именно таким способом удалось выяснить, что денисовцы были разными: по-видимому, существовало не менее трех ветвей денисовцев, сильно отличавшихся друг от друга. Денисовская девочка Denisova 3 – представительница лишь одной из них. Откуда же мы узнали о двух других? Их “вычислили”, анализируя денисовские примеси в геномах современных жителей Восточной Азии и Новой Гвинеи.
Искать следы межвидовой гибридизации можно разными способами, и ученые постоянно изобретают новые. Можно просто искать в современных геномах фрагменты ДНК, совпадающие с известными неандертальскими и денисовскими последовательностями. Но таким способом нельзя обнаружить примеси, доставшиеся нам от вымерших популяций, по которым нет палеогенетических данных. Чтобы найти такие примеси, используют другие статистические методы, позволяющие даже и вовсе не принимать во внимание данные по древним геномам. Эти методы основаны на том, что привнесенные (интрогрессированные) фрагменты ДНК должны иметь определенное распределение длин: чем больше времени прошло с момента гибридизации, тем меньше их средняя длина[23]. Кроме того, они должны содержать наборы тесно сцепленных, то есть расположенных по соседству, редких полиморфизмов. Если речь идет о гибридизации, происходившей уже после того, как предки разных рас и народов начали разбредаться по миру, то привнесенные участки должны встречаться только у некоторых, но не у всех современных популяций. Например, неандертальские примеси есть у всех внеафриканских сапиенсов, но отсутствуют у африканцев. Этот статистический подход, известный под названием “S*-статистика”, разрабатывается и совершенствуется уже довольно давно (Plagnol, Wall, 2006; Vernot, Akey, 2014).
В 2018 году американские генетики разработали новую, улучшенную версию S*-статистики, которую они назвали Sprime. Метод Sprime позволяет анализировать вместо последовательного обсчета коротких фрагментов сразу большие участки генома, а вместо попарных сравнений – данные сразу по множеству геномов. Кроме того, Sprime, в отличие от прежних версий, успешно справляется с таким осложняющим обстоятельством, как ограниченная миграция носителей интрогрессированных фрагментов ДНК в районы, населенные людьми без таких фрагментов. Например, этот метод позволил бы найти неандертальские примеси у неафриканцев, даже если бы некоторое (не слишком большое) число носителей этих примесей в далеком прошлом вернулось в Африку и скрестилось с местным населением. Конечно, без привлечения палеогенетических данных Sprime не определил бы, что это именно неандертальские примеси, но он бы показал, что это привнесенные фрагменты ДНК.
Проверив новый метод на виртуальных (сгенерированных компьютером) геномах с известной историей, исследователи убедились, что он обладает повышенной надежностью и чувствительностью по сравнению с прежними версиями. Так, если две популяции разошлись сотни тысяч лет назад, период гибридизации был десятки тысяч лет назад и при этом в генофонд изучаемой популяции попало 3 % чужих генов, метод Sprime позволит обнаружить половину интрогрессированных фрагментов (остальные окажутся слишком короткими или содержащими слишком мало полиморфизмов, уникальных для второй популяции), а доля ложноположительных результатов будет не более 7 %.
Убедившись, что метод работает, ученые применили его к 5639 полным геномам современных людей со всех концов Евразии, включая и папуасов (Browning et al., 2018). Количество и суммарная длина идентифицированных чужеродных фрагментов в геномах людей из разных популяций совпали с полученными ранее оценками доли неандертальской и денисовской ДНК в этих популяциях. В частности, подтвердилось, что у восточноазиатов примесей больше, чем у европейцев и южноазиатов.
Напомним, что все эти чужеродные фрагменты были выявлены при помощи метода Sprime без использования палеогенетических данных. Теперь, конечно, нужно было сравнить их с известными древними геномами. Ученые так и поступили, взяв для сравнения два наиболее качественно прочтенных генома – алтайского неандертальца (Denisova 5) и денисовской девочки (Denisova 3). Анализировались только те интрогрессированные участки, в пределах которых и у неандертальца, и у денисовца есть не менее десяти однонуклеотидных отличий от современных африканцев (у них, как считается, нет неандертальских и денисовских примесей). Для каждого такого участка определили степень его сходства, с одной стороны, с геномом алтайского неандертальца, а с другой – с геномом денисовца.
Результаты представлены на рисунке 6.2. Диаграммы, построенные для 20 внеафриканских популяций, отражают частоту встречаемости интрогрессированных фрагментов ДНК, характеризующихся разным уровнем сходства с геномами алтайского неандертальца и денисовца. Изолинии на диаграммах соединяют точки, обозначающие одинаковое количество фрагментов, для которых характерно то или иное сходство с двумя древними геномами. Эти диаграммы заслуживают внимательного разглядывания.
На всех диаграммах мы видим маленькую компактную область в левом нижнем углу. Это фрагменты, которые были определены программой Sprime как интрогрессированные, но они при этом имеют мало общего как с неандертальской, так и с денисовской ДНК. Скорее всего, это ложноположительный сигнал, то есть фрагменты, которые на самом деле интрогрессированными не являются и были определены программой ошибочно. Судя по результатам предварительного моделирования, программа должна давать 5–7 % ложноположительных результатов, что и подтверждается.
Рис. 6.2. Изолинии, отражающие частоту встречаемости интрогрессированных фрагментов ДНК с определенным уровнем сходства с геномами алтайского неандертальца и денисовца для геномов 20 внеафриканских популяций. Популяции, представленные на диаграммах 16–19 (от мексиканцев до перуанцев), – это не индейцы, а люди смешанного, преимущественно европейского происхождения. Прочие пояснения в тексте. По рисунку из Browning et al., 2018.
На всех диаграммах мы также видим внушительный подъем в правом нижнем углу. Это наше неандертальское наследие. Фрагменты, унаследованные от неандертальцев, сходны с геномом алтайского неандертальца в среднем на 80 %. При этом сходство с геномом денисовца у них низкое – порядка 10–20 %. Здесь нужно вспомнить, что по ядерному геному денисовцы ближе к неандертальцам, чем к сапиенсам, а это значит, что общие предки денисовцев и неандертальцев успели накопить какое-то количество общих отличий от сапиенсов еще до того, как разделились. Именно поэтому сходство неандертальских фрагментов с денисовским геномом достоверно отличается от нуля.
Денисовских примесей среди исследованных популяций больше всего у папуасов (диаграмма 20). Средний уровень сходства денисовских включений в папуасских геномах с известным геномом денисовца – около 50 %, а с геномом алтайского неандертальца – те же 10–20 %. То, что сходство этих включений с геномом Denisova 3 составляет лишь 50 %, а не больше, означает, что те денисовцы, которые оставили свой след в геномах папуасов, были довольно дальней родней девочки из Денисовой пещеры. Они представляли другую популяцию денисовцев, которая обитала, возможно, далеко от Алтая.
В геномах современных жителей Южной Азии (бенгальцев, индусов и других, диаграммы 11–15) тоже есть денисовская примесь, хоть и не такая большая. Причем уровень сходства привнесенных участков с геномом денисовской девочки такой же, как у папуасов, – около 50 %. Это значит, что источником примеси, вероятно, была та же самая популяция денисовцев, не слишком близкая к алтайской.
В геномах европейцев (диаграммы 1–5) денисовских примесей практически нет, за исключением финнов (диаграмма 2), у которых есть немножко денисовской ДНК. Скорее всего, эта примесь попала к финнам вместе с порцией азиатских генов (Sikora et al., 2014).
Самый интересный и неожиданный результат связан с восточноазиатами (три китайских выборки и одна японская, диаграммы 6–9). Их денисовская примесь состоит из двух разнородных частей: одни денисовские фрагменты сходны с геномом алтайской девочки на 50 % (как у папуасов и южноазиатов), а другие – примерно на 80 %. Двугорбость распределения статистически значима. Следовательно, у общих предков китайцев и японцев, скорее всего, было два эпизода гибридизации с денисовцами. Один раз они скрещивались с той же популяцией, что оставила след в геномах папуасов и южноазиатов, а второй – с другими денисовцами, более близкими к алтайской популяции.
Эпизод с участием “50-процентных” денисовцев мог быть тем же самым, что и у предков папуасов и южноазиатов. Иными словами, в этом эпизоде могли участвовать еще общие предки папуасов и жителей Южной и Восточной Азии. Или, может быть, собственно с денисовцами скрещивались только предки папуасов, представлявшие одну из древнейших волн миграции сапиенсов на юго-восток Азии, а уже потом от них получили денисовскую примесь предки индусов, китайцев и японцев. Что же касается эпизода с участием “80-процентных” денисовцев, то в нем были задействованы только предки восточноазиатов (китайцев и японцев).
Определить временную последовательность эпизодов гибридизации в принципе можно по длине интрогрессированных фрагментов. В геномах восточноазиатов неандертальские фрагменты в среднем чуть короче, чем “50-процентные” денисовские, а те, в свою очередь, короче, чем “80-процентные” денисовские. Это указывает на возможную последовательность событий: сначала скрещивание с неандертальцами, потом с “50-процентными” денисовцами и, наконец, с “80-процентными” денисовцами. Однако исследователи честно отметили, что различия по длине фрагментов не являются статистически значимыми – и поэтому делать какие-то выводы на их основе преждевременно.