Между этими предковыми гаплотипами – 14 мутаций на первых 67 маркерах. Это очень много, и это разводит их общих предков на 14/0.12 = 117 → 133 условных поколений (по 25 лет каждое), то есть примерно на 3325 лет, и их общий предок жил примерно 4675 лет назад. Но это и есть «возраст» общего предка карачаево-балкарцев гаплогруппы G2a1, к которой относится треть всего народа, точнее, его мужской половины. Иначе говоря, и карачаево-балкарцы, и осетины гаплогруппы G2a1 происходят от одного общего предка, который жил в первой половине III тыс до н. э. Осталось выяснить, где он жил, и это ДНК-генеалогия тоже способна определить. Состояние ответа на сегодняшний день – это историческая Бактрия, область на сопредельных территориях Узбекистана, Таджикистана и северного Афганистана. Именно там современные жители той же гаплогруппы имеют подобные предковые гаплотипы. В формуле выше 0.12 (мутаций на гаплотип за условное поколение) – это константа скорости мутаций для 67-маркерных гаплотипов, стрелка показывает табличную поправку на возвратные мутации. Это упрощенный пример, потому что по двум гаплотипам расчеты обычно не ведут, ведут по десяткам и сотням гаплотипов, если таковые есть в наличии, рассчитывают математические погрешности в определяемых цифрах, и т. д. Здесь только иллюстрируется принцип расчета.
В гаплотипах, приведенных выше, первое число показывает, что в одном из маркеров Y-хромосомы определенная последовательность нуклеотидов повторяется 14 раз. В другом маркере, который здесь показан как следующий, блок нуклеотидов повторяется 23 раза у осетин, и 22 раза у карачаево-балкарцев, и так далее. Чтобы показать, что все это на самом деле четко определено и зафиксировано,[6] добавим, что в первом маркере (под названием DYS393) повторяется четверка нуклеотидов AGAT, то есть аденин-гуанин-аденин-тимин
GTGGTCTTCTACTTGTGTCAATAC/AGAT/AGAT/AGAT/AGAT/ AGAT/AGAT/AGAT/AGAT/AGAT/AGAT/AGAT/AGAT/AGAT/AGAT/AT GTATGTCTTTTCTATGAGACATACCTCATTTTTTGGACTTGAGTTC
и эти повторы обрамляются уже неупорядоченными последовательностями нуклеотидов в ДНК, как показано выше. Во втором маркере, под названием DYS390, повторяется уже другая четверка, TCTG, то есть тимин-цитозин-тимин-гуанин, которая переходит в четверку TCTA, то есть тимин-цитозин-тимин-аденин, и число повторов складывается (здесь показана последовательности для 22 повторов, как у карачаево-балкарцев):
TATATTTTACACATTTTTGGGCCCTGCATTTTGGTACCCCATAA TATATTCTATCTA/TCTG/TCTG/TCTG/TCTG/TCTG/TCTG/TCTA/ TCTA/TCTA/TCTA/TCTATCTA/TCTA/TCTA/TCTA/TCTA/TCTA/ TCTA/TCTG/TCTA/TCTA/TCTA/TCATCTATCTATCTTTCCTTGTTT CTGAGTATACACATTGCAATGTTTTCATTTTACTGTCAC
Перечисленные четыре нуклеотида – это язык ДНК, который состоит из этих четырех слов, или четырех букв, при сокращенной записи. Эти нуклеотиды комбинируются парами, и их так и называют – «пары оснований». Они фактически держат двойную спираль ДНК.
Нам эти четверки (а также тройки нуклеотидов, и другие типы повторов) в маркерах ДНК в дальнейшем не понадобятся, это описание мы даем только для того, чтобы показать, что за числами в гаплотипах стоят масштабные исследования, которыми занимаются в мире сотни и тысячи человек.
Гаплотипы ДНК выбирают так, чтобы в них таких маркеров было как можно больше (но все-таки чтобы оставаться в рамках практичности), и в ранних работах использовались 6-маркерные гаплотипы, затем 12-маркерные, 17– и 19-маркерные, затем 25– и 37-маркерные, а сейчас работа рутинно ведется с 67– и 111-маркерными гаплотипами (правда, в академических публикациях это обычно от 8 до 17 маркерных гаплотипов).
В 67-маркерных гаплотипах одна мутация происходит в среднем за 8 поколений, в 111-маркерных – за 5 поколений. Поэтому у 111-маркерных гаплотипов разрешение лучше. Но их определять дороже, чем более короткие, поэтому в академических исследованиях, при постоянной нехватке денежных средств, приходится работать с более короткими гаплотипами. Длинные гаплотипы определяют в коммерческих компаниях, обычно персонально, каждый для себя, и передают, как правило, в общественные базы данных. Сейчас в общественных базах данных – сотни тысяч гаплотипов, и базы прирастают многими гаплотипами ежедневно[7].
Как мы покажем ниже, эти гаплотипы, а именно числа в них, напрямую связаны с хронологией древних миграций людей, переходами людей на новые места, событиями прошлого – войнами, климатическими катаклизмами, эпидемиями, в общем, со всем тем, что так или иначе влияло на численность популяций человека в определенные времена и на определенных территориях. Например, расчеты могут показать, когда древние арии появились на Русской равнине, когда они появились в Индии, Иране, на Ближнем Востоке – потому что эти события приводили к появлению на этих территориях и в те времена общих предков популяций, которые разрастались вплоть до нашего времени, образуя «кусты» гаплотипов со всеми мутациями в них, то есть изменениями чисел в маркерах.
Поскольку уже показано и доказано, что мутации в маркерах происходят в основном (или исключительно) неупорядоченно, то к ним оказалось возможным применять правила и подходы химической кинетики, или биологической кинетики, кому какой термин больше нравится – суть одна. И снипы, и маркеры мутируют по законам кинетики первого порядка, других закономерностей пока не обнаружено. Это означает, что каждому маркеру свойственна определенная константа скорости мутации, и каждому гаплотипу (состоящему из набора маркеров) – тоже свойственна определенная средняя константа скорости мутации, равная сумме констант скоростей мутаций отдельных маркеров. Поэтому чем древнее общий предок популяции, тем больше мутаций накапливается в гаплотипах его потомков по сравнению с ним, тем больше поколений (и лет) отделяет современных потомков от их общего предка, и это число поколений (и лет) рассчитывается методами ДНК-генеалогии. Как это делается, тоже будет показано ниже на многих примерах.
ДНК-генеалогия базируется на четких правилах, которых можно насчитать четырнадцать.
Положение первое – к генетике ДНК-генеалогия прямого отношения не имеет. Хотя в определенной части ДНК-генеалогии рассматривают и гены, например, при рассмотрении всего генома человека, но это – специальная часть ДНК-генеалогии, и этого здесь не будет. ДНК – это не только гены. Гены вообще занимают только 1,9 % последовательности ДНК. Остальные 98,1 % – длинные участки, так называемые «никчемные». Генов там нет (это подробно разобрано в статье – Клёсов, 2012a).
В ДНК есть протяженные последовательности повторяющихся нуклеотидов, в которых, повторяю, генов нет, и эти последовательности детально копируются при передаче наследственной информации от отца к сыну. Я специально пишу «от отца к сыну», потому что в данном очерке речь идет только о «мужской» наследственной информации, передаваемой с мужской половой Y-хромосомой. У женщин ее, этой хромосомы, нет.
«Никчемными» эти негенные последовательности ДНК назвали по незнанию, и это название уже уходит в прошлое. По мере исследований, оказалось, что эти последовательности хранят массу информации и не только «генеалогического» характера. Более того, оказалось, что они, эти «никчемные» участки, содержат сотни, если не тысячи крошечных генов РНК, кодирующих так называемые микро-РНК, длиной всего пару десятков нуклеотидов каждый, и которые регулируют синтез белков. Но это – предмет другого повествования.
Эти негенные участки ДНК в мужской Y-хромосоме, одной из 23 хромосом, которые доставляются сперматозоидом в организм будущей матери, копируются от отца к сыну, поколение за поколением. Поскольку у матери такой хромосомы нет, то сын наследует ее только от отца. Хромосомы сплетаются с материнской ДНК и образуют новую комбинированную молекулу ДНК, в которой хромосомы отца и матери перетасовываются. Перетасовываются все, кроме мужской Y-хромосомы.
Так и получается, что отец передает сыну эту Y-хромосому интактной, строго скопированной со своей. А свою Y-хромосому он получил от своего отца. Тот – от своего. И так далее, на тысячи, десятки тысяч и сотни тысяч лет вглубь, назад, к далеким предкам современных людей и к предкам тех далеких предков.
Важное примечание. В антропологии принято считать, в соответствии с базовыми понятиями, парадигмой антропологии, что сотни тысяч лет назад людей не было. Были палеонтропы, архантропы, неандертальцы, эректусы, другие гоминиды. Однако наши предки были, как их ни называть. Они были и десятки, и сотни тысяч лет назад, и миллионы лет назад. От них, «приматов», мы и наследуем гаплотипы и гаплогруппы, пусть в значительной степени измененные, мутированные, иногда потерявшие целые куски.
Таким образом, аргументы, что тогда-то давно не было предков современного человека, в принципе неверны. Они были, но просто или не обнаружены антропологами (что вполне возможно), хотя и были на рассматриваемой территории, или они были представлены минорной долей гоминидов и прочих «приматов», и при изучении последних просто не встречались, проскочили сито антропологов, весьма крупноячеистое. Или определение, используемое антропологами, слишком жесткое и не отражает значительно более сложной истории происхождения человечества.
Если бы Y-хромосома так и передавалась из поколения в поколение действительно неизменной, толку для генеалогии от нее было бы мало. Но неизменного ничего в мире нет, особенно когда речь о копировании. Копирования без ошибок не бывает. В том числе и копирования Y-хромосомы.
Отсюда второе положение – время от времени при копировании Y-хромосомы в копии проскакивают ошибки. Фермент под названием ДНК-полимераза (на самом деле вместе с целым набором молекулярных инструментов) или просто ошибается и делает некоторые участки ДНК короче или длиннее, удлиняя или сокращая повторы нуклеотидов, или «ремонтирует» поврежденные участки и в ходе «ремонта» удаляет повреждение (эта операция называется «делеция») или «вшивает» новый нуклеотид (называется «вставка», или «инсерт»). То, что удалось отремонтировать, в мутации не попадает, как будто мутации и не было. Что не удалось – передается сыну при рождении. Если родилась дочь, то Y-хромосома не передается. Если только дочери, или детей нет – Y-хромосома терминируется, вместе с мужской наследственной линией.