Мутации, рассматриваемые в ДНК-генеалогии – это или одиночные (как правило) замены нуклеотидов в ДНК, как, например, аденин на цитозин, или цитозин на тимин, или вставки нуклеотидов, или делеции, или мутации более сложные, при которых ошибка копирующего фермента приводит к переносу целого блока нуклеотидов. Это дает или удлинение серии таких блоков на один (редко – сразу на два-три блока), или их укорачивание. Эти мутации наследуются в поколениях, порой в сотнях и тысячах поколений подряд без изменений, или с небольшими вариациями, и тем самым служат надежными, порой «вечными» метками в ДНК.
Мутации первого типа – SNP (Single Nucleotide Polymorphism), или «снипы», обычно очень стабильны, и их для ДНК-генеалогии отбирают только такие, которые случаются только один раз (два раза – максимум) за историю человечества. Поэтому они являются маркерами родов человечества. Эти роды называют «гаплогруппами», каждая из которых состоит из многих выявленных подгрупп, но все подгруппы несут родо-определяющую (или гаплогруппу-определяющую) SNP-мутацию. Всего в мире насчитывают 20 основных родов, обозначаемых буквами латинского алфавита от А до Т.
Мутации второго типа – STR (Short Tandem Repeat) – значительно более быстрые, и происходят в определенных локусах ДНК (то есть в гаплотипах, которые и есть совокупность выбранных локусов) раз в несколько десятков или сотен поколений. Поэтому гаплотипы ДНК выбирают так, чтобы в них таких локусов было включено как можно больше (но все же оставаясь в рамках практичности). В ранних работах использовались 6-маркерные гаплотипы, затем 12-маркерные, затем 25- и 37-маркерные, а сейчас работа рутинно ведется с 67-маркерными гаплотипами (в академических публикациях, как правило, от 8 до 17 маркерных гаплотипов), а в последние два года – и с 111-маркерными гаплотипами. В 67-маркерных гаплотипах, например, одна мутация происходит в среднем за 8 поколений, в 111-маркерных – за 5 поколений, то есть примерно раз в 125 лет. Для расчетов за «поколение» принимается интервал времени в 25 лет, и на основании этого интервала происходит калибровка констант скоростей мутации «второго типа», то есть мутаций в гаплотипах.
В этом рассказе были определены 20-маркерные гаплотипы, имеющие несколько нестандартный формат, поэтому их расчет проводился по 17 локусам, так называемому Y-filer, суммарная константа скорости мутации которых хорошо известна.
Поскольку уже доказано, что эти мутации в локусах происходят в основном (или исключительно) неупорядоченно, то к ним оказалось возможным применять правила и подходы химической кинетики (или биологической кинетики, которая базируется на тех же принципах химической кинетики, только в биологических объектах). Каждому маркеру свойственна определенная константа скорости мутации (измеряемая в числе мутаций на маркер на 25 лет, то есть на условное поколение), и каждому гаплотипу (состоящему из набора маркеров) – тоже свойственна определенная средняя константа скорости мутации. Поэтому чем древнее общий предок популяции, тем больше мутаций накапливается в гаплотипах его потомков по сравнению с ним, тем больше поколений (и лет) отделяет современных потомков от их общего предка, и это число поколений (и лет) рассчитывается методами ДНК-генеалогии. Проблема заключается в том, что начиная примерно с 600 лет до настоящего времени зависимость между общим числом мутаций и временем жизни общего предка становится нелинейной за счет накопления возвратных мутаций, и нужны специальные методологические приемы, чтобы переводить эту нелинейность в хронологические показатели. Арсенал этих приемов отличает ДНК-генеалогию, как по сути дела историческую науку (собственно, генеалогия и есть история), опирающуюся на количественный анализ кинетики накопления мутаций в ДНК, от популяционной генетики, основной задачей который является нахождение связи между генотипом и фенотипом популяции, и генетическим описание главным образом современных популяций в различных регионах.
В классификации ДНК-генеалогии рода, они же гаплогруппы, различаются по мутациям: все без исключения «восточные славяне» (R1a у славян) имеют снип М198 – мутацию цитозина в тимин в определенном участке Y-хромосомы; все «северо-западные славяне» (I1 у славян) имеют снип М253 – мутацию цитозина в тимин в другом участке; все «южные славяне» (I2a1b у славян) имеют снип L460 – мутацию аденина в цитозин в соответствующем участке; все «южно-балтийские славяне» и «угро-финны» – снип М46 (Tat) – мутацию тимина в цитозин в конкретном участке (хотя многие южно-балтийские славяне имеют еще одну мутацию, L550 – мутацию цитозина в тимин – что дает субклад N1c1a1a1, которой нет у финно-угорской ветви).
Перечисленные рода разошлись – от своих общих предков – десятки тысяч лет назад, и вот опять для миллионов людей сошлись у славян. Каждый из перечисленных родов имеет свою структуру, свои ветви популяций, каждая из ветвей имеет свою историю. Например, в Европе насчитывается 38 ветвей гаплогруппы R1a, различающихся по характерной картине мутаций в гаплотипах. Та же гаплогруппа R1a имеет 26 подгрупп, каждая со своим индексом, по состоянию на конец 2012 г.). Самая разветвленная подгруппа (субклад) – Z280, «Центральный евразийский субклад», в который входят шесть SNP подгрупп, каждая – со своим характерным мутацией-снипом, и десять ветвей гаплотипов. В принципе, им должны соответствовать десять SNP мутаций, поскольку характерные ветви должны иметь характерные снипы, но работа по поиску снипов продолжается, и часто поступают новые идентифицированные необратимые мутации, служащие, как было указано, метками, маркерами определенных популяций, фактически расширенных «семей».
Другая характерная гаплогруппа у этнических русских – I, причем в двух подгруппах, I1 и I2, представленных среди славян неодинаково (см. предыдущие главы). Обе подгруппы распространены по всей Европе, причем I1 больше на севере Европы, I2 – больше на юге, в особенности на Балканах, где она часто является наиболее представительной по численности гаплогруппой, потому ее наиболее часто встречающийся там субклад (почти 100 % от балканских гаплотипов группы I2) получил название «динарского» (индекс I2a1b). Этот же субклад почти исключительно представлен у всех славян Восточной Европы. Гаплогруппа I2, наряду с I1 – древнейшие гаплогруппы Европы, но примерно 4500 лет назад носители как I1, так и I2 из Европы исчезли, их остатки бежали на Британские острова и на Русскую равнину, и на двух концах Европы эти гаплогруппы постепенно возрождались. В популяционных науках это называется «прохождением бутылочного горлышка» популяции. Сама же гаплогруппа I появилась (путем соответствующей мутации М170 – мутация аденина в цитозин – у представителя родительской гаплогруппы IJ в соответствующем участке Y-хромосомы) примерно 40 тыс. лет назад, и примерно 30 тыс. лет назад она разошлась на подгруппы I1 и I2.
У обеих гаплогрупп тоже много SNP-подгрупп, у I1 по современной классификации 24 субклада, у I2 – 33 (по состоянию на конец 2012 г.). Но на Русской равнине выявлен почти исключительно «динарский» субклад I2a1b-M423, который впоследствии разошелся на три нижестоящих субклада – M359.2, L161.1, и L621, причем и последний уже показал «дочерний» субклад L147.2.
Наконец, еще одна из наиболее представленных у этнических русских гаплогрупп, N1c1, встречается в среднем в 14 % случаев, но от Пскова и выше ее уже более 30 %. Соответственно, на юге России этой гаплогруппы мало. Она появилась на Русской равнине последней, в начале-середине 1 тыс. до н. э., пройдя длинный миграционный путь с Урала, а туда – со стороны Алтая через Сибирь. Заняло это по меньшей мере 8 тыс. лет, а сама гаплогруппа N разошлась с гаплогруппой О из сводной (родительской) гаплогруппы NO-M214 примерно 20 тыс. лет назад, когда у одного из носителей NO в Y-хромосоме произошла мутация М231 (rs9341278), которая и положила начало 20-тысячелетней истории рода N.
Теперь подходим к белорусам, важной и неотъемлемой части славян. Из сведений, уже накопленных ДНК-генеалогией, можно ожидать, что структура белорусской популяции в целом вряд ли будет заметно отличаться от русской, украинской или польской. Равно и в отношении истории появления основных гаплогрупп на территории Беларуси нет оснований ожидать, что они будут заметно более древними или заметно более молодыми, чем на сопряженных территориях. Общие закономерности заселения европейской территории уже проанализированы и опубликованы, но генетических сведений об этнических белорусах среди них крайне мало.
И вот нам повезло. Оказалось, что ученые Национальной академии наук Беларуси и Центра судебных экспертиз Министерства юстиции Беларуси с участием Института этнографии и фольклора и Института генетики и цитологии НАН Беларуси, собрали большое количество, больше тысячи гаплотипов этнических белорусов. Это в наше время – грандиозное достижение. Работа по исследованию этнических белорусов очень важна, она отражает не только уровень науки в стране, но и понимание мировых приоритетов в научных исследованиях. Работа такого уровня дает возможность для достаточно глубоких обобщений в отношении познания не столько современной структуры белорусского народа (этим занимается популяционная генетика), сколько его этногенеза и связей с другими славянскими народами под углом ДНК-генеалогии.
Таким образом, этот очерк был бы невозможен без плодотворного сотрудничества с белорусскими коллегами, и в первую очередь с И.С. Цыбовским (первый заместитель директора Центра судебных экспертиз и криминалистики Министерства юстиции Республики Беларусь, г. Минск), и его сотрудников А.В. Богачевой, С.А. Котовой, Т.В. Забавской, Н.С. Шахнюк, а также с моими коллегами по Академии ДНК-генеалогии И.Л. Рожанским и А.С. Золотаревым. Большая часть расчетов и построения графиков в этом очерке проведена И.Л. Рожанским, за что ему огромная благодарность.
Образцы ДНК собирали по всей Беларуси, в ее центральном регионе, и по всем направлениям – на севере, юге, западе и востоке (см. далее табл.).