Пример 2 – в серии из 661 гаплотипов гаплогруппы J1 в первых 25 маркерах имеется 3708 мутаций от базового гаплотипа, что дает «возраст» общего предка серии 3708/661/0.046 = 122 → 137 условных поколений, или 3425±350 лет (надо сразу сказать, что там совокупность разных ветвей, поэтому «общий предок» фантомный, как показывает логарифмический метод. Если отделить молодые ветви, то общий предок более старых ветвей жил 4000±450 лет назад, что, впрочем, в пределах погрешности с расчетом выше). Расчет по 111-маркерным гаплотипам дал 3245±330 лет, по 67-маркерным гаплотипам 3355±340 лет. Как видно, различия между этими тремя величинами попарно составляют от 2 % до 6 %, так что указанная погрешность явно завышена. Вот что такое константа скорости мутации, в данном случае 0.046 для 25-маркерных гаплотипов, 0.12 для 67-маркерных гаплотипов, 0.198 для 111-маркерных гаплотипов, во всех случаях ее размерность выражена в числе мутаций на гаплотип за условное поколение в 25 лет.
Пример 3 – в серии из 968 гаплотипов гаплогруппы I1 в первых 25 маркерах имеется 5656 мутаций от базового гаплотипа, что дает «возраст» общего предка серии 5656/968/0.046 = 127 → 144 условных поколения, или 3600±360 лет. Расчет по 111-маркерным гаплотипам дал 3690±370 лет, по 67-маркерным гаплотипам 3620±360 лет. Различия между этими тремя величинами попарно составляют от 0.5 до 2.5 %. Опять, вот что такое константа скорости мутации.
Пример 4 – в серии из 164 гаплотипов гаплогруппы Т в первых 25 маркерах имеется 1748 мутаций от базового гаплотипа, что дает «возраст» общего предка серии 1748/164/0.046 = 232 → 293 условных поколения, или 7325±750 лет. Расчет по 111-маркерным гаплотипам дал 7200±725 лет, по 67-маркерным гаплотипам 7340±740 лет. Различия между этими тремя величинами попарно составляют от 0.2 % до 1.7 %. Опять, вот что такое константа скорости мутации. А «скорость мутации», о чем пишет Балановский, не понимая, что пишет – это 3708 мутаций в первом случае, или 5656 мутаций во втором, или 1748 мутаций в третьем, но перевода в константы скорости мутации это ни о чем не говорит.
Итог – тяжелый случай с Балановским, и он еще книги садится писать по вопросу, в котором не разбирается.
Отступление про «генотип» и «генофонд»
По Балановскому, «прямой подсчет состоит в сравнении генотипов родителей и их потомства». Уже неряшливо, а по сути – неверно. Кстати, Балановский так и не написал, «прямой подсчет» – чего? Ну да ладно, косноязычность – это его визитная карточка. Здесь дело хуже. Генотип – это совокупность генов данного организма, а Балановский говорит о «STR-маркерах Y-хромосомы». Это та же неряшливость, с которой Балановские постоянно говорят про «генофонд», адресуясь к мутациям в нерекомбинантных участках Y-хромосомы.
Эти термины «генотип», «генофонд» в исполнении Балановских – или вопиющая безграмотность, или совершенно расхлябанный жаргон. Они, Балановские, повсюду используют термин «генофонд», относя его к гаплогруппам, субкладам и гаплотипам. Они не понимают, или не знают, или пренебрегают точностью понятий, что генофонд – это совокупность генов. Даже Википедия это знает, цитирую – «Генофонд (также генный пул, пул генов – англ. «genepool»)». Понятие генофонда сформулировал еще в 1928 году А.С. Серебровский, цитирую – «Совокупность всех генов данного вида… я назвал генофондом». Нет в гаплотипах и гаплогруппах генов, никакой это не генофонд.
Балановские же от статьи к статье, от высказывания к высказыванию называют снипы (!) «генофондом». Очередной пример, из десятков и сотен, в недавней статье в сборнике «Археология, этнография и антропология Евразии» (Том 43, № 2, 2015), статья называется (привожу только часть названия) «Структура генофонда по данным маркеров Y-хромосомы». В авторах – Е. Балановская. И дальше, первая фраза Абстракта «Изучен генофонд популяции по SNP-маркерам Y-хромосомы». Категорически неверно. Я уже не говорю, что здесь безграмотность еще и в другом – не пишут в Абстракте «изучено то-то», пишут, что именно обнаружили, нашли, какие выводы сделали. Не пишут в Абстракте «мы собирали грибы», пишут «мы нашли 8 кг грибов», если уж объяснять на пальцах. Но Балановская и эти элементарные вещи не знает, научная школа напрочь отсутствует.
Они, конечно, сейчас начнут воздевать руки, причитать, что наука движется вперед, и А.С. Серебровский им не указ, уже и не гены в попгенетике называют генами – я с ними спорить на этот счет не собираюсь по простой причине – попгенетика себя уже настолько дискредитировала, что этот «генофонд» в применении к снипам всего лишь яркая заплата на ветхом рубище попгенетики, так сказать. Но яркая, показательная.
Возвращаемся по сути к некорректной фразе Балановского – «для определения скорости мутирования… возможны два подхода: прямой подсчет и калибровка». На самом деле это неверно – нет «прямого подсчета» без калибровки. «Прямой подсчет» – это, видимо, подсчет числа мутаций в парах отец-сын, хотя и этого Балановский не говорит, не умееет прямо излагать. По Балановскому, «хотя мутации случаются редко, но при больших выборках можно обнаружить достаточное их количество». Поскольку примеров он никогда не дает, изъясняется косноязычно, вязко, мутно, то не поясняет, что такое «при больших выборках» и что такое «достаточное количество». А это – ключевые понятия, в которых Балановский понятия не имеет, извините за каламбур.
Придется опять привести конкретные примеры, раз он не может, не владеет материалом. То, к чему призывает Балановский, было описано в статье[270], в которой на 1300–1800 парах отец-сын (такой разброс – потому что для каждого маркера число пар отец-сын различалось) определяли, сколько в каждом маркере произошло мутаций между отцом и сыном, то есть буквально за одно поколение. Авторы ставили своей задачей определить число мутаций за поколение для всех 111 маркеров, которые составляют общую панель маркеров. Но сразу же возникла проблема, о которой Балановский не упоминает ни слова, но мы уже привыкли к его уклончивому и вязкому стилю. Из 111 маркеров в итоге не изучались 24 маркера, в 17 маркерах мутаций вообще не было, в 15 маркерах прошла всего одна мутация – то есть 56 маркеров из 111 оказались совершенно непригодными для количественного определения скоростей мутаций. А поскольку еще в 11 маркерах прошли всего две мутации, то почти две трети всех маркеров были непригодны для определения констант скоростей мутаций. Даже при одной сигма (доверительный интервал плюс-минус 68 %) погрешность в определении констант скоростей мутаций составляет ±100 % при одной мутации, и ±71 % при двух мутациях. А попгенетики их используют, в том числе и те маркеры, в которых мутаций вообще не было, при этом умудряясь рассчитать «скорости мутаций» для тех маркеров! В результате, разумеется, опять мусор в академических публикациях.
Пример такой работы – исследование 2013 года (Forensic Science International: Genetics. 7, 568–572), в авторах которого Chris Tyler-Smith, один из ведущих популяционных генетиков мира, и журнал один из ведущих. Я немедленно написал критическую статью в тот же журнал, и началась типичная для попгенетиков ситуация. Полгода ответа от журнала вообще не было. Я написал напоминание. После этого пришла одна рецензия, совершенно уклончивая, суть которой состояла в том, что несправедливо критиковать исследование, в котором используются мутации, определенные по парам отец-сын, поскольку многие их применяют. Поэтому моя статья быть принята не может. Я написал ответ, выразив возмущение сроками рецензии – более полугода, а также тем, что рецензент всего один, и само замечание неквалифицированное.
Через месяц пришла еще одна рецензия, в которой опять предлагалось снять критику за использование «скоростей мутаций» по парам отец-сын, снять таблицу, в которой показано, что значительная часть маркеров, используемых в работе Tyler-Smith, основывается всего на нескольких мутациях в парах отец сын. Так, по данным Ballantyne[271], в маркере DYS448 мутаций вообще не было (в 1747 парах отец-сын), в DYS438 прошла всего одна мутация (в 1751 паре), маркере DYS643 две мутации (в 1773 паре), и так в шести маркерах из 21, используемых в работе, более четверти. Помимо того, в работе использовались печально известные «популяционные скорости Животовского», которые вообще завышали датировки в три раза. Я ответил, что ничего снимать не буду. После этого получил письмо уже от главного редактора с приложением еще одной рецензии. Суть ее была в том, что несправедливо критиковать именно эту статью, и особенно несправедливо по отношению к Tyler-Smith, поскольку то, о чем я пишу, характерно по отношению буквально ко всем статьям популяционных генетиков, и почему начинать именно с Tyler-Smith? Поэтому мне предлагалось вообще снять всю критику данной статьи, и написать общую статью по мутациям в гаплотипах. Я отказался, написав, что сначала пусть они публикуют эту критическую статью, а потом обсудим более общую статью. После этого в течение года редактор мне периодически напоминал, что они ждут общую статью, но о критической статье не упоминал. Но я уже не отвечал. Такое отношение к авторам мне не подходит. И после этого попгенетики еще мне высказывают претензии, что я не публикуюсь в журналах по популяционной генетике. Нет уж, меня ангажированные издания не устраивают.
Резюмирую то, чего не понял Балановский. «Прямой подсчет» числа мутаций по парам отец-сын не подходит по ряду причин. Одна из них продемонстрирована выше – в объемной работе Ballantyne и др (2010)[272] из 111 маркеров данных не было получено для 24 маркеров, а для 56 данные совершенно ненадежны. Какая константа скорости для маркера, когда за поколение в маркере прошла всего одна мутация? Как константу будем рассчитывать? А если прошло всего 2–3 мутации, как константу рассчитывать будем? При погрешности в 70»-100 %? Пробовали бросить монету три раза, и по результатам рассчитать вероятность выпадения орла или решки?