ти пяти тысяч генов.
Транскрипционный комплекс из транскрипционных факторов и различных кофакторов[8] как раз и задает все особенности транскрипции гена в определенной клетке и в определенное время. Изучать работу определенного гена в определенных условиях — это большая наука, но пока оставим эту тему в стороне.
Нас в данный момент интересует, что транскрипционные факторы очень хорошо умеют распознавать генетический текст, но все по-разному. Одни распознают текст очень специфично, и тогда не требуется слишком большой сборки из транскрипционных факторов и кофакторов, а другие — менее специфично, и тогда для повышения точности транскрипции генов могут понадобиться еще какие-то белки-помощники и еще один кофактор, которые осуществили бы «тонкую настройку».
Понятие транскрипционного фактора появилось в конце 1980-х годов, а чуть позже исследователи обнаружили целое семейство транскрипционных факторов, белковая структура которых имела повторяющиеся элементы, и эти элементы получили название цинковые пальцы.
Нуклеазы типа цинковых пальцев
Свое странное название эти фрагменты белковых молекул получили за характерную трехмерную структуру и наличие в их составе ионов цинка. Цинковый палец представляет собой последовательность аминокислот, состоящую из пары близко расположенных цистеинов (аминокислотных остатков), потом следует промежуток в полтора-два десятка любых аминокислот, и опять идут два близко расположенных цистеина или гистидина. Ионы цинка стабилизируют, удерживают эту конструкцию, связываясь координационными связями с двумя близко расположенными цистеинами. Представьте себе веревку с четырьмя завязанными узелками — это будут цистеины или гистидины. А теперь пальцами притяните все узелки в одну точку. Ваши пальцы сыграли роль иона цинка. У вас получатся три петли, которые можно назвать тремя пальцами. Так вот, каждый палец достаточно точно узнает три-четыре нуклеотида ДНК, расположенные в определенном порядке, и связывается с ними. Три пальца уже распознают девять-десять нуклеотидов — определенное слово генетического текста.
Рис. 6. Нуклеазы типа цинковых пальцев
Среди трех миллиардов букв, составляющих генетический текст ДНК, группа из трех-четырех букв попадается довольно часто. А вот если мы возьмем сочетание пяти-шести цинковых пальцев, которые однозначно определят последовательность примерно пятнадцати-семнадцати нуклеотидов генетического текста, то с вероятностью девяносто девять целых и девять десятых процента это будет уникальная последовательность среди трех миллиардов букв.
Конечно, для того чтобы этого добиться, тоже потребовалась большая работа. Цинковые пальцы были исследованы вдоль и поперек, и для каждого пальца специалисты изучили специфичность распознавания ими определенных сочетаний нуклеотидов. С помощью этого знания, используя рекомбинантные технологии, исследователи смогли создать искусственные сочетания цинковых пальцев, которые бы распознавали с полной определенностью нужный фрагмент генетического текста внутри клетки.
Сейчас изучены шестьдесят четыре цинковых пальца, которые могут распознавать шестьдесят четыре различные комбинации из трех нуклеотидов, входящих в последовательность ДНК. Исследователи научились достаточно точно распознавать очень конкретные слова генетического текста, с точностью до одной буквы, до одного нуклеотида, — и все это внутри живой клетки. Теперь, опять-таки с помощью рекомбинантных технологий, нужно было к распознающей части цинковых пальцев, которые у нас есть, дополнительно синтезировать и вставить в ту же самую белковую молекулу специальный белковый фрагмент, который обладает нуклеазной активностью. Это значит, что он может нарушать ковалентные связи в молекуле ДНК, то есть разрезать нить ДНК в том месте, где цинковые пальцы распознали определенную последовательность букв генетического текста.
Если мы знаем, какой конкретно генетический текст нужно исправить из-за наличия в нем мутации, и есть определенный нуклеотид, который нуждается в замене, то следующим шагом должна быть эта самая замена с помощью гомологичной генетической рекомбинации.
Технология использования нуклеаз типа цинковых пальцев активно развивалась в первое десятилетие XXI века. Очень большой вклад в разработку нуклеаз цинковых пальцев и связанных с ними методов редактирования генома внес американский генетик российского происхождения Федор Урнов. Однако у этого метода обнаружились и некоторые недостатки. Ограниченное количество известных цинковых пальцев значительно сужает применимость подхода для распознавания любого генетического текста. К тому же эта технология оказалась очень трудозатратной и дорогостоящей, так как для каждой конкретной мишени надо было разрабатывать особую нуклеазу цинковых пальцев, и на это уходило шесть — девять месяцев.
Конструкции TALEN
В 2010 году был открыт новый, более перспективный инструмент, позволяющий распознавать и разрезать последовательности генетического текста с большим успехом, чем нуклеазы цинковых пальцев. Это были особые искусственные конструкции, полученные из бактерий растений. Они были названы TALEN (Transcription activator-like effector nucleases), что расшифровывается как эффекторные нуклеазы, схожие с активаторами транскрипции. Распознаванием букв ДНК в них занимаются особые белковые домены, каждый из которых распознает только один нуклеотид. В природе есть прототипы таких доменов: это белки некоторых бактерий-паразитов, живущих в клетках сельскохозяйственных растений. Попадая в ядро растительной клетки, эти бактериальные белки имитируют транскрипционные факторы и связываются с определенными участками ДНК, активируя гены, необходимые для выживания паразита.
МЕТОД ГОДА
Термин геномное редактирование возник в конце первого десятилетия нынешнего века, а в 2011 году редактирование генома было признано методом года. Название метода подразумевало, что внутри клетки мы можем найти короткую последовательность генетического текста, состоящую примерно из пары десятков нуклеотидов, и заменить в ней хотя бы одну букву.
Вариабельность нуклеаз TALEN гораздо больше, чем у белков типа цинковых пальцев, и направлять нуклеазы можно даже более точно. Но это опять белок который каким-то образом надо сделать рекомбинантным и проверить эффективность его связывания c нашей последовательностью ДНК, которая является мишенью. Потом к нему должен быть присоединен фермент, обладающий нуклеазной активностью, то есть разрезающий ДНК в нужном месте. Это тоже достаточно сложно и трудоемко, к тому же взаимодействие двух разных белковых доменов может быть неоднозначным, да и специфичность не всегда возрастает. Тем не менее открытие TALEN'ов повысило интерес человека к точному редактированию генома.
Но почему надо обязательно заменять? Мы можем просто разрезать ДНК и не производить никакой гомологичной рекомбинации. Тогда, естественно, работа клетки нарушится. Как ни странно, это тоже инструмент, ведь для того, чтобы изучить работу гена в живой системе, нужно этот ген удалить и посмотреть, что будет без него. Этот стандартный исследовательский прием получил название генетический нокаут, или вышибание гена. В 2010 году была присуждена Нобелевская премия за разработку генетического нокаута с использованием эмбриональных стволовых клеток на экспериментальных моделях — мышах. Там тоже все основывалось на гомологичной рекомбинации, но если в природе такая рекомбинация происходит с частотой 10-6-10-7 событий на одну клетку, то в системе редактирования генома за счет внесения разрыва ДНК в нужном месте эффективность этого процесса повышается на три-четыре порядка. Это принципиально меняет трудозатраты и подход.
Но в 2013 году ситуация в технологии редактирования генома кардинально изменилась: мир заговорил о CRISPR/Cas9 — эта загадочная аббревиатура сегодня в первую очередь ассоциируется с тем, что мы называем геномным редактированием, а за открытие, которое за ней скрывается, была вручена Нобелевская премия по медицине 2020 года.
Революционная система CRISPR/Cas9
Впервые в мире биологии, биотехнологии, наук о жизни аббревиатура CRISPR прозвучала в 2002 году, но сегодня все специалисты в этих областях знают, что за непонятными буквами CRISPR скрывается очень большое научное открытие. Может быть, со временем оно даже будет оценено как одно из великих открытий первых десятилетий XXI века.
Расшифровывается эта аббревиатура тоже не слишком понятно: Clustered Regularly Interspaced Short Palindromic Repeats. По-русски: кластеризованные (расположенные группами) регулярно прерывающиеся короткие палиндромные повторы (напомню, что палиндромы — это слова-перевертыши, такие как слово «или», известная фраза «А роза упала на лапу Азора»).
На самом деле история этого открытия уходит в начало 1990-х годов. Конечно, начали с простейшего — микроорганизмов. И вот когда ученые стали расшифровывать генетический текст, составляющий геном микроорганизмов, как раз и была обнаружена эта странность — короткие палиндромные повторяющиеся фрагменты генетического текста в геноме бактерий, причем разных. Схематично это выглядело так: «или», «а роза азора», «или», «упала на лапу», «или»...
Было совершенно непонятно, к чему эти «или» могут относиться, и необычный феномен оставался загадкой очень долго. Понять, с чем имеют дело, ученые смогли только благодаря тому, что технологии секвенирования и анализа генетического текста совершенствовались все это время, а база знаний о геномах различных организмов постоянно пополнялась. Это может показаться удивительным, но в 2005 году сразу трем независимым группам исследователей удалось сделать шаг в понимании системы CRISPR. Именно широкомасштабное внедрение технологии секвенирования (напомним, что это специальный технологический процесс чтения генома, последовательности нуклеотидов ДНК) и компьютерного анализа генетического текста, который сегодня составляет отдельное направление исследований под названием