Природа, если воспользоваться образом Теннисона, была красна от клыков и когтей задолго до появления этих самых клыков и когтей. Даже микроорганизмы борются друг с другом. Бактерии пронзают и травят своих сородичей, амебы пожирают бактерий, вирусы заражают клетки и бесчинствуют в их геномах. Помимо вооружения у каждого из этих созданий вырабатывается защита. До недавних пор считалось, что защитные механизмы бактерий работают только в настоящем, выявляя угрозы по мере их возникновения и не запоминая прошлые обиды. Но теперь мы знаем, что бактерии обладают памятью. Как и клетки нашей иммунной системы, они ведут учет уже знакомых противников, чтобы незамедлительно среагировать при новой встрече с ними. Само открытие адаптивного бактериального иммунитета может служить символом нашего биотехнологического века, ведь оно не состоялось бы без внедрения секвенирования ДНК и современных компьютеров.
В 1987 году японские биологи, изучавшие один из генов модельной бактерии E. coli, мимоходом заметили у нее «необычную структуру» – последовательность из 29 нуклеотидов, которая повторялась в геноме пять раз через равные 32-нуклеотидные интервалы (спейсеры)15. Каково ее назначение и встречается ли она в других геномах, так и осталось загадкой. На это наблюдение особо не обратили внимания: жизнь полна странностей, по большей части не имеющих никакого значения.
В 1990-х Франсиско Мохика и его коллеги из испанского Университета Аликанте обнаружили похожие повторы ДНК в геномах нескольких архей16. Археи – это тоже одноклеточные микроорганизмы, лишенные ядер и мембранных органелл (см. главу 5). Внешне они малоотличимы от бактерий, но формируют отдельную ветвь древа жизни: как и нас, их отделяют от бактерий миллиарды лет эволюции. Мохика наткнулся на статью японцев и понял, что закрепление похожих генетических структур у столь неродственных организмов должно свидетельствовать о важности их роли в жизни микробов. В конце 1990-х, когда количество прочитанных бактериальных геномов возросло, а вычислительные инструменты позволили возиться с их сиквенсами на обычном компьютере, Мохика с коллегами нашел похожие расположенные кластерами повторы в геномах многих других бактерий и архей. Впрочем, их многочисленность и загадочность не принесли лаборатории Мохики славы и денег: она годами не могла добиться финансирования этих исследований, причем отказы обычно обосновывали ничтожной значимостью ДНК-повторов. А содержащих их геномов между тем становилось все больше. В 2002 году Мохика и Рууд Янсен из Утрехтского университета предложили назвать эти геномные структуры CRISPR: clustered regularly interspaced short palindromic repeats, «короткие палиндромные повторы, регулярно расположенные группами». Ученые заметили и то, что вплотную к этим структурам примыкает серия генов, которые назвали Cas (CRISPR-associated, «ассоциированные с CRISPR»). Итак, CRISPR получили имя, однако их функции по-прежнему оставались тайной.
И снова на помощь пришли геномы и компьютеры. Сразу три статьи 2005 года – одна от группы Мохики и две другие из Франции, от команд Кристин Пурсел и Александра Болотина17 – сообщали, что нуклеотидные последовательности спейсеров в CRISPR совпадают чаще всего с участками геномов вирусов[65]. С незапамятных времен вирусы заражали клетки, и такое совпадение позволяло заподозрить в CRISPR элементы неизвестного прежде защитного механизма. Хотя внимание к этой теме постепенно нарастало, ни одну из трех работ сначала не оценили по достоинству. Статью Мохики, написанную первой, один за другим отвергли все престижные журналы, и ей пришлось найти более скромный приют. Тем не менее сущность CRISPR начинала вырисовываться. Зачем бережно хранить каталог ДНК-фрагментов заражавших тебя вирусов? Не иначе как для узнавания по этим «фотороботам» и обезвреживания вторженцев, если они решат атаковать тебя вновь[66].
Работая в качестве бактериальной иммунной системы, CRISPR/Cas использует комплементарность ДНК и РНК (см. главу 3), а также нуклеазную активность белков (способность расщеплять ДНК)18. Белки Cas1 и Cas2 разрезают обнаруженные ими в клетке чужеродные, скорее всего вирусные, молекулы ДНК и вставляют фрагменты в клеточный геном – в самое начало CRISPR-кассеты, добавляя заодно и новый повтор. Таким образом получается, что повторы разграничивают отдельные фрагменты (спейсеры) в библиотеке знакомых клетке вирусных геномов. Далее клетки совершают, казалось бы, безрассудный поступок и транскрибируют цепочку повторов и спейсеров в молекулу pre-crРНК (предшественницу CRISPR-РНК). Как вы помните из главы 3, транскрипция обычно служит первым шагом к синтезу белков, а синтез вирусных белков для клетки может быть опасен. РНК повторов, однако, частично комплементарна tracrРНК (trans-activating crRNA), которая считывается с участка генома поблизости от CRISPR-локуса. Каждый повтор в pre-crРНК спаривается с tracrРНК, после чего с каждым из этих РНК-дуплексов связывается белок Cas9, а особый фермент нарезает pre-crРНК на отдельные crРНК, состоящие из одного спейсера и части повтора. Так образуется набор связанных с Cas9 и скрученных в двойную спираль crРНК/tracrРНК-гибридов со свободно висящим сегментом вирусного происхождения (см. среднюю часть рисунка).
Комплекс РНК-Cas9 бродит по клетке благодаря броуновскому движению. Если среди встречных молекул ДНК ему попадается та, что содержит специфическую короткую и довольно распространенную последовательность нуклеотидов (PAM, protospacer adjacent motif), он прикрепляется к ней в этом самом месте (кстати, та же последовательность помогает Cas1 и Cas2 определять, где разрезать чужеродную ДНК для включения в CRISPR-кассету). Cas9 расшатывает связи между нитями ДНК, по сути расплавляя двойную спираль на небольшом участке. Если однонитевая РНК, которую переносит Cas9, комплементарна одной из распаренных нитей ДНК – а это возможно только с ДНК того же вируса, по фрагменту которого сформирована crРНК, – образуется ДНК-РНК-гибрид. Эта необычная, но стабильная двойная спираль занимает в Cas9 бороздку, «выстланную» положительными электрическими зарядами, которые удерживают сильно электроотрицательные ДНК и РНК на месте (см. нижнюю часть рисунка; ДНК обозначена черным).
Cas9 содержит два нуклеазных домена, способных расщеплять ДНК. Когда белок захватывает ДНК-РНК-спираль, домены меняют ориентацию так, чтобы каждый из них контактировал с одной из нитей вирусной ДНК – той, что соединилась с РНК, и той, что осталась в одиночестве. На рисунке ниже я показал самое радикальное изменение формы, где один из доменов, черная спираль, поворачивается почти на 180 градусов. Cas9 вносит в каждую нить по разрезу, и эта часть вирусного генома теряет функциональность. Белок удаляется: его дело сделано19.
Существуют разные системы CRISPR с разными наборами ассоциированных с ними белков, но я не буду углубляться в это20. Базовый механизм сходен у всех, и потому я сосредоточусь на относительно простом и изящном белке Cas9, который эксплуатируют в большинстве биотехнологических проектов.
CRISPR/Cas9 как бактериальная иммунная система весьма впечатляет, ведь в ней память совмещается с защитой. На своем глубинном уровне она показывает, что миллиарды лет назад Природа решила одну из главных задач генной инженерии: научилась находить целевую последовательность нуклеотидов среди миллионов прочих и вносить в нее изменения. Поиск здесь подразумевает пользование библиотекой вирусных ДНК, а изменение – простое уничтожение расщеплением. Некоторые ученые, однако, догадались, что природные разработки можно подправить, чтобы расширить область их применения и даже сделать их созидательными.
В 2012 году группы Дженнифер Даудны из Калифорнийского университета в Беркли и Эмманюэль Шарпантье из Университета Умео в Швеции опубликовали написанную по итогам совместной работы статью, оказавшую мощнейшее влияние на научное сообщество. Авторы изящно демонстрировали редактирующие способности CRISPR/Cas9 за пределами клеток бактерий и архей. Команда Шарпантье открыла tracrРНК и объяснила многие аспекты работы Cas9. Даудна и ее коллеги специализировались на РНК, но в диапазон их исследовательских объектов входил и сложный ландшафт CRISPR-ассоциированных белков. В естественных условиях tracrРНК и crРНК, созданная на базе вируса, вместе направляют Cas9. Даудна и Шарпантье поняли, что заменой вирусной последовательности любой другой можно перепрограммировать Cas9 на желаемый пункт назначения. Кроме того, вместо tracrРНК и crРНК можно использовать соответствующим образом сконструированный и сворачивающийся единый РНК-гид. Следовательно, всего одной легкосинтезируемой нитью РНК и всего одним легкопроизводимым белком Cas9 можно обеспечить точное нацеливание на нужные участки ДНК. Чтобы разрезать ДНК там, где находится определенная последовательность нуклеотидов, надо действовать по следующей инструкции: создать молекулы единого РНК-гида, содержащие ту самую последовательность (вместо T там должны стоять У, как всегда в РНК), добавить к ним Cas9, поместить весь комплекс в интересующую вас систему – и все. Две научные группы показали, что этот метод работает в пробирке, за пределами естественной для него среды микробных клеток. Сообщая о результатах экспериментов в статье 2012 года, авторы назвали получившуюся систему «эффективной, многофункциональной и программируемой» и добавили, что она обладает «солидным потенциалом для решения задач прицельного воздействия на гены и редактирования геномов»21.
Статья Даудны и Шарпантье, представленная на рассмотрение в престижный журнал Science 8 июня 2012 года и опубликованная онлайн 28 июня, привлекла огромное внимание: было очевидно, что в ней описано открытие с грандиозным потенциалом. Исследовательницы получили по 3 миллиона долларов, став в 2015 году лауреатами Премии за прорыв в области естественных наук, учрежденной Марком Цукербергом из