Если на маммограмме обнаруживали опухоль, женщину лечили по принятым в то время стандартам: операцией по удалению опухолевых масс (чаще всего это была радикальная мастэктомия) или операцией с последующим облучением. Завершив этапы скрининга и медицинского вмешательства по его результатам, Страке, Венет и Шапиро наблюдали за развитием эксперимента во времени, сопоставляя смертность от рака молочной железы в группах со скринингом и без.
В 1971 году, через восемь лет после старта исследования, ученые начали получать данные, которые на первый взгляд казались убедительным доводом в пользу маммографического скрининга[712]. В эксперименте участвовали 62 тысячи женщин, примерно половине из которых это исследование провели. За прошедший период в этой группе насчитали 31 смерть от рака молочной железы, а в контрольной – 52. Абсолютное число спасенных жизней оказалось небольшим, зато впечатляло относительное уменьшение смертности – почти на 40 %. Страке был вне себя от восторга. “Радиолог, – писал он, – становится потенциальным спасителем женщин – и их груди”[713].
Положительный исход этого исследования спровоцировал взрывное распространение маммографии. “За пять лет маммография перебралась из разряда отвергнутых процедур на порог широкого применения”, – писал один радиолог[714]. В НИО всеобщий энтузиазм по поводу скрининга рос не по дням, а по часам. Артур Холлеб, глава Американского онкологического общества, поспешил провести параллель между этой методикой и мазком Папаниколау. “Пришло время, – заявил Холлеб в 1971 году, – онкологическому обществу запустить массовую программу по маммографии, точно так же, как было с мазком Папаниколау. <…> Мы больше не можем просить население этой страны мириться с ежегодными потерями жизней из-за рака молочной железы, равными потерям за предыдущие десять лет во Вьетнаме. Пришло время для нацинальной мобилизации усилий. Я твердо верю, что момент настал”[715].
Масштабная кампания Американского онкологического общества носила название “Демонстрационный проект по выявлению рака молочной железы”[716]. Что примечательно, это были не клинические исследования, а именно “демонстрация”, как и заявлялось в названии. Проект не предусматривал никакой контрольной группы и за год предписывал обследовать почти 250 тысяч женщин – чуть ли не в 8 раз больше, чем команда Стракса успела за три года. Главной его задачей было продемонстрировать достоинство маммографического скрининга в масштабах целой страны. Мэри Ласкер и практически все онкологические организации Америки активно поддерживали проект. Маммография, эта некогда “отвергнутая процедура”, внезапно оказалась близка к тому, чтобы стать частью мейнстрима.
Но даже когда демонстрационный проект уже оптимистично летел вперед, накапливались сомнения относительно исследования, проведенного на базе HIP. Как мы помним, Шапиро его рандомизировал тем, что случайным образом разделил женщин на экспериментальную и контрольную группы и сравнивал в них смертность. Как было принято в 1960-х, “контролей” не информировали об участии в исследованиях. Это была виртуальная группа – просто выборка из учетных записей HIP. Когда женщина из нее умирала от рака молочной железы, Страке и Шапиро прилежно отмечали это в таблице, но вообще к группе относились как к абстрактной общности, даже неосведомленной о собственном существовании: отдельные деревья падали в статистическом лесу.
Сравнение виртуальной группы пациентов с реальной в принципе могло бы и сработать. Однако в середине 1960-х Страке и Шапиро забеспокоились, не затесались ли в их исследование женщины с уже диагностированным раком – ведь для таких участниц скрининг был совершенно бесполезен. Чтобы скорректировать статистику, Шапиро принялся исключать таких женщин из обеих групп.
Исключить их из экспериментальной группы оказалось достаточно просто: перед маммографией радиолог выведывал у каждой участницы ее медицинскую историю. Однако контрольную группу опросить было нельзя – именно в силу ее виртуальности. Значит, и отсев предстояло вести виртуально. Шапиро попытался сделать это максимально строго и беспристрастно, исключив равное количество женщин из обеих групп. Но кто знает, не выбирал ли он на подсознательном уровне? Возможно, он исключил из группы обследованных женщин больше пациенток с уже диагностированным раком. Разница была невелика – всего 434 пациентки из 30 тысяч – но в статистическом смысле фатальна. Критики приписывали избыточную смертность в контрольной группе именно погрешностям отсева. Контрольная группа, говорили они, по ошибке оказалась перегружена женщинами с уже развившимся раком, а значит, и повышенная смертность в ней – всего лишь статистический артефакт.
Энтузиасты маммографии пришли в уныние. Они признавали, что требуется более объективная оценка, повторное клиническое исследование. Но где теперь его проводить? Определенно не в США, где 200 тысяч женщин уже приняли участие в “Демонстрационном проекте… ” (а значит, для нового эксперимента не годились) и где академические круги пребывали в состоянии глубокого раскола по поводу интерпретации результатов. Пытаясь вслепую выкарабкаться из бездны противоречий, мировое сообщество маммографов ударилось в новую крайность. Вместо того чтобы планировать каждый новый эксперимент с учетом уроков прошлых, оно запустило серию параллельных, во многом перекрывающихся исследований. В период с 1976 по 1992 год массированно изучали скрининговую маммографию в Шотландии (в Эдинбурге) и сразу в нескольких местах Швеции (в Мальмё, Стокгольме, Коппарберге, Эстергётланде и Гётеборге)[717]. В Канаде тем временем провели собственное государственное рандомизированное исследование этого метода. Как это нередко бывало в истории онкологии, тестирование маммографического скрининга превратилось в гонку вооружений, где каждая группа стремилась превзойти усилия соперников.
Эдинбургское исследование обернулось сущим кошмаром[718]. Начать с того, что сам этот город, разделенный на сотни разобщенных врачебных практик, был неподходящим местом для столь масштабного эксперимента. Врачи распределяли женщин по группам скрининга и контроля не слишком-то случайным образом. Или, хуже того, женщины распределялись сами. Протоколы рандомизации с самого начала пошли насмарку, и даже в разгаре исследования участницы переходили из одной группы в другую, исключая возможность хоть какой-то адекватной интерпретации результатов.
В Канаде же, напротив, точность следования протоколам и внимание к деталям были доведены до совершенства[719]. Летом 1980 года при беспрецедентной рекламной поддержке (вплоть до индивидуального обзвона) там стартовала государственная кампания по набору 39 тысяч участниц исследования. Женщина должна была прийти в один из 15 аккредитованных центров скрининговой маммографии, где медрегистратор задавал ей несколько предварительных вопросов, предлагал заполнить анкету и направлял на осмотр к врачу или медсестре. После осмотра имя участницы вносили в открытый реестр – типичную книгу учета в голубую линеечку, какими пользовалось большинство клиник. Рандомизация пациенток достигалась чередованием строк в реестре. Если имя с одной строки попадало в экспериментальную группу, то со следующей – в контрольную, и так далее.
Обратите внимание: рандомизация чаще всего происходила после выяснения медицинской истории женщины и физического осмотра. Это не планировали и не предписывали в исходном протоколе с подробными инструкциями по проведению процедуры, который разослали по всем центрам. И такой вроде бы незначительный нюанс полностью загубил исследование. Распределение после бесед с медсестрами уже нельзя было считать случайным. Женщины с аномалиями в груди или лимфоузлах гораздо чаще попадали в экспериментальную группу (например, в одной из клиник 17 таких участниц оказались в группе скрининга и только 5 – в контрольной). То же самое происходило в отношении женщин с раком молочной железы в анамнезе или попадавших в категорию “высокого риска” на основании их биографии или истории страховых выплат (восемь – на скрининг, одна – в контроль).
Отчего так вышло, не ясно до сих пор. Направляли ли медсестры женщин с высоким риском в скрининговую группу, чтобы перепроверить подозрительные результаты осмотра – получить, так сказать, второе мнение от рентгена? Была ли эта подрывная деятельность осознанной вообще? Или в невольном порыве сострадания они пытались помочь женщинам из группы риска, заставив их пройти маммографию? Не пропускали ли сами такие пациентки очередь в приемной, чтобы нарочно попасть в нужную строчку? И если да, то кто их научил – координаторы исследования, осматривавшие врачи, рентгенологи, регистраторы?
Команды эпидемиологов, статистиков, радиологов и по крайней мере одна группа зарубежных экспертов изучали потом неразборчивые записи в реестрах вдоль и поперек в поисках ответа на вопрос, что же пошло не так[720]. “Подозрения, как и красота, – в глазах смотрящего”, – возражал один из руководителей канадского исследования[721]. Однако поводов для подозрений нашлось немало. Реестры пестрели помарками и исправлениями: имена менялись, строчки выбеливались и переписывались. Показания медработников подтверждали эти наблюдения. В одном из центров координатор исследований добавила в скрининговую группу своих подруг (вероятно, надеясь оказать им услугу и спасти жизнь). В другом о масштабном сознательном нарушении рандомизации заявил кто-то из лаборантов. По страницам академических журналов летали обвинения и контробвинения. “Один урок случившегося очевиден, – открывал читателям глаза в редакционном резюме онколог Норман Бойд, – рандомизацию в клинических исследованиях надо проводить так, чтобы диверсии были невозможны