2.1 Курение, рак легких, Ричард Долл и Остин Брэдфорд Хилл
С детства Ричард увлекался математикой, но, провалив вступительные экзамены в Кембридж, стал врачом, как и его отец. Только любовь к цифрам его не оставила – изучая медицину, он продолжал искать возможности применять математические методы в отношении здоровья. Уже будучи студентом, он опубликовал свои первые научные результаты, а спустя 10 лет работы терапевтом, анестезиологом, военным врачом и даже психиатром все же связал две страсти – поступил на курс медицинской статистики в знаменитую Лондонскую школу гигиены и тропической медицины [29].
Во время учебы Ричард работал в лондонской больнице, где исследовал причины язвенной болезни у работников разных сфер. Результаты время от времени предоставлялись в Совет по медицинским исследованиям (Medical Research Council – MRC) – государственное учреждение, ответственное за координацию и финансирование научных работ в Соединенном Королевстве. Там молодого ученого заметил известный профессор медицинской статистики сэр Остин Брэдфорд Хилл, и по его рекомендации Ричарда Долла пригласили работать в Совете.
В 1948 году чиновников тревожило резкое повышение смертности от рака легких. Доллу и Хиллу поручили разобраться, почему так происходит и что с этим делать. Главным подозреваемым тогда считали загрязнение воздуха печным отоплением с некачественным углем и растущим количеством автомобилей с дизельным топливом (апогеем станет великий Лондонский смог в 1953 году). Курение же считалось безобидной привычкой – 80 % мужчин курили. Хотя было известно о взаимосвязи между курением трубки и раком губы, причиной считали нагревание трубки [20].
Тем не менее начали появляться первые доказательства негативного влияния самого табака и табачного дыма на здоровье. Эту гипотезу решили проверить Долл и Хилл. Как это сделать? Они могли начать исследование с серии случаев, как Маршалл и Уоррен, собрав группу пациентов с раком легких – отличная стартовая точка в поиске причин. Но они пошли другим путем.
Профессор Хилл был ведущим статистиком в одном из первых рандомизированных контролируемых испытаний (РКИ) по эффективности стрептомицина в лечении туберкулеза. Исследование стрептомицина – еще один прорыв в мышлении врачей и ученых – познакомило медицинское сообщество с «чудесными» лекарствами – антибиотиками и вознесло РКИ на пьедестал золотого стандарта исследований в медицине, а Хиллу принесло славу и авторитет.
Рандомизированные контролируемые испытания – это тип научных исследований в медицине, с помощью которого оценивают эффект вмешательства путем сравнения результатов двух и более групп (отсюда – контролируемое), при этом участники распределяются по группам случайным методом (отсюда – рандомизированное). Подробно про этот вид исследований поговорим в 7-й главе.
Однако Хилл понимал, что доказать связь курения и развития рака легких с помощью РКИ не выйдет. Во-первых, неэтично заставлять людей курить или подвергать воздействию потенциально вредных веществ. Во-вторых, даже если курение вызывает рак, РКИ требуют годы исследований и огромные финансовые вложения.
Из опыта проведения РКИ Хилл все-таки взял на вооружение один принцип.
2.2 Исследование «случай – контроль»
Чтобы понять, что объединяет случаи рака легких и отличает их от остальных, Хилл предложил сравнить две группы: пациентов с диагностированным раком и контрольную группу здоровых добровольцев. Такой вид исследования называют «случай – контроль», где случаи заболевания сравнивают с контрольными пациентами. Основная цель исследований «случай – контроль» – изучить, какие факторы объединяют пациентов с заболеванием и не встречаются или встречаются гораздо реже у людей без заболевания.
Рисунок 7. Иерархия научных доказательств. Ступень 3 – Исследования «случай – контроль»
Исследования «случай – контроль» лучше серии случаев, с которых начинали наблюдения Маршалл и Уоррен из первого параграфа главы: контрольная группа помогает увидеть, насколько часто предполагаемая причина встречается у людей без болезни. Например, если взять всех пациентов с болью в коленных суставах и сделать им рентген суставов, у всех найдутся изменения, например признаки разрушения хряща, и можно ошибочно предположить, что это обязательный признак заболевания, указывающий на причину боли. Если же сделать рентген пациентам без боли в коленных суставах, то окажется, что среди них тоже найдутся аналогичные изменения хряща на рентгенограммах. Является ли разрушение хряща единственной причиной – маловероятно, и мы еще вернемся к этому позже. Еще один пример: МРТ-находки по типу протрузий межпозвонковых дисков при боли в спине, или, как мы любим называть, при остеохондрозе, довольно часто встречающиеся и у людей, не испытывающих проблем со спиной.
Долл и Хилл разработали краткую анкету и попросили социальных работников в двадцати лондонских больницах раздать ее пациентам, недавно госпитализированным с подозрением на рак легких, печени или кишечника и другими заболеваниями. Всего в исследовании приняло участие 709 пациентов с раком легкого и 709 пациентов того же пола, возраста из той же больницы, но с другим заболеванием – контрольная группа [29]. Чтобы сохранять объективность, социальные работники не знали диагноз пациента и к какой группе он принадлежал.
Результаты шокировали: курение было единственным фактором, объединяющим почти все случаи рака легкого. Однако не все курильщики имели проблемы с легкими. Посмотрите на таблицу ниже. Большинство в контрольной группе тоже курили, но их легкие не имели новообразований.
Примечание: хотя в исследовании приняли участие 709 пациентов с раком легкого и 709 контрольных пациентов, 120 из них (60 в основной и 60 в контрольной) были женщинами [29]. Ввиду небольшой выборки данные участниц женского пола не были включены в анализ.
Такие таблицы называют таблицами сопряженности, или таблицами 2 × 2. Их часто применяют при сравнении групп. Как правило, колонки означают наличие или отсутствие изучаемого исхода, а строки – наличие или отсутствие изучаемого фактора. В нашем случае исход – это диагноз карциномы легких, а изучаемый фактор – курение.
Чтобы оценить, насколько в цифровом выражении сильна взаимосвязь между изучаемой причиной и случаями заболевания, существует несколько статистических показателей, из которых наиболее часто встречаются в научных исследованиях отношение шансов и отношение рисков.
В обычной жизни слова «шанс» и «риск» воспринимаются как синонимы вероятности того, что может произойти, хотя иногда мы говорим о шансах в более позитивном ключе, а о рисках – в несколько негативном: «Сегодня есть шанс солнечной погоды» или «Сегодня есть риск дождя». Однако в статистике это два различных понятия.
Шанс (odds) – это вероятность того, что событие произойдет, разделенная на вероятность того, что событие не произойдет.
Риск (risk) – это вероятность того, что событие произойдет среди всех пациентов в группе.
Рисунок 8. Как рассчитываются шансы и риски
Расчеты обоих показателей основаны на таблице сопряженности, а выбор зависит от нескольких параметров, в том числе размера выборки и частоты встречаемости изучаемого фактора. Когда вероятность события низка, то в цифровые значения шанса и риска приближаются. Например, шанс получить эмболию легочных артерий после операции равняется 1/99, тогда как риск будет 1/100. Напротив, если учесть все возможные послеоперационные осложнения, то уже различаются: шанс 25/75 = 33 %, а риск 25/100 = 25 %.
А при сравнении групп мы получаем:
отношение шансов (ОШ, англ. odds ratio) развития определенного клинического исхода в основной группе к шансам его развития в контрольной группе, который рассчитывается как ОШ = Шанс1 / Шанс2,
и отношение рисков (ОР = Риск1 / Риск2, англ. risk ratio).
Чем ближе значение ОШ или ОР к 1, тем меньше различий в эффективности вмешательств, применявшихся в основной и контрольной группах.
ОШ = 1 или ОР = 1 означает, что шансы или риск одинаковы для обеих групп.
ОШ > 1 или ОР > 1 означает, что шансы или риск выше для группы в числителе (обычно группа с фактором риска). Чем выше показатель, тем сильнее взаимосвязь. Например, в среднем отношение шансов заболеть раком желудка при наличии инфекции Helicobacter pylori составляет ОШ = 1,92, значит, шансы заболеть раком желудка у пациентов с Helicobacter pylori в 2 раза выше в сравнении с теми, у кого инфекции нет. Однако среди людей моложе 29 лет шансы выше и ОШ составляет 9,29 [27].
ОШ < 1 или ОР < 1 указывает на снижение шансов или риска для группы, подвергшейся воздействию фактора риска или медицинского вмешательства, например после приема лекарственного средства.
Оба показателя – относительные, поэтому результат будет всегда положительным, то есть в пределах от нуля и до бесконечности (в реальности редко превышает 30–50).
В исследовании Долла и Хилла риск развития рака легких среди курильщиков был в 7 раз больше, чем среди некурящих. Более того, чем больше курили пациенты, тем выше был риск рака – в 27 (!) раз выше среди тех, кто курил больше 25 сигарет в день, по сравнению с некурящими [29]. Такой эффект называют «доза – эффект» – чем больше доза воздействия, тем больше эффект.
С такими результатами можно быть уверенными, что причина точно в курении!
А вот и нет. И дело даже не в результатах, а в дизайне исследования.
В широком смысле под дизайном в научных исследованиях подразумевается порядок сбора данных и методы их анализа, необходимые для ответа на поставленный вопрос или проверки гипотезы. В узком смысле под дизайном исследования мы подразумеваем тип исследования, например исследование «случай – контроль», когортное или РКИ.
Практические рекомендации
Если видите информацию о том, что какое-то явление или событие вызывает заболевание или приводит к какому-либо состоянию (то есть подразумевается причинно-следственная связь), обязательно обратите внимание на дизайн исследования.
Исследования «случай – контроль» указывают на взаимосвязь между факторами риска и заболеванием или каким-либо другим исходом, например риск травмы, выздоровления или смерти, а также в случаях редких заболеваний. Как, например, в случае с первым исследованием Долла и Хилла, когда они сравнивали количество курящих среди пациентов с раком легких и в контрольной группе. Исследования «случай – контроль» хороши для изучения редких заболеваний, а также когда одновременно нужно оценить взаимосвязь с множественными факторами риска (о том, почему это важно, подробнее поговорим в следующей главе). А еще они требуют меньше времени и ресурсов по сравнению с когортными исследования и клиническими испытаниями.
Однако в большинстве случаев исследования «случай – контроль» не могут подтвердить причинно-следственную связь. Чтобы оценить вероятность развития болезни, за интересующей нас группой нужно наблюдать в течение какого-то времени, включая наблюдение до развития заболевания. А исследования «случай – контроль» проводятся либо одномоментно, когда все показатели оцениваются в один момент времени, например в настоящий момент, как в исследовании Долла и Хилла, когда курение и наличие рака легкого оценивалось одномоментно, либо в прошлом (ретроспективно), когда часть показателей собрана задолго до наступления исхода или взята из медицинских записей или базы данных.
В зависимости от того, как собирались данные, исследования могут быть:
• Одномоментными (или поперечные) – все измерения и оценки производят в один момент времени в настоящем или в прошлом.
• Динамическими и продольными (или лонгитюдные) – измерения и оценки производят в нескольких временных промежутках, например в настоящем и в будущем (проспективные), что предполагает динамическое наблюдение за исследуемыми в течение определенного периода времени.
Когда информация о причинах и следствиях оценивается или измеряется ретроспективно, как в исследованиях «случай – контроль», мы не можем точно сказать, что к чему привело. Конечно, в случае с раком легких мы не можем сказать, что он заставил людей курить, но, возможно, пациенты с раком легких могли на момент исследования назваться «некурящими», а до проведения исследования активно курить и бросить из-за проблем со здоровьем – это может исказить результаты исследования.
Оценивая исторические или ретроспективные данные, мы берем людей, у кого есть болезнь в настоящем, и пытаемся разглядеть в их прошлом, что привело к болезни. Во многом приходится полагаться на память участников исследования.
Вот вы вспомните, как часто болели простудой в студенчестве? Или сколько чашек чая выпивали в день 5 лет назад? Наша память избирательна. Некоторые события запоминаются лучше, чем другие. А еще, когда есть проблемы со здоровьем, мы порой склонны придавать особую важность отдельным «подозреваемым», таким образом преувеличивая или преуменьшая влияние некоторых событий. Представим двух человек, которые курили примерно одинаковое количество лет и сигарет в день, но не обращали внимания на это, и точных цифр не помнят. И вот один узнаёт, что у него рак легких, вероятно из-за курения. На вопрос «как давно и как много вы курите» он с большей вероятностью даст верхний диапазон значений, тогда как второй пациент (здоровый) может значения приуменьшить. Здесь наша способность находить взаимосвязи между событиями (не всегда верные) больше мешает исследованиям, чем помогает. Ученые называют такие ошибки «ошибки памяти» или recall bias.
Какие еще недостатки встречаются у исследований «случай – контроль»?
Во-первых, курильщик курильщику рознь. Между легким и злостным курильщиком – множество самых разных курильщиков. И риск осложнений у них будет разный. Поэтому, когда мы сравниваем группу курильщиков с контрольной, в идеале каждая должна отражать возможное разнообразие, например по возрасту, месту проживания и профессиональной деятельности. Это называется «репрезентативность», о ней мы подробно поговорим в следующей главе.
Во-вторых, контрольная группа должна быть максимально похожа на основную за исключением изучаемого фактора. Сравнивая отличающиеся друг от друга вещи, легко ошибиться, поэтому этот прием часто используется для манипуляции цифрами. Как говорится, мухи отдельно, котлеты отдельно. Допустим: «Находиться на военной службе во время открытого конфликта (например, во время войны в Афганистане) гораздо безопаснее, нежели в тылу». Согласно статистическим подсчетам, в 2010 году погибло 3482 американских военнослужащих. Исходя из общего числа военнослужащих – а их 1 431 000 человек, – получим 2,4 смертельного случая на тысячу человек. Среди обычного населения Соединенных Штатов количество смертей в 2010 году составило 8,2 на тысячу человек. Давайте разберемся, как так получается, что находиться на службе в военной зоне в три с лишним раза безопаснее. Выборки разные, поэтому их нельзя сравнивать напрямую. В действующей армии служат молодые здоровые солдаты. Население Соединенных Штатов весьма разнообразно: здесь проживают и старики, и больные, и гангстеры, и наркоманы, и любители погонять на мотоциклах, а также огромное количество людей без доступа к медицинскому обслуживанию. Смертность среди них высока, где бы они ни находились. Чтобы понять, насколько опасно находиться на военной службе во время открытого конфликта, военнослужащих в зоне конфликта нужно сравнивать с другими военнослужащими вне зоны конфликта.
В-третьих, сравнивая пациентов с раком легких и здоровых, мы вычисляем вероятность, что пациент с раком легких является курильщиком, хотя на самом деле нас интересует вероятность рака легких у курильщиков. Ведь именно ответ на последний вопрос подскажет, курить или не курить. Помните про пример со смертельными поражениями самолета, когда самолеты с пробоинами в области кабины и топливного бака просто не долетали до базы? Так и в исследованиях: чтобы оценить реальную картину, важно наблюдать за исходной группой пациентов в течение времени.
2.3 Когортные исследования
Когда Долл и Хилл опубликовали результаты о связи курения и рака легких в Британском медицинском журнале, BMJ, в 1950 году [21], многие врачи и ученые им не поверили. Согласно опросу Американского онкологического общества, в 1960 году только 30 % врачей согласились с высказыванием «Курение – основная причина рака легких», при этом 43 % сами были курильщиками. Общество, как вы, наверно, догадались, тоже проигнорировало новую информацию. И даже «если об этом рассказывали в газете или по радио, репортеры всегда осторожно старались упомянуть какого-нибудь доктора, которого предоставила им табачная промышленность и который говорил, что исследование было спорным и связь не доказана».
В свете великих открытий последних декад XIX века – возбудителей дифтерии, тифа, туберкулеза – мышлением ученых продолжала руководить бактериальная теория. По аналогии с постулатами Коха считалось, что причинный фактор должен присутствовать во всех случаях заболевания. «Курение не может быть причиной рака легких, потому что я видел случай у некурящих, и, следовательно, согласно постулату Коха, курение не является причиной», – говорили скептики. Люди не осознавали, что эти принципы актуальны только в случае инфекционных заболеваний, но зачастую ошибочны в случае неинфекционных болезней. Во-первых, потому, что большинство хронических заболеваний имеют несколько причин, так же как курение – лишь одна из причин рака легких, не единственная, но тем не менее самая важная. Во-вторых, для развития заболевания требуется время, порой речь идет о десятилетиях.
Долл и Хилл соглашались с критиками: проведенное исследование говорит нам лишь о том, что «курение – это фактор, и важный фактор в развитии рака легких», но насколько он виновен в развитии рака легкого, нужно еще разобраться. Поэтому в 1951 году Долл и коллеги организовали исследование другого рода. Они не просто сравнили больных раком со здоровыми, а начали наблюдение за курильщиками без рака. Такие исследования называют когортными.
Когорта – это группа людей, объединенных каким-либо общим признаком на момент формирования группы, за которыми наблюдают на протяжении некоторого периода времени. Например, за знаменитой Фремингемской когортой (ориг. Framingham Heart Study) наблюдают более 70 лет. Первыми участниками исследования стали жители города Фремингем в 1948 году (5209 мужчин и женщин в возрасте 28–62 лет). Часто участников набирают, когда у них еще нет никаких проблем со здоровьем, и следят за ними десятки лет до развития заболевания. Есть исследования, когда за участниками наблюдают буквально с рождения – «когорта по году рождения» (англ. birth cohort). Например, эйвоновское лонгитюдное исследование родителей и детей (ориг. Avon Longitudinal Study of Parents and Children (ALSPAC)) больше 30 лет наблюдает за детьми, рожденными в Бристоле в 1991 и 1992 годах.
Рисунок 9. Типы научных исследований. Ступень 4 – когортные исследования
Чем когортные исследования отличаются от исследований «случай – контроль»?
В исследования «случай – контроль» отбираются пациенты с диагностированным заболеванием, например с раком легкого, или без заболевания на момент обследования (контрольная группа). Затем сравниваем, как часто встречается фактор риска, то есть курение, в этих группах на момент обследования или в прошлом (за год, за 5 лет и т. д. до начала заболевания). Таким образом, исследования «случай – контроль» могут быть как одномоментными, так и ретроспективными.
В когортное же исследование пациенты отбираются на основании фактора риска, а не исхода, то есть имеющегося заболевания. Например, две группы – курящие или некурящие, или одна группа – когорта детей, которые еще не курят. То есть на момент начала исследования у участников нет заболевания. Наша цель – проследить, у кого в будущем будет диагностирован рак, а у кого нет. При этом когортное исследование может быть как проспективным – группы формируются на момент обследования и наблюдение происходит в будущем, так и ретроспективным, когда группы формируются в прошлом на основании имеющихся данных и наблюдение ведется до определенного момента в прошлом или до настоящего момента.
Рисунок 10. Исследование «случай – контроль»
Рисунок 11. Когортное исследование
Например, если вы сегодня хотите измерить рост учеников в одном классе, это будет одномоментное поперечное исследование. Если разделите учеников на 2 группы – тех, кто сделал домашнее задание, и тех, кто нет, и спросите их, кто из них вообще понял тему предыдущего занятия, как возможную причину, почему они не сделали уроки, это будет исследование «случай – контроль». А вот если вы сегодня поделите детей на 2 группы, например, измерите их уровень владения темой или предмета в целом и проследите, сколько из них выполнят домашнее задание на следующей неделе или, допустим, в конце четверти, это уже будет когортное исследование.
Вернемся к Доллу и Хиллу.
Чтобы проследить, действительно ли среди курильщиков рак легких развивается чаще, ученые разослали британским докторам 60 000 опросников о вредных привычках [22]. Дополнительные анкеты об изменениях в привычках курения отправили в 1957, 1966, 1971, 1978, 1991, 1998 и 2001 годах. Всего ученые получили 41 024 ответа, из них отобрали 40 701 опросник без пропущенных ответов (34 494 мужчины и 6207 женщин) для последующего анализа. Правда, из-за небольшого количества и ограниченного потребления табака женщин исключили из большинства отчетов.
Далее Долл и Хилл вели подсчет количества смертей среди опрошенных докторов. Уже через 2,5 года 37 участников умерло от рака легких, все были курильщиками. Через 5 лет злостные курильщики умирали от рака легких в 24 раза чаще, чем некурящие. Через 10 лет умерло 4597 наблюдаемых докторов. К тому времени стало ясно: курение связано и с рядом других заболеваний, особенно сердечных. Но были и хорошие новости: риск рака легких уменьшался после отказа от курения.
С этими результатами уже было сложно поспорить. Когортный дизайн позволил избежать неточностей, связанных с тем, что участники плохо помнят, сколько и когда курили, преуменьшают или преувеличивают цифры (опросники заполнялись в начале исследования, когда у них еще не было диагностировано заболевание), или с тем, что в группе недостаточно или слишком много людей, которые курят мало или, наоборот, много (опросники рассылали не по признаку курения, а всем), а также с отличием контрольной группы от основной (все были врачами, и, так как опросники получили все, группы были сопоставимы по возрасту и полу и отличались лишь по одному признаку – курению).
У когортных исследований есть еще одно преимущество. Наблюдая за участниками в течение времени, мы можем проследить, действительно ли причина предшествует следствию. Кажется очевидным, что причина должна предшествовать следствию, однако часто именно с этого начинается путаница между взаимосвязью и причинами. Например, многочисленные исследования показали существование взаимосвязи между низким уровнем холестерина в крови и различными онкологическими заболеваниями [24]. Однако при раке толстого кишечника доказано обратное: на самом деле рак приводит к снижению холестерина [25–26]. А если вспомните историю Земмельвейса, то его коллеги думали, что страх у рожениц вызывает горячку, когда, наоборот, высокая частота этого заболевания и смерти вызывали страх у женщин. Подобное явление, когда предполагаемое следствие предшествует своей причине во времени, в статистике называют ретропричинностью, или обратной причинностью (с англ. reverse causality).
Результаты исследований Долла и других ученых, доказывающие связь между курением и последующим развитием рака легкого, убедили медицинское сообщество и уполномоченные органы. В 1954 году Национальный совет Американского онкологического общества объявил «без возражений», что «имеющиеся в настоящее время свидетельства указывают на связь между курением, особенно курением сигарет, и раком легких». В том же году министр здравоохранения Великобритании Иян Маклеод (Iain Macleod) заявил от лица правительства, что связь между курением и раком легких можно считать доказанной. Однако и тогда не все поверили, что курение приводит к раку легких.
2.4 Когда взаимосвязь указывает на причину?
Выдающийся статистик Рональд Фишер, методом которого мы до сих пор оцениваем статистическую значимость различий в таблицах типа «два на два», был яростным противником Долла и Хилла и причинной связи между курением и раком легких. Дебаты с Фишером побудили Брэдфорда Хилла систематизировать свои знания и опыт определения причинно-следственных связей в так называемые девять руководящих принципов, опубликованные в 1965 году [29]. Эти принципы, часто ошибочно называемые критериями, с некоторыми поправками используются по сей день.
Давайте разберем каждый, потому что они нам еще пригодятся.
Принцип 1: следствие всегда наступает после причины – единственный принцип из девяти, который является обязательным. Поэтому только когортные исследования или эксперименты (клинические испытания) позволяют проследить развитие заболевания у людей, у кого ранее при обследовании заболевания не выявили. Так, во втором исследовании Долл и Хилл наблюдали за курящими и некурящими докторами в течение многих лет, чтобы с точностью сказать: курение приводит к развитию рака легкого.
Принцип 2: причинно-следственная связь более вероятна при большом размере эффекта (силы корреляции, количественного выражения риска или силы взаимосвязи и т. д). Хотя небольшая величина эффекта не означает отсутствие эффекта. Так, в первом исследовании Долла и Хилла у пациентов, выкуривающих более 25 сигарет в день, рак легкого встречался в 27 раз чаще, чем у некурящих. С такими результатами сложно поспорить. Тогда как небольшой размер эффекта, например, если фактор риска увеличивает риск на 10–15 %, считается менее убедительным. Например, говоря о связи между приемом антибиотиков и риском рака груди в будущем, согласно метаанализу 10 исследований, относительный риск составляет (relative risk RR = 1.18, 95 % ДИ 1.08–1.29). Простыми словами: рак груди на 18 % чаще встречается у тех, кто принимал антибиотики, в сравнении с теми, кто не принимал. Является ли эта взаимосвязь причинной, еще предстоит узнать.
Принцип 3: причинно-следственная связь более вероятна, если существует зависимость между силой воздействия и выраженностью эффекта – «доза – эффект». Например, риск развития рака легкого прямо пропорционален количеству выкуриваемых сигарет и уменьшается при отказе от курения. Также риск развития цирроза печени пропорционально повышается с увеличением количества и частоты употребления алкоголя. Однако этот принцип соблюдается не всегда – в случаях нелинейных взаимосвязей по типу кривой в виде буквы U или J или когда эффект некоторых факторов риска не изменяется с увеличением или уменьшением дозы. Например, лекарственный препарат талидомид вызывает врожденные мутации и нарушения развития у детей даже после приема 1 таблетки на раннем сроке беременности.
Принцип 4: причинно-следственная связь более вероятна, если результаты эпидемиологических исследований согласуются с лабораторными данными. К моменту, когда Долл и Хилл опубликовали результаты своих первых исследований, накопилось достаточно данных, подтверждающих влияние табачного дыма на развитие рака у лабораторных животных и существование конкретных химических и молекулярных компонентов, способствующих возникновению рака на клеточном уровне. Несколько разных форм доказательств – эпидемиологические исследования, эксперименты на животных и результаты химического анализа – говорили о вреде курения. Однако Хилл отметил, что «…отсутствие таких [лабораторных] доказательств не отменяет эпидемиологические свидетельства причинно-следственной связи». Так как возможно, что другие доказательства просто еще не получены.
Принцип 5: причинно-следственная связь более вероятна, если существует правдоподобное объяснение механизма причинно-следственной связи. Применимость этого критерия (как и предыдущего) ограничена имеющимися знаниями в предметной области. Например, в истории с Земмельвейсом объяснение механизма заражения рожениц после контакта с трупным материалом было вполне правдоподобным, хотя не совсем верным из-за того, что тогда еще не знали о бактериях.
Принцип 6: причинно-следственная связь более вероятна, если результат воспроизведен разными людьми в разных местах с разными образцами, чтобы исключить влияние других неучтенных факторов. Например, первоначально предполагаемой причиной рака легкого считали загрязнение воздуха в Лондоне. Чтобы быть уверенным, что именно курение приводит к раку легкого, результаты исследования «случай – контроль», полученные в Лондоне, воспроизвели в Бристоле, Кембридже, Лидсе и Ньюкасле. А результаты второго, когортного, исследования, проведенного в Англии, подтвердили сходными результатами в США.
Принцип 7: причинно-следственная связь более вероятна, если в конкретном месте есть очень специфическая популяция и отсутствуют другие вероятные объяснения того же заболевания. Чем более конкретна связь между фактором и эффектом воздействия, тем больше вероятность причинно-следственной связи. Например, исследуя связь между питанием и раком, профессор Колин Кампбелл (Colin T. Campbell) заметил чрезвычайно частые случаи рака печени у детей на Филиппинах. Несмотря на то что этот вид рака обычно развивается гораздо позже в жизни, достигая пика после 60 лет, некоторые филиппинские дети умирали от него даже в возрасте 10 лет. Позже ученые смогли проследить и доказать, что причиной тому было присутствие афлотоксина в местных марках арахисового масла [12]. Афлотоксин – токсичный карциноген, который производится определенным видом грибов, растущих на арахисе.
Принцип 8: причинно-следственная связь более вероятна, если доказана в эксперименте. В этой главе мы разбирали в основном наблюдательные исследования, но, возможно, вы заметили и некоторые эксперименты. Например, когда Маршалл выпил культуру Helicobacter, что вызвало у него гастрит и подтвердило его предположения о причинно-следственной связи. К экспериментам также относят клинические испытания, в том числе РКИ. А когда исследование на людях неэтично или невозможно, ученые прибегают к экспериментам на животных. Например, у крыс на диете с высоким содержанием жиров развиваются атеросклеротические бляшки на стенках артерий, а это показатель сердечно-сосудистых проблем.
Принцип 9: причинно-следственная связь более вероятна, если можно провести аналогию в различных популяциях или при различных заболеваниях. Например, вред несбалансированного питания и малоподвижного образа жизни доказан при различных заболеваниях.
2.5 Зачем нам (не врачам и не ученым) знать о дизайнах исследований?
Новые результаты исследований в области медицины публикуются каждый день. Из них мы узнаем, что пить кофе вредно, спать нужно больше, а бобовые – замачивать перед готовкой. Мы доверяем научным исследованиям, а также журналистам, которые о них пишут. Но не все исследования подтверждают наличие причинно-следственной связи и оправдывают изменение нашего образа жизни.
Заголовки журнальных статей да и сами статьи часто вводят читателей в заблуждение, когда говорят о результатах исследований, которые лишь выявили взаимосвязь между двумя явлениями (например, люди, которые пьют кофе, живут дольше), журналисты, блогеры и авторы статей описывают эти результаты, будто одно (употребление кофе) действительно вызывает другое (долгую жизнь). Помните пример про рыбу и риск инфаркта из предыдущей главы?
Скорее всего, подмена взаимосвязей причинными утверждениями в СМИ происходит не специально. В научных статьях ученые тщательно подбирают фразы и термины, особенно говоря о причинности. Но в попытках объяснить сложные для понимания научные факты авторы пытаются писать кратко, просто и понятно, а еще увлекательно, чтобы захватить внимание читателей. При этом, часто сами того не подозревая, искажают смысл оригинального сообщения. Например, описание взаимосвязи, указывающей на сниженный риск, может необоснованно стать описанием причины и следствия при переходе на активный язык: «снижает риск». Однако в научном языке прилагательное «меньший» (риск) – это далеко не одно и то же, что и глагол «снижает» (риск). Также разница между фразой «А связано с увеличением Б» и фразой «А увеличивает Б» может показаться незначительной с точки зрения языка, но это огромная разница с точки зрения смысла.
Простой пример.
«Те, кто пьет кофе, чаще попадают в аварии» – это взаимосвязь.
«Кофе увеличивает количество аварий на дорогах» / «Употребление кофе водителем приводит к автокатастрофам» – это причина.
Ничто не заменит тщательной оценки качества исследований экспертами. Если не обращать внимания на основной дизайн исследований, это может привести к переоценке значения результатов исследования и, возможно, даже необоснованному выбору. Тем не менее каждый может оценить правдивость «причинных утверждений» – действительно ли А вызывает Б, просто взглянув на дизайн исследования.
В этой главе мы разобрали две истории, в которых была доказана причинно-следственная связь. Для этого ученые применяли разные дизайны исследования, начиная с простого, указывающего на взаимосвязь между явлениями, затем переходя к более сложным, которые могут подтвердить причинность. В случае с Helicobacter pylori и раком желудка – исследование серии случаев, а затем эксперимент, как того требуют постулаты Коха для инфекционных заболеваний. В случае с курением и раком легких ученые сначала провели исследование «случай – контроль», а затем когортное исследование.
Дизайн исследования влияет на надежность результатов и является стартовой точкой для оценки причинности.
В следующей главе подробно разберем несколько важных характеристик исследований, на которые нужно обращать внимание при интерпретации результатов. Однако прежде хотелось бы остановиться на некоторых нюансах изучения причин болезней не в статистическом, а в практическом плане.