2.1 Кофе и артрит
Закройте на секунду глаза и представьте кофейную столицу Европы. Какой образ пришел к вам? Может, вы подумали об итальянцах, потягивающих пышный капучино, или французах, вдыхающих аромат утреннего кофе с круассаном в уличном кафе? На самом деле любители кофе номер один в мире – финны. Да-да, вы не ослышались. Средний финн потребляет 12 кг кофе в год, намного опережая Италию (5,5 кг в год) и Францию (6,2 кг в год) [36]. Финны начинают рабочий день с чашечки кофе, затем чашечка после обеда, другая во время кофе-брейка и, конечно, после работы можно насладиться еще одной с друзьями или дома. У каждой чашечки кофе в финском языке есть название, например, aamukahvi – утренний кофе, päiväkahvi – дневной, iltakahvi – вечерний. Невозможно обойтись и без saunakahvi – кофе в сауне. В Финляндии даже рабочий устав прописывает два 15‐минутных перерыва на кофе в течение дня.
Неудивительно, что именно финские ученые впервые заинтересовались влиянием кофе на риск ревматоидного артрита – одного из самых распространенных видов воспалительного артрита в мире. В 2000 году в ведущем журнале в области ревматологии Annals of Rheumatic Diseases вышла статья с результатами крупного когортного исследования, организованного Министерством здравоохранения и социального обеспечения Финляндии, с участием 19 518 мужчин и женщин из разных регионов страны, за которыми наблюдали более 10 лет. Результаты показали, что привычка выпивать более 4‐х чашек кофе увеличивает риск развития ревматоидного артрита в будущем в среднем в 2 раза [12].
Спустя два года американские ученые из Университета Алабамы опубликовали результаты 10-летнего наблюдения за 30 000 женщин из когорты по изучению здоровья женщин Айовы (Iowa Women’s Health Study) [13]. Их выводы отличались от финских. На этот раз потребление более 4‐х чашек обычного кофе в день не сопровождалось повышенным риском заболевания в будущем, тогда как потребление более 4‐х чашек декофеинизированного кофе в день было связано с увеличением риска развития ревматоидного артрита в 2,5 раза.
В 2003 году вышла еще одна статья, основанная на 20‐летнем наблюдении за 83 124 женщинами из когорты по изучению здоровья медсестер (ориг. Nurses Health Study), США [14]. Результаты опровергли любую взаимосвязь между обычным или декофеинизированным кофе и риском развития ревматоидного артрита.
Можно ли считать вопрос закрытым? Какому исследованию верить? Самому последнему, потому что оно самое большое? А может, тому, которое опубликовано в более авторитетном журнале?
Чтобы ответить на эти вопросы, давайте сначала подумаем, почему три исследования о связи кофе и ревматоидного артрита пришли к разным выводам.
В начале главы мы говорили, что размер выборки имеет значение. На данном примере видно, что второе и третье исследования масштабнее, но в целом все три большие – ~20, ~30 и ~80 тысяч участников соответственно. Все три исследования когортные, при этом третье наиболее длительное (~10, ~10 и ~20 лет наблюдений).
Далее посмотрим, где, как проводились исследования и кто принимал участие.
Первое исследование провели в Финляндии, остальные два – в США.
Имеет ли значение, в какой стране проводилось исследование? Возможно. Например, если географические, культурные, политические, этнические особенности могли повлиять либо на болезнь, либо на фактор риска. В этом вопросе фактор риска – кофе. В Финляндии восемь или девять чашек кофе в день считается нормой, тогда как средний американец в то время потреблял от 2‐х до 4‐х чашек кофе в день.
Влияет ли страна на риск развития ревматоидного артрита? Для этого нужно посмотреть на цифры распространенности заболевания по странам. В случае с ревматоидным артритом это маловероятно, так как, по данным исследований, больших различий между Финляндией и США нет – распространенность 1 % в сравнении с 1.37 %.
Чем еще отличались исследования? В финском исследовании принимали участие и мужчины, и женщины, а в остальных – только женщины. Имеет ли это значение? Возможно, ведь в среднем женщины пьют меньше кофе, чем мужчины, а риск развития ревматоидного артрита выше у женщин, чем у мужчин. Первые два исследования были популяционными когортами, то есть в них принимали участие представители обычного населения или популяции страны, третье – когорта медицинских сестер. Возможно ли, что профессия повлияла на потребление кофе и риск развития ревматоидного артрита? Возможно, если, например, медсестры пьют больше кофе или имеют повышенный риск ревматоидного артрита по каким-то другим причинам.
Теперь посмотрим на результаты.
В американских исследованиях менее половины пациентов с диагностированным ревматоидным артритом пили более 4 чашек в день, тогда как в Финляндии – большинство. В первом исследовании за время наблюдения ревматоидный артрит диагностировали у 89 пациентов, из них только 10 человек пили менее 4‐х чашек в день, а остальные потребляли 4 и более чашек кофе в день. Во втором исследовании среди новых случаев ревматоидного артрита 13 не потребляли кофе вовсе, 37 – менее 1 чашки в день, 28 выпивали 2–3 чашки в день, а 74 – 4 и более чашек в день. В исследовании Karlson не пили кофе 31 человек, менее 1 чашки в день – 20, от 2‐х до 3‐х чашек в день – 107, 4 и более – 47.
Чтобы не запутаться, взглянем на таблицу ниже:
Заметили разницу?
Если хотим узнать, может ли кофе вызвать ревматоидный артрит, чтобы применить эти знания в реальной жизни, нужно, чтобы участники исследования были максимально похожи на обычных людей. Как думаете, какое исследование было более похоже на нашу реальность?
В первом выборка хорошо отражает население Финляндии, но не население других стран. Тогда как участники второго и третьего исследования более похожи на среднестатистическое население стран, где только небольшое число жителей употребляет более 4‐х чашек кофе в день. Например, в России среднестатистический житель выпивает от 1 до 2‐х чашек кофе в день.
То, насколько похожи участники исследования на тех людей, которые нас интересуют, например на нас с вами, называют репрезентативностью. Термин произошел от английского слова represent – «представлять», то есть участники исследования в идеале должны быть представителями интересующей нас группы и отражать ее характеристики.
Практические рекомендации
В любом исследовании, результаты которого вы хотите применять в своей жизни, обратите внимание на характеристики выборки:
• Кто участвовал в исследовании?
• По каким критериям отбирали участников?
• В какой стране проводилось исследование?
Почему важно, чтобы участники исследования были похожи на тех людей, которые нас интересуют, то есть на нас с вами? Почему репрезентативность важна?
Если речь идет о населении страны, состав участников исследования должен быть похож на срез населения страны – например, в процентном соотношении иметь такое же количество мужчин и женщин, молодых и пожилых, работающих и безработных. Иначе если в исследование вы набираете работников банка, большинство из которых в возрасте 30–40 лет, имеют высшее образование и зарплату выше среднего, то, вероятно, их привычки и мнения будут отличаться от среднестатистического жителя страны. Результаты исследования, полученные на такой выборке, справедливы для работников банка, но не отражают действительность в стране в целом.
Одна и та же выборка может быть репрезентативной и нерепрезентативной для разных интересующих нас популяций или групп людей.
Лучший способ обеспечить репрезентативность выборки – отобрать участников случайным образом. Например, случайная выборка людей из разных регионов, из разных возрастных и социальных групп будет хорошо отражать население страны.
Если участники отбираются неслучайным образом, выборка рискует быть нерепрезентативной. Например, если что-нибудь мешает нам отбирать их случайно. Представим, что нужно вытащить определенное количество шариков из мешка, но некоторые кусаются. В этом случае, сколько бы шариков мы ни взяли из мешка (даже если возьмем из мешка все шарики, которые не кусаются), выборка будет нерепрезентативной, поскольку в ней не будет ни одного из тех, что кусаются, – они просто минуют нашу выборку. Самая большая проблема с кусающимися шариками в том, что они могут отличаться от тех, которые идут к нам в руки, и отличаться как раз по тому признаку, который нас интересует. Такая ситуация называется систематической ошибкой отбора или выборки. То есть это уже не случайность, а некоторая закономерность, которая приводит к ошибке.
Так, например, произошло с Биобанком Великобритании – одной из крупнейших баз данных в мире. Из 9 млн человек, приглашенных принять участие в исследовании, откликнулись только 5,5 % (примерно 500 000 человек), и они разительно отличались от остального населения страны – вели более здоровый образ жизни, были образованнее и в целом имели меньше проблем со здоровьем. Результаты анализа подобных нерепрезентативных выборок могут быть ошибочными. Например, изначальный анализ взаимосвязи между потреблением алкоголя и смертностью от сердечно-сосудистых заболеваний в Биобанке Великобритании показал, что алкоголь даже полезен. Но после процедуры стратификации, которая привела показатели выборки в соответствие с показателями общего населения страны, оказалось, что никакой взаимосвязи нет [2].
Пример с Биобанком Великобритании указывает нам на одну простую, но неочевидную мысль: размер выборки не связан с ее репрезентативностью. Маленькая выборка неточна и все равно может быть репрезентативной. Угрожает репрезентативности выборки не количество участников, а то, насколько их характеристики отличаются от остальных людей, из которых эту выборку делали. Это разные проблемы, и у них разные способы решения. Нельзя решить одну из них путем решения другой. Если выборке не хватает репрезентативности, бесполезно ее увеличивать. Более того, последствия нерепрезентативности, а также ошибок на этапе планирования или сбора информации могут оказаться серьезнее в исследованиях с большой выборкой. Это еще одно проклятье больших данных.
Есть случаи, когда мы не беспокоимся о репрезентативности. Например, если материал, из которого отбираем образцы, является однородным, так что любой взятый образец хорошо его отражает. Лабораторный диагноз о состоянии нашего здоровья ставится по нескольким каплям крови. Эта процедура основана на предположении, что циркулирующая кровь всегда хорошо перемешана и одна капля рассказывает ту же историю, что и другая. Но когда материал далеко не однороден, как это часто бывает в исследованиях с участием людей, репрезентативность выборки имеет решающее значение.
2.2 Почему курение полезно в исследованиях
«Курение спасает от болезни Альцгеймера и не только», «10 удивительных преимуществ никотина», «От болезни Паркинсона спасает курение?» Несмотря на критику, такие открытия все еще часто появляются в интернете и в государственных СМИ, а также в медицинской литературе. И каждая статья приводит десятки ссылок на научные исследования, подтверждающие пользу курения. Например, что вероятность развития болезни Паркинсона, Альцгеймера и старческой деменции у некурящих в разы выше, чем у курильщиков.
Возможно ли, что курение полезно? Или дело в том, как исследования проводились?
Известно, что курение повышает риск развития деменции на 30 %, а болезни Альцгеймера – на 40 % [11]. И важно, что курение занимает третье по значимости место среди факторов риска, которые можно изменить. А значит, последствия ошибочных выводов о пользе курения становятся еще более значимыми.
Причина этих удивительных выводов о пользе курения заключается в нерепрезентативности выборки. Но, в отличие от примера с кофе, ситуация здесь гораздо сложнее. Профессор статистики Гарвардского университета Мигель Эрнан проанализировал результаты 12 исследований о связи курения и болезни Альцгеймера и 6 исследований о связи курения и деменции и нашел одну закономерность [8]. Исследования, где средний возраст участников был от 55 до 70 лет, подтверждали негативное влияние курения на развитие болезни Альцгеймера или деменции. Однако в исследованиях, где средний возраст участников превышал 75 лет, курение, наоборот, оказывало положительное влияние.
Как разница в возрасте участников повлияла на результаты исследований?
Известно, что каждый 4‐й курильщик не доживает до 65‐го дня рождения, и в среднем курящие живут на 13 лет меньше, чем некурящие [37]. Поэтому, когда мы сравниваем курящих и некурящих в возрасте 55–60 лет, вероятно, большинство курящих еще живы. Значит, группы для сравнения сбалансированы и действительно представляют реальность такой, как она есть.
Однако, когда мы сравниваем курящих и некурящих старше 75 лет, многие курильщики уже умерли или были тяжело больны, чтобы участвовать в исследовании. Значит, группа курильщиков представляет собой такую особую категорию выживших, которые в силу разных причин оказались здоровее других. У вас, наверное, тоже есть знакомые бабушки или дедушки, которые курили всю жизнь и жили счастливо до 100 лет? Всегда есть исключения из правил. Так и здесь. Эту группу курильщиков нельзя назвать типичной. И число заболевших болезнью Альцгеймера или деменцией среди них меньше, чем среди обычных курильщиков. Тогда как число заболевших болезнью Альцгеймера или деменцией в контрольной группе остается прежним. Именно такая асимметрия в группах создает иллюзию пользы курения.
Приведу вам конкретные цифры: Катцман набрал 434 человека в возрасте 75–85 лет [9]. Из них за время наблюдения болезнь Альцгеймера развилась у 32 человек, среди тех, кто не заболел болезнью Альцгеймера, было 11 % курящих, а среди тех, кто заболел, – 0 % курящих. Отсюда и вывод, что курение защищает от болезни Альцгеймера.
Ритц проанализировал 6868 участников Роттердамской когорты [10]. Наблюдение начали с 55 лет и наблюдали в среднем 7 лет. Среди 2445 некурящих участников исследования зарегистрировали 267 случаев болезни Альцгеймера, а среди 1568 курящих – 96 случаев. С поправкой на возраст и пол, курение увеличивало риск развития болезни Альцгеймера на 56 % (отношение рисков 1.56 (1.21–2.02)).
Сложно? Попробую объяснить на пальцах, точнее, на яблоках и грушах. Представьте, что в магазине вы взяли 20 груш и 20 яблок разных сортов, цветов и размеров. В среднем вес яблок и груш примерно одинаков, а может, груши весят немного больше. Но пока вы шли домой, в пакете с яблоками образовалась дырка и маленькие яблоки выпали – осталось только несколько крупных. Теперь, если кто-нибудь захочет сравнить средний размер оставшихся яблок и груш, может показаться, будто яблоки больше груш, но это только потому, что это оставшиеся яблоки. В исследовании Катцмана среди больных Альцгеймером в возрасте 75–85 лет не было курильщиков, возможно, потому, что многие из них просто не дожили до этого возраста или были слишком слабы и больны, чтобы принять участие в исследовании. А в исследовании Ритца с более репрезентативной возрастной группой и с поправкой на возраст и пол, курение действительно увеличивало риск болезни Альцгеймера.
Так в исследованиях возникает еще один вид систематической ошибки отбора, если участники одной группы умирают раньше, чем участники другой. Особенно часто такая ошибка закрадывается в исследования «плохих» факторов: курения, лишнего веса, высокого давления. Часто их называют парадоксом, как, например, «парадокс ожирения», но на самом деле никакого парадокса нет, есть нерепрезентативные выборки.
Практические рекомендации
Бывает приятно находить научные подтверждения, что некоторые наши заведомо не полезные привычки на самом деле полезны. Однако большинство подобных доказательств либо ошибочны, либо правдивы только для очень ограниченной группы людей. Обращайте внимание не только на исследования, доказывающие пользу вредных привычек, но и последующие объяснения подобных результатов и опровержения.
2.3 Ошибка больничных поступлений
Другой вариант систематической ошибки отбора возникает в исследованиях, проведенных в условиях больницы, – так называемая ошибка больничных поступлений, или парадокс Берксона, по имени статистика Джозефа Берксона, который впервые ее описал в 1946 году [31].
Немало исследований «случай – контроль» в медицине проводятся в больницах. Это удобно: за пациентами не нужно никуда ходить, у них уже есть обследования и диагнозы, что сокращает время и ресурсы на поиск и отбор участников. Но есть и минусы. Например, на госпитализацию влияют множество факторов, в том числе желание пациента, решение врача и показания к стационарному лечению согласно местным протоколам лечения и диагностики. Если пациент страдает от нескольких заболеваний сразу, то, вероятно, он чаще посещает врачей, а значит, имеет больше шансов пройти обследования и выявить состояние, требующее госпитализации. Кроме того, врачи более вероятно отправят на госпитализацию пациента с несколькими заболеваниями, чем с единичным. Таким образом, пациенты в больнице представляют собой особую категорию людей, среди которых распространенность заболеваний и факторов риска может отличаться от общего населения [32].
В 1979 году Дэвид Сакетт, канадский эпидемиолог, с которым мы познакомились в 3‐й главе, заметил, что распространенность заболеваний костей у населения составляет чуть более 7 %. А среди пациентов пульмонологического отделения – 25 % [15]. Предполагая, что заболевания легких каким-то образом связаны с заболеваниями костей, можно долго искать причины этого явления. Однако дело не в том, что заболевания легких и костей как-то связаны, а в том, что пациенты с сочетанием заболеваний легких и костей имели больше шансов попасть в больницу. Причина – в ошибке отбора.
Еще один пример, когда больничные исследования дали ложные результаты, – взаимосвязь между курением и остеоартрозом суставов. Как минимум 5 исследований из разных стран пришли к выводу, что курильщики реже страдают заболеваниями суставов, а именно остеоартрозом. Эту новость быстро подхватили фармацевтические компании и научно-исследовательские институты. Конечно, никто не собирался рекомендовать людям курить побольше, но отдельные компоненты никотина и табачного дыма можно было использовать для разработки новых лекарств от остеоартроза.
Неутешительный ответ пришел в 2011 году. По результатам метаанализа 48 исследований с участием более полумиллиона человек, курение снижало риск остеоартроза в среднем на 13 %, однако эффект был статистически значимым только в исследованиях типа «случай – контроль» с участием пациентов, набранных в больницах (35 % снижение риска), но не в исследованиях типа «случай – контроль» с участием пациентов из общего населения, а также в когортных и поперечных [16]. То есть вывод о том, что курение влияет на снижение риска заболеть остеоартрозом, обусловлен ошибкой отбора. Больничные выборки нерепрезентативны, а сравнения между отделениями – опасны. Относитесь внимательно к результатам подобных исследований.