А мне помогло. Как ориентироваться в море информации о здоровье и осознанно принимать решения — страница 25 из 45

Подтверждено клиническими испытаниями: море исследований

Будьте скептиком. Задавайте вопросы. Требуйте доказательств. Но когда у вас есть подтверждения, примите их.

Майкл Спектер, американский журналист, автор книги «Эпидемия отрицания. Как иррациональное мышление сдерживает научный прогресс, наносит вред планете и ставит под угрозу жизнь людей» [1]

Есть два способа быть обманутым. Один из них – верить в то, что не является правдой. Другой – отказаться верить в то, что есть правда.

Серен Кьеркегор, известный датский поэт и теолог, ставший отцом экзистенциализма [24]

Пациенты бывают разные.

Есть пациенты-минималисты, которые не любят лечиться, и их девиз – «чем меньше, тем лучше». Они скрупулезно изучают доступную информацию, от инструкции-вкладыша до информационного бюллетеня в коридоре больницы. А любое назначение подвергают сомнению и скептицизму:

– Доктор, а может, само рассосется?

Есть среди них и самые ярые минималисты: они отвергают любое лечение, только если дело не касается жизни и смерти.

Пациенты-максималисты всегда в поисках лучшего лечения, желая опередить болезнь и старость. Самое новое, самое сильное, самое дорогое – максималисты хотят все, сразу и побольше и легко соглашаются принимать назначения от врачей и не только врачей. А если не поможет, то легко меняют стратегию лечения.

Есть пациенты-натуралисты, которые хотят лечиться, но только натуральными препаратами, а не «пичкать свой организм всякой химией». Ведь «природа умна, и наше тело лучше знает, как справиться с болезнью».

Есть пациенты-борцы, которые делят медицину на традиционную и нетрадиционную, западную и восточную, больничную и народную и рыцарски сражаются за свое право быть со своей любимой.

В реальности большинство находятся где-то посередине – да и истина, вероятно, тоже. У каждого направления есть свои плюсы и минусы. И на самом деле не так важно, какой стратегии вы придерживаетесь. Важно, чтобы выбранное лечение помогало. Ведь именно для этого вы соглашаетесь на него. Будь то операция, лекарство или травяной чай, мы хотим решить с их помощью какую-то проблему со здоровьем.

В этой книге мы знакомились с разными видами исследований и сравнивали их между собой. Теперь подведем итог и разберем, как эти знания можно применить в обычной жизни. Мы вспомним частые стереотипы, которые нам могут мешать объективно оценивать информацию, затем поговорим, почему исследований плохого качества не становится меньше, а также о том, как оценивается надежность или качество научных исследований, что делать, если исследования противоречат друг другу, а также на какие еще показатели, кроме качества доказательств, мы обращаем внимание при принятии решения. А в заключительном параграфе главы обсудим случаи, когда наши решения могут выходить за пределы доказательной медицины.

§ 1. Научно доказано: что написано пером, не вырубишь топором

Слепцы, числом их было пять,

В Бомбей явились изучать

Индийского слона —

так начинается знаменитая древнеиндийская притча про слепых ученых и слона в переводе Самуила Маршака «Ученый спор».

Ученые, которые никогда не видели слона, ощупывая разные его части, спорят, чем или кем это могло бы быть, и не могут прийти к единому мнению. Когда вы заходите в интернет и видите противоречивую и конфликтную информацию о здоровье, то легко можете почувствовать себя слепцом, не знающим, слон перед ним или змея.

И первой рекомендацией будет – проверить надежность источника.

1.1 Новости под научным соусом: Парацетамол и аутизм

Недавно коллега врач-педиатр поделилась со мной одним постом другого врача-педиатра: «ПАРАЦЕТАМОЛ ПРИВОДИТ К АУТИЗМУ! Увы… Астма, эндокринные нарушения, поллиноз, экзема, СДВГ, аутизм – это частые последствия применения парацетамола». Стиль автора в цитате сохранен.

Парацетамол, который мы все знаем, любим, – и вдруг такое! Давайте разбираться. А начнем с аргументов автора этого поста.

Первый из них – ссылка на исследование в PubMed.

Читаем исследование: «Мы показали, что нынешний рост случаев аутизма начался в 1980 году в США, то есть в том же году, когда CDC отказался от использования аспирина у детей и одобрил парацетамол» [2].

Ссылка на исследование, да еще опубликованное в Pubmed, – хорошее доказательство. Не так ли? Наличие ссылок на первоисточники – это, несомненно, плюс, так как дает возможность проверить истинность цитат и фактов. Но из 4‐й главы мы помним, что ни ссылки на Pubmed или любую другую базу журналов – Scopus, Uptodate, MEDLINE, и журналы, в них входящие, ни цитаты из научных статей – сами по себе не являются научными доказательствами. Поэтому важно не просто искать ссылки в тексте, а переходить по ним и смотреть, что написано в первоисточнике.

Когда я перешла по ссылке в PubMed, я действительно нашла научную статью о связи между парацетамолом и аутизмом, опубликованную в 2016 году в журнале Autism Open Access. Речь шла об относительно небольшом (чуть более 300 детей) исследовании типа «случай – контроль», где сравнивали прием различных лекарств, в том числе безрецептурных, у детей с расстройствами аутического спектра и с контрольной группой. А результаты на самом деле показали, что дети с аутизмом гораздо реже принимают парацетамол, чем дети без аутизма (!). И все. Причин тому может быть много, их изучение не было целью исследования, и с имеющимися данными ответить на этот вопрос не было шанса. Тем не менее авторы переиграли в свою пользу и высказали предположение, что причиной разницы между группами была неэффективность парацетамола у детей с аутизмом, поэтому они предпочли ибупрофен. А такую гипотезу еще нужно доказать.

Выводы в статье должны логично вытекать из представленных фактических доказательств – результатов исследования. Все предположения и гипотезы автора, не подтвержденные доказательствами, – это субъективное мнение.

Простыми словами выглядит это примерно так: мы захотели узнать, действительно ли употребление в пищу котлет приводит к лишнему весу. Для этого сравнили тех, у кого лишний вес есть, и тех, у кого его нет. Оказалось, люди с лишним весом едят котлеты реже, чем люди с нормальным весом. Отсюда делаем вывод: котлеты приводят к ожирению, поскольку на самом деле люди с лишним весом не едят котлет, ведь из-за них у них появляется лишний вес. Вам не кажется это абсурдным?

Но даже не это здесь главное. Цитата из поста: «Мы показали, что нынешний рост случаев аутизма начался в 1980 году в США, то есть в том же году, когда CDC отказался от использования аспирина у детей и одобрил парацетамол» – вообще не относится к результатам проведенного исследования, а встречается в тексте введения, где в ряде других аргументов авторы приводят выводы своего предыдущего исследования.

Снова переходим по ссылке – статья 2010 года, тоже в PubMed. Но это не научное исследование, а обзор, где авторы делятся мыслями и гипотезами, вот только не приводят доказательств, подтвержденных научными исследованиями. Этот аргумент абсолютно не имеет под собой основания.

Типы научных статей.

1. Научные статьи, в которых представляются результаты научных исследований, обычно помечают отметкой «Оригинальные исследования» (в англ. original research). При этом научные результаты могут быть опубликованы в виде полнотекстовой статьи (с англ. full text) или в виде короткого доклада (c англ. research letter, short report), который также включает методы и результаты исследования, но в более краткой версии. К оригинальным научным исследования также относятся систематические обзоры и метаанализы.

2. Не относятся к научным исследованиям, а значит, подвержены субъективной оценке, следующие типы статей.

a. Описания клинических случаев индивидуальных пациентов (case report).

b. Обзор литературы.

c. Комментарии.

d. Письмо в редакцию.

История с постом про связь между парацетамолом и аутизмом еще раз напоминает нам, как важно находить ссылки на первоисточники и смотреть, что в них написано, когда сталкиваетесь с новой информацией. Цитата про аутизм и парацетамол действительно была в статье, и спасибо автору за ссылку, однако это утверждение не имело под собой никакой научной основы. А ее использование можно назвать «полуправдой», которая использовалась с целью манипуляции.

Ведь для многих наука сама по себе, а также все отсылки на научные исследования и доказательства обладают определенным авторитетом и показателем надежности информации.

С одной стороны – вполне заслуженно, ведь правильно спланированные исследования действительно позволяют нам бороться с искаженным пониманием реальности и приблизиться к истине. С другой – сам факт проведения научного исследования не гарантирует истины.

Если 10–20 лет назад дезинформация носила другой характер, когда заведомо ложная информация давалась без ссылок и источников, и уже так легко было ее опознать. Сейчас все гораздо сложнее. Фраза «научно доказано» все чаще встречается в речи экспертов и специалистов, но не всегда является гарантией надежности приводимых аргументов.

Важно находить первоисточники, чтобы убедиться, что ссылка ведет непосредственно на результаты научного исследования, а не субъективное экспертное мнение, а также для оценки качества исследования и надежности доказательств (размер выборки, дизайн, репрезентативность, учитывались ли дополнительные факторы, которые могут повлиять на результат) и подтверждают ли полученные результаты выводы и их интерпретацию.

Отсюда вытекает вторая рекомендация – проверить качество или надежность научных доказательств.

1.2 Качество научных исследований

Если говорить о качестве или надежности результатов, полученных в тех или иных научных исследованиях, важно оценивать все стадии научного процесса от гипотезы до конечных выводов. Ведь на каждой можно допустить ошибки, которые потом влияют на надежность результатов.

• Формирование гипотезы: определить медицинскую проблему и возможные пути ее решения.

• Цель исследования: ассоциация или причинность, эффективность и безопасность.

• Дизайн исследования:

º проспективный или ретроспективный дизайн;

º случай – контроль или когортное исследование, клиническое испытание;

º выбор контрольной группы сравнения.

• Выбор изучаемой популяции:

º репрезентативность и размер выборки.

• Методы изучения исходов и факторов риска:

º выбор исходов для изучения или конечных точек (мягкие, твердые или жесткие, суррогатные).

• Сбор данных.

• Анализ данных:

º влияние третьей переменной.

• Интерпретация результатов исследования.

Со многими критериями оценки вы уже знакомы из предыдущих глав. Каждый из этапов связан друг с другом, но начинается все с постановки гипотезы и цели. Каждой цели соответствует определенный дизайн исследования, который помогает ответить на вопрос с большей надежностью. Для изучения причинности – это проспективные или когортные исследования, для оценки эффективности – рандомизированные клинические испытания. Однако это не значит, что нельзя использовать другие дизайны с меньшей надежностью результатов (как правило, так и происходит в процессе изучения того или иного вопроса).

Именно дизайн исследования является ключевой характеристикой, на которую опирается иерархия доказательств, или пирамида доказательств. Впервые о ней заговорил Кокрейн в конце 1970‐х годов. Впоследствии эта система усложнялась и совершенствовалась, и в современной градации, предложенной Оксфордским центром доказательной медицины, есть 5 ступеней, или уровней доказательств: от наименее надежных к наиболее надежным [7].


Рисунок 29. Уровни убедительности доказательств по типам исследований. [19]


Принцип прост – чем строже и объективнее методика исследования, тем более надежны результаты. Поэтому на самой нижней ступени расположилось экспертное мнение, основанное на личном опыте или сложившейся практике. С него начинаются самые смелые гипотезы и прорывные открытия, но если экспертное мнение не подтверждается никакими доказательствами, велика опасность ошибок. Из-за стереотипов, эвристик, эмоций, внешней похожести взаимосвязи с причинностью, часто отсутствием надлежащей группы сравнения.

На следующей ступени расположились исследования серии случаев, которые считаются немного надежнее не подтвержденного клиническими исследованиями экспертного мнения. Обычно в таких небольших наблюдениях изучаются взаимосвязи и паттерны среди небольшой группы участников либо сравниваются результаты до и после. Недостаток таких исследований – отсутствие группы сравнения и относительно маленькие размеры выборки. Бывает, серия случаев может даже оказаться собранием ошибок выжившего. Поэтому, чтобы избежать вероятности получения результатов по чистой случайности, нужно не одно. или два, или 10, а достаточное количество наблюдений. Для многих лекарственных препаратов и процедур эффект может различаться между пациентами. Достаточная выборка способна уловить этот спектр и дать усредненное значение, на которое потом можно ориентироваться.

Далее – исследования «случай – контроль». Сравнение двух групп уже добавляет результатам надежности, поэтому часто научные исследования начинают именно с этой ступени. К тому же провести их можно легко и быстро. Один из главных недостатков этих исследований – возможность ошибки отбора (предвзятость при отборе пациентов с исходом и без) и преимущественный ретроспективный набор материала, когда мы не можем точно оценить степень воздействия, а значит, мы не может с уверенностью сказать, что появилось первым: яйцо или курица. Исследование «случай – контроль» лучше серии случаев, но хуже когортного исследования.

Чтобы найти реальный эффект, наиболее близкий к правде, нам важно наблюдать за тем, как разворачиваются события во времени. Если хотим узнать, что является причиной болезни, то наблюдения нужно начинать задолго до появления болезни. Для этого проводят когортные исследования, когда за пациентами наблюдают в течение определенного времени.

Следующую ступень занимают рандомизированные контролируемые испытания. Если хотим узнать эффект лекарственного средства, мы должны также начать наблюдение до начала приема лекарства. Но не просто сравнивать до и после, а с правильно подобранной группой сравнения, при этом отбор в группы проводят путем рандомизации. Еще важно, чтобы участники исследования были похожи на тех пациентов, которых увидит врач в своей клинике.

И отдельное место в пирамиде доказательности занимают систематические обзоры и метаанализы, которые распределяются по 3 уровням: уровень 3a – метаанализ исследований «случай – контроль» (3b – отдельные исследования «случай – контроль»), 2a – метаанализ когортных исследований (2b – отдельные когортные исследования, 1a, то есть самая верхушка пирамиды – метаанализы РКИ (1b – отдельные РКИ).

В прошлых главах я не раз ссылалась на результаты метаанализов, но мы подробно не останавливались, как они проводятся и почему считаются надежнее, чем отдельные даже и не единичные исследования. Сейчас пришло время. Поговорим о них поподробнее.

1.3 Систематические обзоры и метаанализы

Итак, что такое «систематический обзор» и чем он отличается от обычного обзора литературы?

Систематический обзор, по сути, означает обзор литературы, который проводится с использованием специальной методологии или системы, включающей четко регламентированные критерии поиска источников, отбора и проверки результатов исследования. Важное отличие систематического обзора заключается в том, что он охватывает все имеющиеся исследования по данной теме с целью избежания предвзятости. Тогда как обычный литературный обзор часто включает лишь некоторые исследования по теме, отобранные автором статьи, что может привести к выборочному цитированию и субъективной интерпретации результатов.

Сравним обычный и систематический поиск на примере из обычной жизни. Представьте, что оказались на улице с разными торговыми лавочками в какой-то экзотической стране и хотите купить на память традиционный головной убор или наряд. Но вы даже не представляете, сколько он может стоить. Вы подходите к одному продавцу, может самому громкому или, наоборот, к первому попавшемуся. Потом заглядываете в соседнюю лавочку, проходите немного дальше, сворачиваете с главной туристической улицы в закоулок и заходите в еще один магазин, вокруг которого толпятся местные. Из своих наблюдений делаете вывод пределов стоимости традиционного наряда в этой стране. Наверное, вы уже догадались: подобный подход не может дать вам репрезентативную выборку, и выводы, сделанные на ее основе, довольно субъективны. Что не сказать о маркетинговом исследовании, которое заглянуло в каждую торговую лавочку города, продающую подобные наряды. Так же с литературными обзорами. Объективность обычного литературного обзора зависит от того, насколько тщательную работу провели авторы.

Кокрановское сотрудничество (Cochrane Collaboration) – одно из самых известных научных сообществ, которое проводит систематические обзоры.

Метаанализ представляет собой особый вид статистического анализа, который может объединить цифры, полученные в отдельных исследованиях, например из систематического обзора, и вывести общий количественный результат так, словно он получен из единого исследования. Метаанализы – наши главные помощники, когда нужно быстро найти ответ на вопрос, если по теме проведено множество исследований.

Отсюда вытекает третья рекомендация – ищите метаанализы по изучаемой теме.

Объем медицинской информации огромен и постоянно растет. Даже практикующему врачу в лучшем случае можно уследить только за своей узкой специальностью и часто встречающимися в его практике вопросами. А для остальных тем более. Поэтому, вбивая в поисковик ваш вопрос, обязательно попробуйте найти, есть ли метаанализ по этой теме. Например (я привожу примеры поисковых запросов на английском, так как подавляющее большинство научных исследований, в том числе метаанализов, публикуется на английском языке):

• The effectiveness of aromatherapy meta-analysis / Метаанализ эффективности ароматерапии;

• Safety of oral contraceptives meta-analysis / Метаанализ безопасности оральных контрацептивов.

Но, как и у других исследований, у метаанализов есть недостатки. Если в быту мы иногда говорим, что можно сделать конфетку из чего-то непригодного, в научных кругах мнение более непреклонное: «из мусора можно только сделать мусор» (с англ. Garbage in, garbage out). Из неправильно собранных и анализируемых данных можно получить лишь некачественное исследование. Несмотря на то что метаанализ считается самым надежным методом исследования, его надежность определяется надежностью вошедших в него исследований. Например, вернемся к метаанализу 40 исследований о пользе добавок Омега‐3 для сердечно-сосудистой системы, о которых говорили в прошлой главе. Туда вошли и открытые исследования, и исследования без плацебо-контроля, а еще в 9 из них вообще не изучались заболевания сердечно-сосудистой системы. То есть и результат метаанализа, полученный путем обобщения низкокачественных исследований, не может считаться надежным.

Много не значит хорошо. Давайте посмотрим не нескольких примерах, когда много исследований все-таки может служить показателем надежности, а когда нет.

1.4 «Эффективность доказана множеством научных исследований»

А если исследований и ссылок много? Может ли количество проведенных исследований быть показателем надежности?

В 6-й главе мы говорили, что воспроизводимость результатов исследований, когда они подтверждаются в других аналогичных исследованиях, – один из принципов научного метода. Психологически количество экспертных сообщений и научных исследований по теме тоже часто воспринимается как подтверждение надежности. Но так происходит не всегда.

Вернемся к нашей истории с питьевым йогуртом «Актимель». Мы говорили о нем в прошлой главе, чтобы понять, как на упаковках БАДов и пищевых продуктов появляются заявления об их пользе для здоровья. Но «Актимель» также является хорошим примером, когда количество проведенных научных исследований не становится подтверждением надежности, качества или пользы объекта исследования.

В 2009 году, когда высказывания о пользе продукта для здоровья детей и пожилых людей были запрещены в Англии, компания утверждала, что эффективность «Актимель» научно доказана в 24 исследованиях. Когда я готовила материал для книги в 2021 году, официальная страничка компании уже ссылалась на 28 научных исследований. Однако, как и в примере с парацетамолом, важно найти первоисточники и посмотреть, что там проводили и что нашли на самом деле.

Например, если взглянуть внимательнее на доказательства пользы для детей, то только восемь исследований были проведены на детях в возрасте до 16 лет, два из них – на госпитализированных детях в Индии, страдавших острой диареей или принимавших лекарства от гастрита. Эти два исследования, однозначно, не могут быть применены к здоровым детям или молодежи. Два других испытания касались только маленьких детей, так как средний возраст в каждой из исследуемых групп – 6 месяцев и 15,5 месяца – был слишком мал, чтобы применять их к детям школьного возраста. А польза именно в этой возрастной группе как раз подразумевалась рекламой. В других исследования с участием детей-астматиков, детей с аллергическим ринитом и диареей польза не была доказана. А в исследованиях с участием детей в поликлиниках США и России обнаружили слишком незначительное снижение заболеваемости инфекционными заболеваниями при употреблении «Актимеля» по сравнению с контролем. Отсутствие доказательств эффективности у здоровых людей подтверждает и систематический обзор 2016 года [26]. Профессор Джереми Николсон, заведующий отделением хирургии и рака Имперского колледжа Лондона, так высказался о продукте: «Чтобы конкурировать с количеством бактерий в кишечнике, вам нужно принять 50 000 доз [ «Актимеля»] в день».

Если исследований много, но они маленькие, с участниками, не похожими на вас, с конечными точками, нас не интересующими, а тем более с результатами, которые не доказывают пользы, их нельзя считать надежными аргументами. В этом случае много не значит хорошо и порой может ввести нас в заблуждение.

Если мы не очень разбираемся в какой-то медицинской теме и считаем любую научную информацию сложной для понимания, то, вполне вероятно, нас убедит наличие большого количества доказательств и ссылок на научные статьи, какими бы слабыми они ни были. Почему так происходит, хорошо объясняет одна классическая теория в психологии под названием «Модель вероятности тщательной проработки информации».

В одном исследовании, проведенном еще в 1984 году [3], ученые сравнили, как количество аргументов влияет на выводы читателей в зависимости от их вовлеченности. 46 студентам раздали листовки с информацией об увеличении оплаты обучения в их собственном или в каком-то отдаленном университете. Каждая листовка содержала либо 3 слабых аргумента (например, что на собранные деньги университет закупит новые доски, которые будут производить хорошее впечатление на посетителей кампуса), либо 3 сильных аргумента (например, что частично собранные деньги потратят на то, чтобы уменьшить число студентов в группе, что улучшит качество обучения), либо все 6. После студентам предложили оценить, насколько вероятно они согласятся на увеличение оплаты. Как думаете, какие аргументы убедили студентов?

Если предположить, что они внимательно прочитали написанное и смогли оценить качество аргументов, то разницы между 3 сильными и 6 разными аргументами (3 сильными + 3 слабыми) быть не должно. Так и было, когда дело касалось их собственного университета. Тема оплаты всегда вызывает вовлеченность, и студенты внимательно прочитали листовки, и дополнительные слабые аргументы не увеличили вероятность согласиться на увеличение оплаты. Тем не менее, когда дело касалось какого-то другого университета, 6 аргументов показались более убедительными, чем 3 сильных.

Профессор психологии Ричард Петти, руководивший исследованием, а после посвятивший всю карьеру изучению установок, убеждений и поведения людей, сделал следующий вывод. Существуют два принципиально различных типа убеждения. Первый, прямой, или центральный, основывается на логической аргументации и систематическом анализе информации и включается, когда мы изучаем важные для нас вопросы, которые непосредственно нас касаются. В таких случаях мы способны распознать сильные и слабые аргументы и сделать логический вывод. Второй тип, косвенный, или периферический, включается, когда изучаемый вопрос либо для нас не очень важен, либо оказывается сложным для нас и выходит за пределы наших знаний и способностей. В таком случае вместо вдумчивого анализа информации мы полагаемся на дополнительные убеждающие факторы, такие как авторитет эксперта, количество аргументов, способ подачи сообщения, эмоциональный окрас и даже обстановка, в которой мы получаем информацию, например во время приятного обеда или в компании друзей.

Именно поэтому студенты смогли правильно оценить сообщения про увеличение оплаты в собственном университете, но ошибочно полагались на количество аргументов, когда речь шла о другом университете, что непосредственно их не касалось. Точно так же на восприятие сообщения про аутизм и парацетамол, о котором мы говорили ранее, могли повлиять разные факторы. Во-первых, говорил эксперт, врач. Во-вторых, он ссылался на научные доказательства. В-третьих, сообщения о рисках, связанных с лечением, всегда затрагивают наши эмоции, и мы склонны реагировать на них без раздумий.

Поэтому важно научиться вовремя распознавать, почему вы верите сказанному. И это будет четвертой рекомендацией в этой главе. Полагаетесь ли вы на объективные факты или на авторитет специалиста? Вам страшно, поскольку действительно высока вероятность осложнений или потому что кто-то пытается вас запугать?

Однако вас теперь так просто не провести, после прочтения книги вы сможете проводить свои маленькие аналитические расследования различных аргументов.

1.5 И все же, когда много исследований – это хорошо?

Например, если исследования приходят к одному выводу, это всегда звучит и выглядит убедительно. Чем больше исследований приходят к одному и тому же выводу, тем лучше. Например, только 1 из 24 рандомизированных испытаний, проведенных на обычных жителях, подтвердили эффективность витамина С при простуде. Поэтому его эффективность представляется весьма сомнительной.

Помните историю Ричарда Долла и Остина Брадфорда? В течение всего нескольких лет после первых шокирующих результатов провели 19 подобных исследований типа «случай – контроль». Результат оказался одинаков – рак легких чаще встречается среди курильщиков. Казалось бы, можно радоваться и считать вопрос закрытым, но есть одно важное замечание. Если все эти исследования смотрели на проблему под одним углом, значит, они все могут быть либо одинаково правы, либо одинаково неправы. Это одно из важных и правомерных замечаний, полученных Доллом и Хиллом, что сподвигло их продолжить исследования и доказать связь между курением и раком легких уже в когортном исследовании, когда наблюдение за курильщиками и некурильщиками началось задолго до появления симптомов заболевания. А позднее провели эксперименты, когда оценивался эффект отказа от курения на снижение риска рака легких в будущем.

Поэтому количество проведенных исследований, которые пришли к одинаковому результату, не всегда является критерием надежности. Бывает, несколько или даже множество исследований приходят к одному и тому же результату, только неправильному. Например, все проведенные исследования изначально неправильно спланированы и пропустили важный фактор, о котором еще не было известно. Как, например, уровень образованности матери в исследовании с зефирками из 6-й главы. Может случиться так, что все исследования публикуются в небольших журналах учеными с сомнительной репутацией, и эти случаи представляют собой тщательно подобранные редкие исключения, не отражающие действительность для большинства других людей.

В моей научной работе я тоже встречалась с такими исследованиями. В середине 2010‐х годов одной из «горячих» для изучения тем являлось положительное влияние статинов при болях в коленных суставах у пожилых людей. Ранее в книге мы говорили, что у нас нет проверенных и надежных лекарств, способных остановить разрушение хряща при остеоартрите. И вдруг одно за другим стали появляться исследования, доказывающие снижение интенсивности боли в суставах при приеме статинов, а также снижение частоты операций по замене сустава. В команде с биостатистиками и эпидемиологами мы внимательно изучили все предшествующие исследования, проанализировали их недостатки и приложили огромные усилия, чтобы избежать возможных искажений и систематических ошибок. В течение года я проанализировала более 17 млн медицинских записей в базе данных Великобритании. Вывод был неутешителен: статины не оказывают никакого эффекта при остеоартрите, а все положительные результаты предыдущих исследований были следствием ошибок в планировании [25]. После публикации результатов исследования в этом направлении прекратились, и вопрос был закрыт, поэтому вы нигде не увидите, что врач назначает статины при болях в суставе.

Возможно, в этот момент вы чувствуете возмущение: как это возможно, что ученые постоянно ошибаются? Или даже разочарование и недоверие к любым научным исследованиям – если ученые постоянно ошибаются, можно ли им вообще верить? И я вас понимаю. Но прошу не торопиться с выводами. В следующем параграфе главы мы поговорим об эволюции научных исследований и какое место в этом процессе занимают те самые некачественные и ненадежные исследования.

§ 2. Как понимание научного прогресса поможет нам в интерпретации доказательств