А мне помогло. Как ориентироваться в море информации о здоровье и осознанно принимать решения — страница 18 из 45

3.1 Зефирный тест

Представьте себя маленьким ребенком, которому дядя-профессор протягивает зефирку на тарелочке. Можно съесть зефирку сразу, но если подождете 15 минут – получите вторую и съедите обе.

Смогли бы дождаться второй зефирки или соблазн слишком велик для ребенка? В каком возрасте вообще у детей появляются самоконтроль и способность отложить удовольствие? Чтобы ответить на эти вопросы, профессор Стэнфордского университета Уолтер Мишел в 1960‐х годах провел серию исследований с участием 653 детей в возрасте 4–6 лет, которые сейчас больше известны как «зефирный тест» [18].

Результаты сами по себе не были удивительны. Детям было сложно контролировать себя и не поддаваться искушению. Только треть получила второе лакомство, а большинство сдались меньше чем через минуту. Гораздо интереснее оказались последующие выводы.

Примерно через 10 лет ученые заинтересовались дальнейшим развитием детей, принявших участие в эксперименте [6]. Оказалось, чем дольше дети могли подождать угощение, тем лучше были их результаты в будущем по многим параметрам. Например, в школьном возрасте они лучше себя контролировали в стрессовых ситуациях, были внимательнее к деталям, лучше концентрировались на заданиях, меньше отвлекались и получали хорошие результаты на вступительных экзаменах. На этом исследование не закончилось. Те, кто дошкольниками демонстрировали наибольшую выдержку в ходе «зефирного теста», в возрасте 27–32 лет имели оптимальный индекс массы тела, эффективнее добивались своих целей и лучше справлялись со стрессом. Исследование головного мозга тех, кто в детстве мог подождать, и тех, кто этого делать не мог, показало различия в областях префронтальной коры, отвечающих за склонность к пагубным привычкам и ожирению.

Вывод был очевиден. Умение подождать и отложить сиюминутное удовольствие – залог успешной жизни. Результаты «зефирного теста» до сих пор цитируются психологами и бизнес-коучами. Но мы с вами уже убедились, что не стоит торопиться с выводами на основании одного исследования. Как мы уже говорили в начале главы, воспроизводимость или репликация результатов – важный элемент научного прогресса. При этом важно не только то, что разные ученые приходят к одним и тем же выводам, но и то, что каждое последующее исследование учитывает недостатки предыдущих исследований и приближает нас к истине.

Так, группа ученых из Нью-Йоркского и Калифорнийского университетов в 2018 году решила воспроизвести «зефирный тест», но уже на большей выборке и с учетом дополнительных факторов [7]. Оказалось, что успех в жизни зависит совсем не от способности дождаться второй зефирки. Снова результаты последующих исследований опровергают первые. Чем отличались эти исследования?

Во-первых, размером выборки. В оригинальном исследовании участвовало более 600 детей, что нельзя назвать маленькой выборкой. Но последующие опросы проводились с гораздо меньшим количеством участников, в общей сложности 185 детей, а, например, результаты вступительных экзаменов получили всего для 90 детей. Исследование же 2018 года проанализировало 918 детей, которые прошли «зефирный тест» в возрасте 4‐х с половиной лет и последующие тесты в возрасте 15 лет.

Вторым отличием была репрезентативность выборки, о которой мы уже говорили в этой главе. Исследование Уолтера Мишела проводилось среди детей, посещавших детский сад при Университете Стэнфорда. Конечно, не все родители были профессорами, но все же этнические и культурные характеристики сотрудников крупного университета, особенно в США в 60‐е годы, отличались от среднестатистического населения страны. Семьи, которые приняли участие в более позднем исследовании, были более разнородными, а также набирались в 10 городах в разных частях США. Эта выборка хорошо представляла население страны, где в среднем каждая третья мама не работала, только каждая четвертая имела высшее образование и только две из трех семей были полными.

Кроме того, в исследовании профессора Уолтера Мишела был еще один недостаток. Большая часть результатов была получена с помощью корреляционного анализа. Ранее мы говорили, что корреляция представляет собой особый вид связи между двумя параметрами, при котором увеличение одного параметра связано с увеличением или уменьшением другого. И именно в этом кроется проблема. Сложно представить, что успех в жизни может быть обусловлен одним фактором. Так же как и как и большинство других событий, включая болезни. Поэтому, когда мы изучаем связь между двумя явлениями, не принимая во внимание другие факторы, которые могли на них повлиять, ошибки неизбежны.

3.2 Вместе не значит связаны

Любая взаимосвязь, в том числе корреляция, может быть ошибочной как минимум по двум причинам. Во-первых, научные исследования ошибаются, когда видимая связь между явлениями – это простое совпадение или случайность. Чтобы уменьшить влияние случайности на результаты, нужны достаточное количество наблюдений и репрезентативная выборка. Об этом мы поговорили в начале главы.

Вторая причина ошибочных результатов – влияние факторов, которые не приняли во внимание в исследовании. В таких случаях видимая взаимосвязь между явлениями существует не потому, что одно является причиной, а другое – следствием, а потому, что оба явления – следствие какого-то третьего признака.

В статистике такие признаки, которые связаны с двумя явлениями и, таким образом, приводят к ложной взаимосвязи между ними, называют спутывающей переменной, или конфаундером, от англ. confound – путать, сбивать с толку.

Классический пример – взаимосвязь между продажами мороженого и числом погибших на воде. Чем больше в летний день продается мороженого, тем больше погибает людей. Можно, конечно, подумать, что мороженое является причиной утопления. А если присмотреться, то обязательно обнаружим, что одновременно изменяются два не связанных друг с другом показателя. Нельзя сказать, что один из фактов – причина второго. Третий фактор, на самом деле влияющий на оба факта, – это повышение летом температуры воздуха. В жаркий день больше людей покупает мороженое и больше людей идет купаться на речку, и, соответственно, больше людей рискует утонуть. Так же и видимая корреляция между ростом травматизма и автомобильных аварий является следствием общей причины – гололедицы.

Чтобы полностью устранить влияние третьего фактора, или общей причины, нужно изначально правильно планировать исследование. Например, сразу оценивать связь между гололедицей и автомобильными авариями или обращениями в травмпункт. Для этого нужны проспективные исследования.

Конечно, это не всегда возможно. Особенно в ранних исследованиях, которые, как первопроходцы, буквально на ощупь идут вперед. Или когда наличие общей причины на первый взгляд неочевидно, как в случае с «зефирным тестом». В таких случаях ученые могут уменьшить влияние третьего фактора во время статистического анализа. Например, разделив группы или используя специальные статистические модели, которые позволяют оценить совместное влияние нескольких факторов или сделать поправку на некоторый фактор.

Именно так и поступила группа ученых из Нью-Йоркского и Калифорнийского университетов. В исследовании 2018 года взаимосвязь между результатами «зефирного теста» и будущими успехами изучали в двух группах по отдельности – детей, чьи матери имели высшее образование, и детей, чьи матери высшего образования не имели. Оказалось, в первой группе в долгосрочной перспективе не было особой разницы, смог ли ребенок дождаться второй зефирки или нет. Среди детей матерей без высшего образования на первый взгляд те, кто смог выждать, имели немного лучшие показатели, чем те, кто поддался искушению. Но как только ученые учли влияние других факторов, таких как этническая принадлежность, доход семьи и домашняя обстановка (например, количество книг, которые исследователи наблюдали дома, и то, насколько матери реагировали на детей в присутствии исследователей), разница оказалась минимальной.

Вместо того чтобы показать, что умение подождать и отложить удовольствие способно дать плоды в будущем, это исследование продемонстрировало, что данная способность на самом деле обусловлена социальным и экономическим положением семьи, которое, в свою очередь, сильно влияет на будущие успехи.

Дети из более бедных семей не были столь воодушевлены просьбой подождать в обмен на вторую зефирку. В их жизни было меньше гарантий и больше неопределенностей. Сегодня в доме есть еда, завтра ее может не быть, поэтому ожидание всегда сопряжено с риском упустить то, что есть сейчас. Иными словами, возможность получить вторую зефирку кажется неважной, когда у ребенка есть основания полагать, что первая может исчезнуть. Зато дети из семей с более образованными и финансово благополучными родителями могли себе позволить подождать. Их опыт подсказывал: у взрослых есть ресурсы, чтобы дома всегда была еда, они могут рассчитывать, что вторая зефирка их обязательно дождется, а родители не обманывают.

Именно это подтверждают результаты другого исследования из Университета Рочестера, который тоже повторяет эксперимент с зефиром, но с важным отличием [19]. Прежде чем предложить зефир, исследователи разделили детей на две группы. Первая подверглась ряду событий, которые заставили детей сомневаться. Например, исследователь дала ребенку маленькую коробку мелков и пообещала принести большую, но так и не принесла. Или маленькую наклейку и пообещала принести набор получше, но не принесла. Между тем вторая группа удостоверилась в надежности обещаний исследователей. Им обещали лучшие мелки – они их получили. Им сказали, что принесут наклейки получше, – так и сделали.

Можете представить, как эти события повлияли на зефирный тест? У детей из ненадежной группы не было оснований полагать, что исследователи принесут второй зефир, поэтому они не стали долго ждать, чтобы съесть первый. Тем временем дети из второй группы тренировали мозг воспринимать отсроченное удовлетворение как положительное явление. Каждый раз, когда исследователь давал обещание, а затем выполнял его, мозг ребенка регистрировал две вещи: 1) ожидание вознаграждения того стоит и 2) я способен ждать. В результате вторая группа ждала в среднем в четыре раза дольше, чем первая.

То есть способность ребенка откладывать удовлетворение и проявлять самоконтроль – не предопределенная черта, а скорее находится под влиянием опыта и условий, которые его окружали. Воздействие среды было почти мгновенным. Всего нескольких минут достоверных или ненадежных переживаний достаточно, чтобы подтолкнуть действия каждого ребенка в ту или иную сторону.

3.3 Конфаундеры в различных исследованиях

Различия в возрасте, социально-экономическом положении, занятии спортом и физическими упражнениями, способах борьбы со стрессом могут оказать влияние на любой изучаемый показатель здоровья. Люди, выбирающие курить, отличаются от некурильщиков – они могут иметь и другие вредные привычки, быть склонными к рискованным действиям, заниматься физическим трудом. Так и вегетарианцы и мясоеды отличаются не только отношением к мясу. Например, люди, сознательно отказывающиеся от употребления мяса, могут быть более привержены здоровому образу жизни, более физически активными и уделять больше времени здоровью.

Приведу еще пример, как влияние третьего фактора может запутать даже генетические исследования – чтобы вы понимали, что любое исследование требует тщательного изучения и принятия во внимание всех факторов, которые могут оказать влияние на результат.

Итак, в одном исследовании ученые из Бристоля анализировали, какие гены отвечают за интеллект ребенка, а именно за то, как успешно он сдаст школьные и вступительные экзамены. Данные для анализа взяли в когорте детей, рожденных в Бристоле в 90‐х, за которыми наблюдали от рождения до 30‐летия. Немногим больше 7500 детей. Результаты удивили всех. Оказалось, гены, которые были, как казалось, связаны с успехами в учебе, отвечают не за величину мозга, хорошую память или беглость чтения, а за то, были родители местными, из Бристоля, или приезжими [20]. Так, дети приезжих родителей имели больше шансов получить высшее образование в сравнении с местным населением. Следует отметить, что в изучаемый период население Бристоля было достаточно однородным и в виду имелась миграция внутри страны, когда семьи британцев переезжали из одного города в другой. Исследователи предположили, что чаще всего люди переезжают внутри страны по экономическим соображениям, так как получили более высокооплачиваемую или более престижную работу. Вероятно, эти родители были образованнее большинства местного населения, а соответственно, их дети тоже имели больше возможностей получить высшее образование.

Конфаундеры сыграли роль и в исследованиях мужского и женского мозга, о которых мы говорили в начале главы. Конечно, между мужским организмом и женским есть различия, но не в том, как устроен и работает мозг. В книге «Розовый мозг, голубой мозг» профессор нейробиологии Лиза Элиот объясняет, что человеческий мозг является не «диморфным», или различным между полами органом, а мономорфным, таким же, как сердце, почки и легкие, которые с большим успехом пересаживают между женщинами и мужчинами [21]. Да, общий размер мозга мужчин примерно на 11 % больше, чем у женщин, но размер мозга пропорционален размеру тела. И разница в размерах мозга между полами меньше, чем разница в размерах других внутренних органов, например, все те же сердце, легкие и почки у мужчин в среднем больше на 17–25 %. Исследование с участием 676 женщин и 467 мужчин, проведенное учеными из Норвегии, Швеции и США в 2009 году, доказало: если корректно учесть при анализе размеры тела, ни одна отдельная область мозга у мужчин и женщин не различается более чем на 1 % [22].

Конфаундеры приводят к ошибкам и в крупных исследованиях. Возьмем, к примеру, американскую когорту по изучению здоровья медсестер, которая использовалась в огромном числе различных исследований, об одном из них мы уже говорили ранее в этой главе в примере с кофе и артритом. Другое исследование изучало взаимосвязи между заместительной гормональной терапией и частотой серьезных ишемических заболеваний сердца.

Ученые проанализировали данные 48 470 женщин в постменопаузе в возрасте 30–63 лет, за которыми велось наблюдение в течение 10 лет [23]. В 90‐х годах результаты исследования показали, что заместительная гормональная терапия не только облегчает симптомы, связанные с менопаузой, но и снижает частоту серьезных ишемических заболеваний сердца почти вдвое. Но, как вы, наверное, уже догадались, эти результаты были далеки от правды – эстрогены не только не снижали риск заболеваний сердца, но, возможно, и увеличивали [24].

Несмотря на огромный размер выборки, в исследовании не удалось распознать влияние вмешивающихся факторов, самым сильным из которых было социоэкономическое положение участниц [25]. Оказалось, женщины, которые могли себе позволить заместительную гормональную терапию, как правило, из более высоких социально-экономических слоев, получали качественное медицинское обслуживание, лучшее питание и были физически активны – влияние всех этих обстоятельств не получилось полностью нивелировать в первом исследовании. Однако ошибались и последующие исследования, как «случай – контроль» с больничными выборками, так и когортные исследования с участниками из общего населения [26]. Решающее доказательство потенциального вреда этого лечения пришло из рандомизированного клинического испытания – РКИ, подобного тому, которое доказало эффективность стрептомицина в исследовании Брэндона Хилла.

Все типы исследований, о которых мы пока говорили в этой книге – серии случаев, исследования «случай – контроль», когортные, – относятся к так называемой категории обсервационных (от англ. observe – «наблюдать»), или наблюдательных, исследований, когда за участниками наблюдают – опрашивают, измеряют, обследуют, но активно не вмешиваются в естественный ход событий и тактику лечения. Принципиально отличаются от обсервационных исследований интервенционные (от англ. intervene – «вмешиваться»), к которым относят эксперименты, клинические испытания (англ. clinical trial), в том числе РКИ, о которых мы и поговорим в следующей главе.

Итоги шестой главы

«Вместе» не значит «связаны». Любая видимая взаимосвязь может оказаться следствием третьего фактора, ошибки отбора или случайности. Это три наиболее частые причины, почему научные исследования могут ошибаться.

1. Показатели никак не связаны между собой, а взаимосвязь – чистой воды совпадение (иллюзорная корреляция), как, например, количество потребляемого маргарина и число разводов в стране. Размер исследования имеет значение. Маленькие выборки выдают случайные и ошибочные результаты, поскольку плохо отражают интересующее нас население. Поэтому, когда читаете о каком-нибудь открытии, задайте себе вопрос: а сколько человек участвовало в исследовании? Слишком маленькие выборки – здесь нет конкретной цифры, так как для каждого исследования размер выборки должен рассчитываться индивидуально, но выборки менее 10–20 человек и даже часто менее 50–100 должны вызвать разумные подозрения и желание узнать подробности, найти другие исследования по теме, но с большей выборкой. Большие выборки точнее отражают действительность и дают лучший результат, чем маленькие, но также подвержены влиянию случайности, проклятию больших чисел (чем больше данных, тем меньшие различия можно заметить) и нередко проблеме множественных сравнений. Чем больше сравнений, тем больше вероятность ошибки. Поэтому не позволяйте выборкам с участием более миллиона человек ослепить вас, а в обычной жизни проблема множественных сравнений поможет вам легко объяснить удивительные совпадения.

2. Показатели никак не связаны между собой, а взаимосвязь – результат ошибки в дизайне и анализе исследования (систематическая ошибка или смещение), как, например, в исследованиях о пользе курения. Результаты исследования настолько применимы к реальной жизни, насколько похожи участники исследования на интересующую нас группу. Чтобы понимать, насколько участники опроса отражают мнение населения всей страны или пациентов с тем или иным заболеванием, поинтересуйтесь, как отбирались участники исследования, была ли выборка случайной, многие ли отказались от участия в исследовании, какие характеристики были у финальной выборки.

3. Некий третий фактор влияет на оба показателя, как, например, повышение числа травм среди пешеходов и аварий на дороге, связанные общей причиной – гололедицей. Поэтому, читая результаты исследований, не забывайте рассматривать альтернативные гипотезы и периодически задавать себе вопрос: чем еще может быть вызвана такая ассоциация? Какие еще факторы могут повлиять на результат?

Также, видя разницу, не забывайте о схожести. Оценивайте результаты в целом: в чем были различия между группами, а в чем схожесть; все ли исследования пришли к одинаковому выводу; чем отличались исследования друг от друга; что было результатом, а что – интерпретацией.

Я уверена, у вас обязательно получится.

«ВСЕ СОВПАДЕНИЯ СЛУЧАЙНЫ»: МОРЕ СЛУЧАЙНОСТЕЙ И СЛУЧАЙНЫХ СОБЫТИЙ
КЛЮЧЕВЫЕ ИДЕИ

Глава 7