Forbes решительно пересмотрел свои данные относительно капитализации “Теранос” и личного состояния Холмс. Они оказались равными нулю долларов, что, естественно, куда больше соответствовало действительности.
Машина Эдисона оказалась не чем иным, как механическим турком[55]; на первый взгляд это была высокая технология, а по сути – всего лишь дешевый салонный фокус. Об этой саге – со всеми ее обманами, некомпетентностью и высокомерием[56] – написано очень много, но у нее есть важная подоплека, о которой нам ни в коем случае нельзя забывать. Заоблачный взлет “Теранос” произошел в основном благодаря астрономическим суммам, которые сумела привлечь Холмс, но тревожные сигналы звучали много раньше. Наиболее серьезный из них – это обещание выполнять точные и надежные анализы с использованием ничтожного количества крови: существуют объективные и хорошо известные химические и физические причины, по которым работать с маленькими капельками крови очень трудно, и об этом твердили многие специалисты. Тем не менее все-таки была надежда, что создателям машины Эдисона удалось совершить рывок в технологиях анализа микроскопических количеств жидкости, и инвесторы позволили себя в этом убедить.
Но есть и более тонкие причины, по которым заявления “Теранос” должны были вызвать тревогу, и они являются еще более важными. При всей осведомленности прожженных инвесторов о высоких технологиях трехминутного разговора с профессиональным статистиком было бы достаточно для того, чтобы они насторожились. “Теранос” пыталась представить свой подход к диагностике, определяемый словами “пальба из всех орудий”, как достоинство, но в действительности эта идея была изначально обречена на неудачу. Почему? Ну, во-первых, надо признать, что медицинские анализы сами по себе редко позволяют точно и сразу установить верный диагноз; обычно анализы назначают, когда есть другие симптомы, указывающие на возможность искомого заболевания. Стремление выполнять скрининговые тесты до появления клинически явных симптомов выглядит очень привлекательно, однако с медицинской точки зрения такой скрининг часто оказывается бесполезным, а в отсутствие симптомов подобное тестирование может в лучшем случае ввести в заблуждение, а в худшем – причинить вред.
Для того чтобы понять, почему это так, будет полезным ввести два важных понятия. Первое понятие – это чувствительность, то есть мера того, насколько положительный результат является верным при его получении. По этой причине иногда говорят о “частоте истинно положительных результатов”: если в ходе выполнения какого-то анализа получают 100 положительных результатов, но только 90 из них являются истинными, то это означает, что чувствительность анализа равна 90 процентам. Обратным по отношению к чувствительности является понятие специфичности, определяемой как доля отрицательных результатов, оказавшихся истинно отрицательными; этот показатель называют “частотой истинно отрицательных результатов”. В идеале тесты должны быть на 100 процентов чувствительными (то есть давать только истинно положительные результаты) и на 100 процентов специфичными (то есть давать только истинно отрицательные результаты, не давая ложно отрицательных). Но, увы, наш мир от природы не идеален – даже самые высококачественные тесты не достигают этой цели; на практике тесты, позволяющие получать 90-процентную чувствительность и специфичность, считаются хорошими. Очень важно, что их нельзя оценивать изолированно: результаты, взятые изолированно, могут служить основанием лишь для подозрения, но не для окончательного суждения.
Мы сталкивались с таким примером выше, когда рассматривали тесты на ВИЧ, которые обладают практически идеальной специфичностью, то есть крайне редко дают ложноотрицательные результаты. Но, как мы уже видели, даже при такой высокой чувствительности, достигающей 99,99 процента, пятьдесят процентов положительных результатов в когорте лиц из группы низкого риска являются ложноположительными. Диагностическая сила любого теста должна оцениваться на основании чувствительности и специфичности, но надо в каждом случае тщательно интерпретировать эти показатели. Дело осложняется еще и тем, что эти параметры никак не связаны с распространенностью заболевания, а положительная или отрицательная предсказательная ценность теста зависит именно от того, насколько распространено данное заболевание, и для того, чтобы рассчитать этот показатель, надо применить теорему Байеса. В диагностике бессистемная, без учета множества факторов, стрельба по площадям картечью является внутренне порочной. В своей редакционной статье Элефтериос Диамандис очень доходчиво изложил суть проблемы:
Далекий от медицины человек, у которого в крови выявлена концентрация PSA около 20 мкг/л, скажет, что он с вероятностью 50 процентов страдает раком предстательной железы и что ему показана биопсия. Однако если несколькими днями ранее концентрация PSA в крови этого человека была равна 1 мкг/л, то шансы на рак у данного пациента практически равны нулю, а причиной повышения концентрации специфического простатического антигена является, вероятно, острый простатит – заболевание доброкачественное и поддающееся консервативному лечению. Наверное, мужчина, у которого оказывается положительным тест на беременность, будет несколько смущен, но опытный врач начнет прицельно искать рак яичка.
Холмс поставила своей амбициозной целью создание “демократизированного здравоохранения”, призвав пациентов самостоятельно делать себе анализы, но, поступив так, она проигнорировала солидное разумное основание, на котором врачи назначают те или иные анализы, а медицинское сообщество стремится сократить число скрининговых тестов. Чем шире забрасывают сеть скрининга, тем больше число ложноположительных результатов. Захватывающие посулы “Теранос” относительно того, что ее тестовые наборы позволят по одной капле крови диагностировать до тридцати заболеваний, плохи тем, что при таком числе независимых анализов все недостатки многократно усиливаются. Чтобы это проиллюстрировать, скажем, что если каждый тест обладает чувствительностью 90 процентов, то шансы получить хотя бы один ложноположительный результат на фоне выполнения 30 анализов возрастают до тревожных 95 процентов. Даже если нам удастся довести чувствительность каждого теста до практически идеального уровня в 99 процентов, в двадцати пяти процентах случаев будет выпадать один ложноположительный результат. Это и есть присущая множественным независимым тестам ограниченность, когда каждый дополнительный анализ уменьшает предсказательную ценность всей системы и “заглушает” полезные сигналы бесполезным шумом.
Даже если бы чудодейственная машина и на самом деле выполняла заявленные функции, все ее обещания были бы подорваны суровой статистической реальностью. Идея, что можно, не имея никакой предварительной информации, просто сделать анализы обширной когорте пациентов и использовать результаты для пророческого предсказания, абсолютно иррациональна. Машина Эдисона, не избавив больных от визита к врачу, сделала бы их рабами ненужного страха. Перст, указующий на виновного во введении в заблуждение пациентов, законодателей и инвесторов, конечно, направлен в сторону Элизабет Холмс, и нет сомнения в том, что многие ее заявления граничат с сознательным обманом. Однако же, судя по ее возражениям критикам, она и сама была жертвой некоего умопомрачения. Обвинять одну только Холмс в скандале с “Теранос” было бы неверно. Если бы инвесторы проявили должное внимание и задали себе нужные вопросы относительно ее предложений, то едва ли бы они клюнули на них. Здесь особенно уместна поговорка “глупцы быстро расстаются со своими деньгами”
Глава 14Размер имеет значение
В октябре 2015 года все мясоеды мира получили весьма неприятное известие: обработанные мясные продукты канцерогенны. Daily Express кричала со своей первой полосы: “Бекон и сосиски вызывают РАК; есть эти продукты – то же самое, что КУРИТЬ”. Не желая отставать, The Guardian объявила, что “употребление обработанного мяса чревато таким же риском рака, как курение и асбестоз”. Эти заголовки появились после обнародования сногсшибательного пресс-релиза, опубликованного Международным агентством по исследованию рака (IARC) – отделом ВОЗ, занимающимся исследованием причин рака. В этом докладе говорилось, что употребление в пищу обработанного мяса повышает риск заболевания раком на 18 процентов; таким образом, эти продукты, наряду с курением и радиоактивным излучением, оказались среди канцерогенов 1 группы. В том же бюллетене было сказано, что красное мясо относится к группе 2А, то есть к группе веществ, являющихся “вероятно канцерогенными” для человека. Весть о том, что мясо так же опасно, как курение, вызвала всеобщий ужас.
Однако эти сногсшибательные заголовки были полной и несусветной чушью. Загадочная система классификации IARC основана не на степени риска, а на силе доказательства существования такого риска. Это означает, что некий фактор, приводящий к десятикратному увеличению риска заболеваемости, получает такое же место в классификации, как и фактор, который увеличивает риск в пренебрежимо малой степени. Такая классификация ничего не говорит о конкретной опасности какого-то фактора, а выражает лишь уверенность в том, что этот фактор может быть опасен. Агенты 1 группы – это вещества и факторы, относительно которых существуют убедительные доказательства их риска; к таким факторам относят курение, солнечный свет и алкоголь. Группы 2А и 2В, соответственно, включают факторы, которые могут вызывать рак “вероятно” и “возможно”. На обычный человеческий язык это можно перевести как ограниченный или сомнительный риск. Учитывая философские трудности доказательств отрицательной величины, группу 2 иногда называют эпидемиологической свалкой. На 2018 год единственным фактором группы 4 (который, вероятно, не является канцерогеном для человека) был признан капролактам, который применяют для пошива рейтуз для йогов.