Точность же теста определяется как отношение количества истинно положительных результатов к общему количеству положительных результатов – как истинных, так и ложных. Низкая точность скрининга рака груди – всего 3,48 % истинно положительных результатов из всех положительных – удивила нас ранее в этой главе. Термином же «достоверность» обычно обозначают результат деления общего количества истинно положительных и истинно отрицательных результатов на общее количество тестируемых. Это логично, поскольку полученный результат показывает, насколько часто тест дает верный ответ, так или иначе.
Действительный уровень ошибок иммуноферментного теста на ВИЧ, который не прошел Марк Стерн, определить сложно. Тем не менее большинство исследований сходятся на том, что его специфичность составляет около 99,7 %, а чувствительность приближается к 100 %. Отрицательный результат теста означает, что реципиент почти наверняка не заражен ВИЧ, но в среднем 3 человека из каждых 1000 здоровых получат ложноположительный диагноз. В Великобритании распространенность ВИЧ составляет всего 0,16 %. Таким образом, из 1 000 000 случайно выбранных граждан Великобритании (рис. 7), в среднем 1600 будут ВИЧ-положительными, а 998 400 – нет. Из 998 400 ВИЧ-отрицательных пациентов, проходящих тест ИФА, даже со специфичностью 99,7 %, 2995 получат неверные положительные диагнозы. Этих ложноположительных результатов почти в два раза больше, чем 1600 истинно положительных. Как и в случае со скринингом рака молочной железы, поскольку распространенность ВИЧ низкая, а анализу ИФА до специфичности в 100 % не хватает совсем немного, точность теста будет довольно высокой – разделив количество тех, кто был верно определен как положительный, на количество всех, определенных как положительные, мы получим чуть более одной трети. Достоверность теста, однако, чрезвычайно высока. Он дает 997 005 правильных результатов (положительных или отрицательных) для каждого 1 000 000 протестированных людей – достоверность более 99,7 %. Даже очень достоверные тесты могут быть пугающе неточными.
Рис. 7. Из 1 000 000 граждан Великобритании, проходящих тест ИФА, 1600 будут правильно определены как ВИЧ-положительные, а 2995 – как ВИЧ-положительные, несмотря на то что у них нет этого заболевания
Один из простых способов снизить погрешность теста – просто провести второй тест. Поэтому первый тест на многие заболевания (как мы видели на примере обследования для выявление рака груди) – это скрининг с низкой специфичностью. Он предназначен для того, чтобы при минимальных затратах выявить как можно больше потенциальных случаев, пропуская при этом как можно меньше. Второй тест, как правило, является диагностическим и будет иметь гораздо более высокую специфичность, что исключит большинство ложноположительных результатов. Даже если тест с более высокой специфичностью недоступен, повтор одного и того же теста на всех пациентах с положительными результатами может значительно снизить погрешность. В случае с тестом ИФА первая попытка эффективно повышает распространенность ВИЧ-инфекции среди тех, кто был протестирован повторно, с 0,16 % до примерно 34,8 % – такова точность первого теста. При повторном тесте, как показано на древе принятия решений на рис. 8, большинство исходных ложноположительных результатов опровергаются благодаря низкой точности теста, в то время как истинные ВИЧ-положительные люди опять верно идентифицируются как таковые. Погрешность снижается до 1600/1609, что составляет примерно 0,6 %.
Рис. 8. Из 4595 положительных результатов на первом тесте 1600 истинных положительных результатов все равно будут идентифицированы как таковые, но количество ложных срабатываний сократится до 9
Тест, обладающий абсолютной чувствительностью и абсолютной специфичностью – то есть такой, который идентифицирует всех людей, у которых есть болезнь, и только их, – теоретически возможен. Такой тест может быть действительно признан 100 % точным.
Более того, известны и примеры таких тестов. В декабре 2016 года международная команда исследователей разработала анализ крови на болезнь Крейтцфельдта – Якоба [79]. При контрольном испытании анализ верно выявил фатальное дегенеративное расстройство мозга (вызванное, как считается, употреблением в пищу говядины, полученной от животных, инфицированных коровьим бешенством) у всех 32 пациентов, которые имели эту болезнь (абсолютная чувствительность), без ложноположительных результатов (абсолютная специфичность) из 391 пациента контрольной группы.
Жертвовать чувствительностью ради специфичности (и наоборот) не обязательно, но на практике обычно происходит именно так. Ложноположительные и ложноотрицательные результаты обычно имеют отрицательную корреляцию: чем меньше ложноположительных результатов, тем больше ложноотрицательных, и наоборот. На практике эффективные тесты находят пороговый уровень, при котором можно провести грань между полной специфичностью и полной чувствительностью; баланс устанавливается между двумя крайними точками, как можно ближе к обеим.
Практическая необходимость такого компромисса объясняется тем, что обследования обычно направлены на поиск признаков и последствий болезни, а не на поиск самой болезни. Тест, который ошибочно определил, что Марк Стерн ВИЧ-инфицирован, не проверяет на наличие вируса ВИЧ. Скорее, он выявляет антитела, которые вырабатываются иммунной системой организма в попытке бороться с вирусом. Однако высокая концентрация антител, потенциально связанных с ВИЧ-инфекцией, может быть вызвана чем-то безобидным – той же прививкой против гриппа. Аналогичным образом большинство тестов на беременность в домашних условиях не выявляют наличие жизнеспособного эмбриона, растущего в утробе матери. Обычно эти тесты выявляют повышенный уровень гормона HCG, вырабатываемого после имплантации эмбриона. Такие косвенные индикаторы часто называют суррогатными маркерами. Тесты в ряде случаев дают неверный результат, так как положительную реакцию могут спровоцировать маркеры, подобные суррогатным.
Так, диагностические обследования на болезнь Крейтцфельдта – Якоба, как правило, основаны на сканировании мозга и биопсии, измеряющих потенциальное воздействие на мозг дефектных белков, которые являются основной причиной заболевания. К сожалению, характеристики, оцениваемые этими тестами, схожи с характеристиками у людей, страдающих слабоумием, что затрудняет диагностику. Вместо того чтобы искать слегка отличающиеся симптомы, которые можно было бы перепутать с симптомами других заболеваний, новый анализ крови на болезнь Крейтцфельдта – Якоба выявляет инфекционные белки, которые всегда вызывают заболевание. Вот почему тест может быть настолько убедительным: если найдены дефектные белки, то у этого человека есть болезнь, если нет, то он здоров. При тестировании на первопричину заболевания, а не на косвенный симптом, все оказывается проще простого.
Другая распространенная причина провала косвенных тестов возникает тогда, когда сам суррогатный маркер вызван не тем явлением, которое мы надеялись обнаружить. Анне Ховард было всего 20 лет, когда однажды утром в июне 2016 года она проснулась, чувствуя недомогание. Несмотря на то, что она и вот уже девять месяцев ее парень Колин не пытались завести ребенка, на всякий случай она решила сделать тест на беременность. С удивлением она смотрела, как на тесте, словно по волшебству, медленно проявляется вторая полоска. Этого никто из них не планировал, но, убедив себя в том, что из них выйдут хорошие родители, Колин и Анна решили оставить малыша и даже начали выбирать имя.
Через восемь недель после начала беременности у Анны началось кровотечение. Лечащий врач направил ее в больницу на УЗИ, чтобы убедиться, что с ребенком все в порядке. После УЗИ врачи сообщили Анне, что у нее выкидыш. Они сказали ей вернуться на следующий день для дальнейших подтверждающих анализов. На следующий день, однако, гормональный тест, не сильно отличающийся от домашнего теста на беременность, показал, что уровень HCG, «гормона беременности», все еще достаточно высок, чтобы показать жизнеспособность беременности. На этом основании врачи сообщили Анне, что диагностированный выкидыш – ложная тревога.
Неделю спустя у Анны снова началось кровотечение, уже с острой болью, поэтому она вернулась в больницу. На этот раз, опасаясь внематочной беременности, врачи провели обследование репродуктивного тракта Анны с помощью оптоволоконной камеры. К счастью, они не обнаружили никаких признаков того, что плод расположился не в том месте, но то, что росло в утробе Анны, не было плодом. Вместо здорового ребенка у Анны в матке росло гестационное трофобластическое новообразование – раковая опухоль. Опухоль увеличивалась примерно с той же скоростью, что и плод, и вырабатывала гормон HCG, служащий косвенным индикатором беременности, обманывая тесты, Анну и медиков, которые считали, что опасный для жизни рак – это нормальный здоровый ребенок.
Несмотря на то что такие опухоли, как у Анны, встречаются редко, другие виды опухолей также способны обмануть тесты на беременность и дать ложноположительный результат, производя суррогатный индикатор HCG. Так, по данным Доверительного фонда по борьбе с раком у подростков [80], тесты на беременность используются для диагностики рака яичек, по крайней мере в течение последнего десятилетия. На деле при таких тестах обнаружить опухоль яичек удается лишь изредка. Однако сам факт, что любой положительный результат теста на беременность в этом случае будет заведомо ложноположительным, свидетельствует в пользу того, что повышенный уровень гормона HCG вызван ростом опухоли.
Тесты на беременность изначально могут неверно срабатывать (что в некоторых случаях весьма полезно). Однако уровень гормона HCG в моче может быть настолько низким, что эти тесты способны давать и ложноотрицательные результаты. Ложноотрицательные результаты тестов на беременность хотя и менее распространены, чем ложноположительные, могут иметь значительные негативные последствия для будущих матерей. В одном слу