Доказательная медицина. Что, когда и зачем принимать — страница 35 из 49

[87]. В группах, где распространенность составляет 10 % и 90 % прогностическая ценность результатов будет абсолютно разной. А вот чувствительность и специфичность диагностического теста от распространенности заболевания не зависят, но они зависят от состава групп пациентов, участвовавших в исследованиях, по результатам которых были определены (стандартизированы) эти характеристики. Врач, применяющий диагностический тест на практике, ориентируется на характеристики без учета того, что они могли быть определены с участием совершенно иной популяции. Доказательная медицина требует от врачей осмысленной оценки характеристик диагностических тестов. Грубо говоря, всегда надо учитывать то, что реальная достоверность теста может оказаться меньше заявленной.

В последнее время в практику входит еще одна характеристика – отношение правдоподобия. Отношение правдоподобия для положительного результата – это отношение вероятности получения положительного результата диагностического теста у пациента с наличием заболевания к вероятности такого же результата у пациента без заболевания. Оно рассчитывается по формуле:



Этот показатель отвечает на вопрос: «Насколько более вероятно то, что тест будет положительным у человека с заболеванием по сравнению со здоровым?»

Отношение правдоподобия для отрицательного результата – это отношение вероятности получения отрицательного результата диагностического теста у пациента без заболевания к вероятности такого же результата у пациента с наличием заболевания. Формула расчета такова:



Вопрос в данном случае такой: «Насколько более вероятно то, что тест будет отрицательным у здорового человека с заболеванием по сравнению с больным?»

У каждого диагностического метода есть своего рода лекало, которому данный метод должен как можно лучше соответствовать. Это лекало называется «критериальным стандартом». Его еще называют «золотым стандартом», но в наше время такое название считается неверным. Слишком уж многое в области медицины стали называть этим термином, заимствованным у финансистов. В результате произошла девальвация – при словах «золотой стандарт» врачи морщатся и думают: «Ах, еще один!» Справедливости ради нужно отметить, что прилагательное «золотой» звучит лучше, чем царапающее слух слово «критериальный», но зато «критериальный» правильно отражает суть стандарта, являющегося набором диагностических критериев, позволяющих установить наличие заболевания.

У «кругового метода» из притчи индекс точности равнялся 67 %. Как, по-вашему, хороший это индекс или нет? Можно ли внедрять в практику диагностический метод, который позволяет ставить точный диагноз в 67 случаях из 100? (разумеется, речь идет не о казни по счету, а о нормальном, реальном диагностическом методе). Давайте представим, что вы – высокопоставленный сотрудник Министерства здравоохранения, которому предоставили информацию, касающуюся нового диагностического метода, для принятия решения о его практическом использовании. От вас зависит, получит отечественное здравоохранение новый метод диагностики с индексом точности 67 % или нет.

Не спешите отказываться от принятия решения, ссылаясь на незнание тонкостей. Это вопрос на сообразительность, уточняющий ваше личное отношение к цифре 67.

Правильный ответ будет таким: индекс точности сам по себе ничего не определяет. Более важное значение для медицинского менеджера высшего звена имеют такие качества, как чувствительность и специфичность. У идеального теста эти характеристики приближаются к 100 %. Менеджеру важнее знать, насколько хорош этот метод для выявления пациентов, имеющих данное заболевание, и для исключения пациентов, не имеющих заболевания. Какая часть всех тестов дала правильные результаты – это вопрос второго порядка.

И вот здесь, на границе соприкосновения чувствительности и специфичности, начинается самое интересное. Высокая чувствительность исключает высокую специфичность и наоборот. Высокая чувствительность проявляется в гипердиагностике – ошибочном заключении о наличии заболевания, а гипердиагностика снижает специфичность. В свою очередь высокая специфичность подразумевает, что диагноз должен выставляться только тем, кто болен вне всякого сомнения, на все 100 %. Такое условие снижает чувствительность. Приходится определять приоритеты, решать, чего больше хочется, условно говоря – приобрести капитал или же сохранить невинность.

Вам нужно максимальное выявление заболевания, такое, чтобы ни один больной не проскочил бы мимо (это очень важно при опасных инфекционных заболеваниях)? Тогда делайте ставку на чувствительность диагностического теста, а с издержками гипердиагностики будете бороться позже, в рабочем порядке. Ну а если же вам нужно отделить наверняка здоровых от больных и возможно больных, то ставку придется делать на специфичность. В одну телегу впрячь коня и трепетную лань, а в одном тесте совместить исключительную чувствительность с исключительной специфичностью невозможно. Понять и принять это поможет графическое изображение, получившее название ROC-кривой (от английского «receiver operating characteristic» – рабочая характеристика приемника), также известной как «кривая ошибок». ROC-кривые позволяют наглядно сопоставлять эффективность различных характеристик одного и того диагностического метода.


Графическое изображение взаимной противоречивости чувствительности и специфичности


Если сказать проще, то ROC-кривые показывают зависимость количества верно определенных положительных результатов от количества неверно определенных отрицательных результатов. Изменяемый параметр называется порогом отсечения. Для каждого значения порога отсечения, которое меняется от 0 до 1 с определенным шагом, рассчитываются значения чувствительности и специфичности, и строится график зависимости – по оси Y откладывается чувствительность, а по оси X – 100 % минус специфичность (а не просто специфичность, как можно подумать). В результате получается ROC-кривая. Также на графике вычерчивается диагональная прямая линия, которая соответствует полному совпадению значений х и у (y = x). Чем ближе ROC-кривая к верхнему левому углу, тем выше эффективность (предсказательная способность) модели, а чем ближе она расположена к диагональной прямой, тем эффективность меньше. Для идеальной в плане чувствительности модели ROC-кривая будет проходить через верхний левый угол, в котором доля истинно положительных случаев составляет 100 % (это идеальная чувствительность), а доля ложноположительных результатов равна 0.

Если вам не хочется вникать во всю эту графическо-математическую премудрость, то вы можете совершенно спокойно ее пропустить и продолжить чтение со слов «Пожалуй, довольно с нас математики».


«Точка баланса» между чувствительностью и специфичностью


Выше было сказано об идеально чувствительной модели. Но как будет выглядеть ROC-кривая в случае с идеальной моделью, обладающей и 100 % чувствительностью, и 100 % специфичностью? Взгляд невольно упирается в правый верхний угол, куда протягивается диагональная линия полного совпадения значений и нулевой эффективности. Невозможно одновременно повышать чувствительность и специфичность, сохраняя при этом эффективность модели (диагностического метода). Можно говорить только о нахождении «точки баланса» – оптимального порога отсечения, при котором чувствительность и специфичность будут иметь максимально возможные значения.

На практике обычно оперируют требованием минимальной величины чувствительности или специфичности диагностического метода, а значение второй характеристики подгоняется к основному требованию.

Пожалуй, довольно с нас математики. Общее впечатление о характеристиках диагностических методов вы получили и понимаете, что не все так просто и не все однозначно. Метод методу рознь, разные характеристики свидетельствуют о разных качествах, и в каждом конкретном случае на первый план выступают те характеристики или свойства, которые соответствуют основным требованиям. Разумеется, доказательная медицина настоятельно требует использовать методы с подтвержденной эффективностью. На основании осмотра мочи в наше время диагнозы не ставятся[88].

К слову – о тесте, позволяющем определить содержание глюкозы в моче. Это очень яркий пример того, что диагностический метод с чувствительностью примерно в 23 % (всего-навсего!) может получить широкое распространение, причем полностью заслуженное.

Но давайте по порядку. В норме в моче глюкозы быть не должно. Глюкоза – это ценный продукт, источник энергии, и природа сделала все возможное для того, чтобы сохранить ее в организме. Но при сахарном диабете, когда уровень содержания глюкозы в крови резко возрастает, организму приходится выводить ее излишки с мочой. Тест-полоски, позволяющие быстро и просто определить содержание глюкозы в моче, используются для выявления больных сахарным диабетом, которые не знают о своей болезни. Опустили в мочу полоску – оценили изменение цвета – сделали вывод. Метод крайне простой и довольно-таки дешевый. Альтернативой ему, а если точнее, то не альтернативой, а диагностическим методом более высокого порядка, служит глюкозотолерантный тест, определяющий, насколько хорошо организм усваивает глюкозу. Суть этого метода заключается в следующем. Сначала у пациента натощак измеряют уровень содержания глюкозы в крови. Затем ему дают выпить стакан воды, в котором растворено большое количество глюкозы (75 граммов для взрослого человека). Затем – каждые полчаса в течение двух часов или же просто через два часа – повторяют определение уровня содержания глюкозы в крови. Если диагноз сахарного диабета неочевиден, то есть кроме повышенного содержания глюкозы в крови нет никаких иных симптомов, глюкозотолерантный тест повторяют дважды. Но если и во второй раз глюкозы в крови определилось больше нормы, то факт наличия сахарного диабета сомнений уже не вызывает. Чувствительность у этого метода практически 100 %-ная. По сути дела, это не просто диагностический метод, а критериальный стандарт сахарного диабета.