А знаете ли Вы что такое низкая прецизионность тестов на коронавирус?

Здравствуйте, коллеги.

Мы уже разбирали ранее такие характеристики методов медицинской диагностики как «чувствительность» и «специфичность». Сегодня хотелось бы помочь Вам разобраться с тем, что такое «прецизионная точность» на базе тех же самых ЧТС, которым мы столько внимания уделяем в открывшейся вчера летней психометрической школе.

Когда Анна Попова говорит о том, что точность тестов на коронавирус достигает только … 40 процентов и появляется 60 процентов ошибок, то говорит она не о показателе Accuracy (общая точность по матрице ошибок), а именно о Precision (точности положительного прогноза). Хотя, увы, эти термины в переводе на русский практически не различаются. См. более подробные формулы и наиболее полную сводку терминов для разных показателей вот в этой статье в англоязычной Википедии:

https://en.wikipedia.org/wiki/Confusion_matrix

При каких же условиях высокие значения Сензитивности и Специфичности (в районе 0,96), как и высокая Accuracy 0,96 могут нам давать низкую прецизионность — ниже 50 процентов? — Это при тех условиях, когда прогнозируемое целевое событие (зараженность человека коронавирусом) является РЕДКИМ событием и в матрице частот 2 на 2 возникает асимметрия по краевым частотам — по столбцам.

Пусть ЧТС для теста на коронавирус выглядит так:

 
КВИ+
(реально заражены)

КВИ —
(реально здоровы)

Тест +
(по тесту заражены)
АB

Тест —
(по тесту здоровы)
CD

И при обследовании 10 миллионов человек получаем следующие частоты на месте клеточек матрицы (значения в тысячах):

 
КВИ+
(реально заражены)

КВИ —
(реально здоровы)

Тест +
(по тесту заражены)
А =190 тысячB= 300 тысяч

Тест —
(по тесту здоровы)
C = 10 тысячD = 9500 тысяч

Показатель прецизионности — это А/(А+B). (Увы, его часто путают с показателем сензитивности А/(А+С) ).

Как видим, в таблице прецизионность оказывается ниже 40 процентов, а более 60 процентов — это ложные позитивные результаты теста, которые при повторном тестировании не подтверждаются. При этом сензитивность (чувствительность) равна 0,95, а специфичность и того выше — примерно 0,97.

В этих условиях получаем следующей парадокс, который без повторного контрольного тестирования (через 2 дня) превращается в настоящий «клондайк» для желающих отчитаться о «страшном росте уровня зараженности населения». Чем больше проводится таких тестов, тем больше растет число зараженных, ибо доля ошибок — «ложных положительных тестов» очень велика (в общей численности положительных результатов).

Когда в мае надо было продолжить «домашний арест» (извините,политику самоизоляции), то число зараженных ТЕСТ+ легко можно было нарастить путем резкого наращивания числа тестов, потому что в эту категорию попадают не только «истинно-зараженные» люди типа А, но и «здоровые с положительным тестом» типа В.

Такие причуды в «матрице ошибок» (более бизнесовое название для ЧТС) возникают именно тогда, когда наблюдается резкая асимметрия в численности двух выборок — зараженных (А+C) и здоровых (B+D). Обратите внимание, что чаще всего в ходе экспериментальной обкатки метода диагностики группы больных и здоровых берутся примерно равными по численности и никаких парадоксов с низкой прецизионностью в этом случае не возникает вовсе, так как в этом случае прецизионность счастливым образом совпадает с accuracy (общей точностью метода), но в реальной жизни, когда заболевание редкое, то… и так появляется еще одно основание для распространении КОВИД-ПАНИКИ. Ведь СМИ все время кормят нас сообщениями о количестве новых зараженных, но не делают поправки на то, сколько проведено тестов. А надо бы сообщать долю зараженных, у которых повторился позитивный диагноз, от общей доли протестированных (А+B).

комментировать


Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Актуальный опрос

Рубрики

Последние комментарии:

  1. Здравствуйте Александр Георгиевич! Да, согласен, вы правы. Возможно, даже больше чем можете себе представить. Всякие переговоры об окончании боевых действий…

Облако меток