У меня есть результаты анализов крови 2500 человек четыре раза с шестимесячным интервалом. Результаты в основном состоят из двух показателей иммунного ответа - один в присутствии определенных антигенов туберкулеза, один в отсутствие. В настоящее время каждый тест оценивается как положительный или отрицательный, основываясь на разнице между ответом антигена и ответом ноль (при том, что если ваша иммунная система реагирует на антигены ТБ, вы, вероятно, в какой-то момент подвергались воздействию самой бактерии). ). По сути, тест предполагает, что распределения у ноля и туберкулеза у лиц, не подвергшихся воздействию, должны быть в основном идентичными, тогда как у человека с воздействием ТБ ответы на ТБ будут взяты из другого распределения (более высоких значений). Предостережение: ответы очень, очень ненормальные, и значения сгущаются как на естественном полу, так и на потолке с усеченными инструментами.
Тем не менее, в этой продольной обстановке кажется довольно ясным, что мы получаем «ложные срабатывания» (я боюсь, что нет действительного золотого стандарта для скрытого туберкулеза), которые вызваны (обычно небольшими) колебаниями антигена и нулевыми ответами. Хотя этого может быть трудно избежать в некоторых ситуациях (у вас может быть только один шанс проверить кого-либо), существует множество ситуаций, в которых люди регулярно проходят тестирование на туберкулез каждый год или около того - в США это характерно для работников здравоохранения, военные, бездомные, оставшиеся в приютах, и так далее. Кажется, стыдно игнорировать предыдущие результаты испытаний, потому что существующие критерии оказываются поперечными.
Я думаю, что то, что я хотел бы сделать, это то, что я грубо воспринимаю как продольный анализ смеси. Так же, как и критерии поперечного сечения, я хотел бы иметь возможность оценить вероятность того, что индивидуальные ответы по туберкулезу и нолю получены из одного и того же распределения, но при этом эта оценка включает в себя результаты предыдущих испытаний, а также информацию из выборки как в целом (например, могу ли я использовать выборочное распределение вариаций внутри индивидуума для улучшения моих оценок распределения конкретного индивидуума ноль или туберкулез?). Предполагаемая вероятность должна иметь возможность со временем меняться, чтобы учесть вероятность новой инфекции.
Я полностью исказился, пытаясь думать об этом необычным образом, но я чувствую, что эта концептуализация так же хороша, как и любая другая, которую я собираюсь придумать. Если что-то не имеет смысла, пожалуйста, не стесняйтесь просить разъяснений. Если мое понимание ситуации кажется неправильным, пожалуйста, не стесняйтесь, сообщите мне. Большое вам спасибо за вашу помощь.
В ответ Srikant: Это случай скрытой классификации (туберкулезной или нет) с использованием двух непрерывных (но ненормальных и усеченных) результатов теста. Прямо сейчас, эта классификация сделана, используя сокращение (в его упрощенной форме, TB - ноль> .35 -> положительный). С результатами теста, представленными как (ноль, ТБ, результат), основными архетипами * являются:
Вероятный отрицательный: (0,06, 0,15, -) (0,24, 0,23, -) (0,09, 0,11, -) (0,16, 0,15, -)
Вероятный положительный: (0,05, 3,75, +) (0,05, 1,56, +) (0,06 , 5,02, +) (0,08, 4,43, +)
Воблер: (0,05, 0,29, -) (0,09, 0,68, +) (0,08, 0,31, -) (0,07, 0,28, -)
Позитив во втором тесте для Воблера - это явно отклонение, но как бы вы это смоделировали? Хотя одной из моих мыслей является оценка «истинной разницы» между туберкулезом и нулем в каждый момент времени с использованием многоуровневой модели с повторными измерениями, мне пришло в голову, что я действительно хочу знать, является ли ответ человека нулевым и ответом на туберкулез взяты из того же распределения, или если их иммунная система распознает антигены ТБ и активирует, вызывая повышенный ответ.
Что касается того, что могло вызвать положительный тест кроме инфекции: я не уверен. Я подозреваю, что, как правило, это просто индивидуальные различия в результатах, но, безусловно, возможны и другие факторы. У нас есть вопросники с каждого момента времени, но я еще не слишком разбирался в них.
* Изготовлены, но иллюстративные данные