Регрессия Кокса и шкала времени


9

Всегда ли переменная Х (опасность) в регрессионном анализе пропорциональной опасности Кокса должна быть временем? Если нет, не могли бы вы привести пример?

Может ли возраст больного раком быть переменной величиной? Если да, то можно ли это интерпретировать как риск заболеть раком в определенном возрасте? Будет ли регрессия Кокса законным анализом для изучения связи между экспрессией генов и возрастом?

Ответы:


8

Обычно базовый возраст используется как ковариата (потому что он часто ассоциируется с болезнью / смертью), но он также может использоваться в качестве шкалы времени (я думаю, что он используется в некоторых продольных исследованиях, потому что вам нужно иметь достаточно люди, подверженные риску по шкале времени, но я не могу вспомнить на самом деле - просто нашли эти слайды об анализе когортных исследований, предполагающих непрерывную шкалу времени, которая говорит о когортных исследованиях). В интерпретации вы должны заменить время события возрастом, и вы можете указать возраст диагноза как ковариату. Это имело бы смысл, когда вы изучаете возрастную смертность конкретного заболевания (как показано на этих слайдах ).

Возможно, эта статья интересна, поскольку она противопоставляет два подхода: время обучения и хронологический возраст: шкалы времени в модели Кокса: влияние изменчивости между возрастами поступления на оценки коэффициентов . Вот еще одна статья:

Чунг Ю.Б., Гао Ф. и Ху К.С. (2003). Возраст на момент постановки диагноза и выбор методов анализа выживаемости в эпидемиологии рака . Журнал клинической эпидемиологии , 56 (1), 38-43.

Но есть, конечно, лучшие документы.


@chi: Большое спасибо. Я посмотрю документы. Не могли бы вы прокомментировать первый вопрос? Всегда ли переменная опасности - время?
юк

@yuk Не обязательно, как предложено @whuber. Я имею в виду другое применение регрессии Кокса, касающееся обработки систематической схемы пропущенных ответов в образовательном тестировании, которое возникает, когда у ученика недостаточно времени для завершения теста (пропущенные ответы могут тогда рассматриваться как подвергнутые цензуре). - в данном случае это порядок позиций, который рассматривается как шкала времени. Я посмотрю на оригинальную статью (хотя я думаю, что это тоже тема PhD).
ЧЛ

+1. Есть и другие документы, но я не уверен, что они обязательно лучше; Я думаю, что Chalise делает довольно хорошую работу, суммируя ситуацию.
АРС

7

Нет, это не всегда должно быть время. Многие цензурированные ответы могут быть смоделированы с помощью методов анализа выживания. В своей книге « Необнаружение и анализ данных» Деннис Хелсель выступает за использование отрицательного значения концентрации вместо времени (для того, чтобы справиться с необнаружениями, которые при отрицании становятся цензурированными справа ценностями). Краткий обзор доступен в Интернете (формат pdf), и пакет R, NADA , реализует это.


+1, спасибо за указание на пакет NADA. Я заметил, что это облегчает обработку данных, подвергнутых левой цензуре, с помощью пакета на выживание. Является ли левая цензура общим сценарием с данными об окружающей среде?
АРС

@whuber: Спасибо за комментарий, пакет NADA выглядит очень интересно.
Юк

@ Энди: Спасибо за ссылки. Я думаю, что стоит быть ответом. Я бы проголосовал.
Юк

@Yuk, по твоей просьбе я превратил свой комментарий в ответ, и @whuber спасибо за твой пример.
Энди W

@ars: Да, левая цензура характерна для данных об окружающей среде (и является основной проблемой хемометрики в целом). Это сложная и интересная проблема. Среди причин: (1) пределы цензуры сами определяются статистическими оценками (посредством процесса калибровки), (2) цензура может происходить несколькими способами - как пределы обнаружения, пределы количественного определения или «пределы отчетности», ( 3) пороговые значения часто меняются в ответ на ковариаты («матричные помехи»), которые могут быть сильно коррелированы с исходными цензурированными значениями, (4) данные часто распределяются логнормально.
whuber

4

Что касается шкалы возраста и времени, то у chl есть несколько хороших ссылок и в нем собраны основные сведения, в частности, требование, чтобы набор риска содержал достаточное количество предметов всех возрастов, как это было бы в продольном исследовании.

Я хотел бы только отметить, что пока нет общего консенсуса по этому поводу, но есть некоторые литературные источники, которые указывают, что в некоторых случаях предпочтение следует отдавать возрасту в качестве шкалы времени. В частности, если у вас есть ситуация, когда время не накапливается одинаково для всех субъектов, например, из-за воздействия какого-то токсичного материала, тогда возраст может быть более подходящим.

С другой стороны, вы можете обработать этот конкретный пример на временной модели Кокса PH, используя возраст как изменяющийся во времени ковариат, а не фиксированный ковариат во время запуска. Вам нужно подумать о механизме, лежащем в основе вашего объекта исследования, чтобы выяснить, какая шкала времени является более подходящей. Иногда стоит сопоставить обе модели с существующими данными, чтобы увидеть, есть ли расхождения и как их можно объяснить, прежде чем приступить к разработке нового исследования.

Наконец, очевидное различие в анализе этих двух факторов заключается в том, что на возрастной шкале интерпретация выживания относится к абсолютной шкале (возрасту), тогда как на временной шкале она относится к дате начала / начала исследования. ,


3

По запросу ОП, вот еще одно приложение, которое я видел, анализ выживания, используемый в пространственном контексте (хотя он явно отличается от измерения веществ окружающей среды, упомянутых Уабером) - моделирование расстояния между событиями в пространстве. Вот один пример в криминологии, а вот один в эпидемиологии .

Причина использования анализа выживаемости для измерения расстояния между событиями, по-видимому, не является проблемой цензуры (хотя цензура может определенно происходить в пространственном контексте), в большей степени это связано с аналогичным распределением времени между характеристиками события и расстоянием между событиями. характеристики (т. е. они имеют схожие типы структур ошибок (часто затухание расстояний), которые нарушают МНК, и поэтому непараметрические решения идеальны для обоих).


Из-за моей плохой практики цитирования мне пришлось потратить час и найти правильную ссылку / ссылку на ссылку выше.

Для примера в криминологии,

Кикучи, Джордж, Мамору Амемия, Томонори Сайто, Такахито Симада и Ютака Харада. 2010. Пространственно-временной анализ почти повторной виктимизации в Японии . 8-я Национальная конференция по картированию преступности. Джил Дандо Институт криминалистики. PDF в настоящее время доступен на указанной веб-странице.

В эпидемиологии,

Читатель, Стивен. 2000. Использование анализа выживаемости для изучения пространственных точек в географической эпидемиологии. Общественные науки и медицина 50 (7-8): 985-1000.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.