контекст
Я пытаюсь понять, как R coxph () принимает и обрабатывает повторяющиеся записи для субъектов (или пациента / клиента, если вы предпочитаете). Некоторые называют это длинным форматом, другие называют это «повторными измерениями».
Посмотрите, например, набор данных, который включает столбец идентификатора в разделе Ответы по адресу:
Лучшие пакеты для моделей Кокса с изменяющимися во времени ковариатами
Также предположим, что ковариаты меняются во времени, и существует ровно одна переменная цензора (то есть события), которая является двоичной.
Вопросов
1) В ответе вышеупомянутой ссылки, если ID не указан в качестве параметра при вызове coxph (), должны ли результаты быть такими же, как включение кластера (ID) в качестве параметра в coxph ()?
Я попытался найти документацию, но следующее, похоже, не совсем понятно (1): https://stat.ethz.ch/pipermail/r-help//2013-July/357466.html
2) Если ответ на (1) «нет», то (математически) почему? Кажется, cluster () в coxph () ищет корреляции между субъектами в соответствии с подразделом 'cluster' на pg. 20 в
https://cran.r-project.org/web/packages/survival/survival.pdf
3) Неясный вопрос: как coxph () с повторными измерениями сравнивается с регрессионными методами R-хрупкого пакета?
Addenda
Следующие советы по использованию кластера (ID):
Есть ли повторная мера в курсе версии теста logrank?
как делает:
https://stat.ethz.ch/pipermail/r-help//2013-July/357466.html
Подход GEE: добавьте «+ cluster (subject)» к утверждению модели в coxph. Подход смешанных моделей: добавьте «+ (1 | subject)» к стату модели в coxme.
Заранее спасибо!