Простой ответ - взвешивание. То есть вы можете использовать весовые коэффициенты для стандартизации групп в «принятой» группе по интересующему населению. Проблема, которая возникает из-за использования таких весов в объединенном анализе с использованием как первого, так и второго двухлетних этапов, заключается в том, что оценочные веса населения и параметры теперь зависят. Обычно используется подход псевдослучайности (в данном случае это будет своего рода псевдо-частичная вероятность), когда вы игнорируете зависимость между весами выборки и оценками параметров. Однако во многих практических обстоятельствах (и это ничем не отличается) учет этой зависимости необходим. Вопрос создания эффективной оценки коэффициентов опасности является сложным, и, насколько я знаю, открытым.
Усовершенствованная оценка Хорвица-Томпсона параметров модели двухфазных стратифицированных образцов: приложения в эпидемиологии .
В статье рассматриваются методы опроса, обычно применяемые в логистической регрессии, однако вы также можете взвесить данные о выживаемости. Некоторые важные соображения, о которых вы забыли упомянуть, касаются того, заинтересованы ли вы в создании прогноза, который применим ко всему населению, или к «подходящей» совокупности на основе двухлетних оценок, или к «соответствующей» совокупности на основе результирующей модель. Вы также не упомянули, как именно такая модель «прогнозирования» создается из модели Кокса, так как подгонянные значения из модели Кокса нельзя интерпретировать как риски. Я предполагаю, что вы оцениваете коэффициенты опасности, а затем получаете сглаженную оценку базовой функции риска.