Кривая выживания Каплана-Мейера должна иметь в виду, что она в основном носит описательный характер, а не выводится . Это просто функция данных, за которой скрывается невероятно гибкая модель. Это сила, потому что это означает, что нет практически никаких предположений, которые могут быть нарушены, но есть слабость, потому что это трудно обобщить, и что это соответствует как «шуму», так и «сигналу». Если вы хотите сделать вывод, то в основном вы должны представить нечто неизвестное, что вы хотите знать.
Теперь один из способов сравнить среднее время выживания - сделать следующие допущения:
- У меня есть оценка среднего времени выживания для каждого из состояний , заданного кривой Каплана-Мейера. яtii
- Я ожидаю, что истинное медианное время выживания, будет равно этой оценке. E ( T i | t i ) = t iTiE(Ti|ti)=ti
- Я на 100% уверен, что истинное среднее время выживания положительно. Pr(Ti>0)=1
Теперь «самым консервативным» способом использования этих допущений является принцип максимальной энтропии, поэтому вы получите:
p(Ti|ti)=Kexp(−λTi)
Где и выбраны так, что PDF нормализуется, и ожидаемое значение равно . Теперь у нас есть:λ t iKλti
= K [ - е х р ( - λ Т я )
1=∫∞0p(Ti|ti)dTi=K∫∞0exp(−λTi)dTi
E ( T i ) = 1=K[−exp(−λTi)λ]Ti=∞Ti=0=Kλ⟹K=λ
и теперь у нас есть
E(Ti)=1λ⟹λ=t−1i
И поэтому у вас есть набор распределений вероятностей для каждого состояния.
p(Ti|ti)=1tiexp(−Titi)(i=1,…,N)
Которые дают совместное распределение вероятностей:
p(T1,T2,…,TN|t1,t2,…,tN)=∏i=1N1tiexp(−Titi)
Похоже, вы хотите проверить гипотезу , где - среднее медианное время выживания. Суровая альтернативная гипотеза для проверки - гипотеза «каждое состояние - уникальная и красивая снежинка» потому что это наиболее вероятная альтернатива, и, таким образом, представляет информацию, потерянную при переходе к более простой гипотезе («минимаксный» тест). Мера доказательств против более простой гипотезы дается соотношением шансов:H0:T1=T2=⋯=TN=t¯t¯=1N∑Ni=1tiHA:T1=t1,…,TN=tN
O(HA|H0)=p(T1=t1,T2=t2,…,TN=tN|t1,t2,…,tN)p(T1=t¯,T2=t¯,…,TN=t¯|t1,t2,…,tN)
=[∏Ni=11ti]exp(−∑Ni=1titi)[∏Ni=11ti]exp(−∑Ni=1t¯ti)=exp(N[t¯tharm−1])
где
tharm=[1N∑i=1Nt−1i]−1≤t¯
это среднее гармоническое. Обратите внимание, что шансы всегда будут благоприятствовать идеальной подгонке, но не намного, если среднее время выживания достаточно близко. Кроме того, это дает вам прямой способ изложить доказательства этого конкретного теста гипотезы:
допущения 1-3 дают максимальные шансы против равного среднего времени выживания во всех штатахO(HA|H0):1
Объедините это с правилом принятия решений, функцией потерь, функцией полезности и т. Д., Которая говорит о том, как выгодно принять более простую гипотезу, и вы получите свой вывод!
Нет ограничений на количество гипотез, на которые вы можете проверить, и на которые вы можете рассчитывать. Просто измените чтобы указать другой набор возможных «истинных значений». Вы можете сделать «проверку значимости», выбрав гипотезу как:H0
HS,i:Ti=ti,Tj=T=t¯(i)=1N−1∑j≠itj
Так что эта гипотеза устно «состояние у отличается медиана выживаемости, но все остальные состояния одинаковы». А затем повторите расчет коэффициента шансов, который я сделал выше. Хотя вы должны быть осторожны с альтернативной гипотезой. Любой из перечисленных ниже является «разумным» в том смысле, что это могут быть вопросы, на которые вы заинтересованы ответить (и они, как правило, будут иметь разные ответы)i
- мой определенный выше - насколько хуже по сравнению с идеальной посадкой? H S , яHAHS,i
- мой определенный выше - насколько лучше по сравнению со средним соответствием? H S , яH0HS,i
- другой - насколько состояние «более отличается» по сравнению с состоянием ? K IHS,kki
Теперь одна вещь, которая была здесь упущена, это корреляции между состояниями - эта структура предполагает, что знание средней выживаемости в одном штате ничего не говорит вам о средней выживаемости в другом состоянии. Хотя это может показаться «плохим», его нетрудно улучшить, и приведенные выше расчеты являются хорошими начальными результатами, которые легко рассчитать.
Добавление связей между состояниями изменит модели вероятности, и вы фактически увидите некоторое «объединение» медианного времени выживания. Одним из способов включения корреляций в анализ является разделение истинного времени выживания на две составляющие: «общая часть» или «тренд» и «индивидуальная часть»:
Ti=T+Ui
А затем ограничьте отдельную часть средним нулем по всем единицам и неизвестной дисперсией чтобы интегрировать ее, используя предварительное описание того, что вы знаете об индивидуальной изменчивости, перед наблюдением данных (или джефриса, если вы ничего не знаю, и наполовину коучи, если джефри вызывает проблемы). σUiσ