Хорошо, вот моя первая попытка. Внимательное изучение и комментарии приветствуются!
Гипотезы с двумя выборками
Если мы можем сформулировать двусторонние односторонние тесты гипотез Колмогорова-Смирнова с нулевыми и альтернативными гипотезами по следующим направлениям:
H 0 : F Y ( t ) ≥ F X ( t ) и0: FY(t)≥FX(t)
H A : F Y ( t ) < F X ( t ) , по меньшей мере, для одного t , где:A: FY(t)<FX(t)t
тестовая статистика D−=|mint(FY(t)−FX(t))| соответствует H 0 : F Y ( t ) ≥ F X ( t ) ;0: FY(t)≥FX(t)
тестовая статистика D+=|maxt(FY(t)−FX(t))|соответствует H 0 : F Y ( t ) ≤ F X ( t ) ; и0: FY(t)≤FX(t)
FY(t) иFX(t) -эмпирические CDFобразцовY иX ,
тогда было бы разумно создать общую гипотезу интервала для теста эквивалентности по этим направлениям (предполагая, что интервал эквивалентности является симметричным на данный момент):
H - 0 : | F Y ( t ) - F X ( t ) | ≥ Δ и−0: |FY(t)−FX(t)|≥Δ
H - A : | F Y ( t ) - F X ( t ) | < Δ , по крайней мере, для одного т .−A: |FY(t)−FX(t)|<Δt
Это выразится в конкретных два односторонних «негативистской» гипотезы нуль для теста эквивалентности (эти две гипотезы принимают ту же форму, так как D+ и D− строго неотрицательное):
H - 01 : D + ≥ Δ или−01: D+≥Δ
H - 02 : D - ≥ Δ .−02: D−≥Δ
Отклонение как H - 01 и H - 02 привело бы к выводу , что - Δ < Р У ( т ) - Р Х ( т ) < Δ . Конечно, не нужно интервал эквивалентности быть симметричными, а - Δ и Δ могут быть заменен А 2 (нижним) и А 1 (верхним) для соответствующих односторонних гипотез нуля.−01 −02−Δ<FY(t)−FX(t)<Δ−ΔΔΔ2Δ1
Статистика теста (Обновлено: Delta находится вне знака абсолютного значения)
Статистика теста и D - 2 (без явных n Y и n X ) соответствуют H - 01 и H - 02 соответственно и составляют:D+1D−2nYnX−01−02
, иD+1=Δ−D+=Δ−|maxt[(FY(t)−FX(t))]|
D−2=Δ−D−=Δ−|mint[(FY(t)−FX(t))]|
Эквивалентность / Порог актуальности
интервал -ил [ Δ 2 , Δ 1 ] , при использовании асимметричной эквивалентности интервал-выражаются в единицах D + и D - , или величин разностных вероятностей. Когда n Y и n X приближаются к бесконечности, CDF D + или D - для n Y , n X приближается к 0 для t[−Δ,Δ][Δ2,Δ1]D+D−nYnXD+D−nY,nX0 , а для t ≥ 0 :t<0t≥0
limnY,nX→∞p+=P(nYnXnY+nX−−−−−−−−√D+≤t)=1−e−2t2
Таким образом, мне кажется, что PDF для масштабированной по размеру выборки (или масштабированной по размеру выборки D - ) должен быть 0 для t < 0 и для t ≥ 0 :D+D−0t<0t≥0
f(t)=1−e−2t2ddt=4te−2t2
Glen_b указывает, что это распределение Рэлея с . Таким образом, функция квантиля большой выборки для масштабированных по размеру выборокD+иD-это:σ=12D+D−
CDF−1=Q(p)=−ln(1−p)2−−−−−−−−−−√
and a liberal choice of Δ might be the critical value Qα+σ/2=Qα+14, and a more strict choice the critical value Qα+σ/4=Qα+18.