Существует ли простая версия теста эквивалентности теста Колмогорова – Смирнова?


13

Были ли сформулированы два односторонних критерия эквивалентности (TOST) для критерия Колмогорова – Смирнова, чтобы проверить отрицательную гипотезу отрицателя о том, что два распределения отличаются , по крайней мере, по некоторому уровню, указанному исследователем?

Если не TOST, то какая-то другая форма теста на эквивалентность?

Ник Стаунер мудро указывает, что (я уже должен знать;), что существуют другие непараметрические тесты эквивалентности TOST для нулевых гипотез для стохастической эквивалентности и, с более ограничительными предположениями, для медианной эквивалентности.


Ответы:


9

Хорошо, вот моя первая попытка. Внимательное изучение и комментарии приветствуются!

Гипотезы с двумя выборками
Если мы можем сформулировать двусторонние односторонние тесты гипотез Колмогорова-Смирнова с нулевыми и альтернативными гипотезами по следующим направлениям:

H 0F Y ( t )F X ( t ) и0FY(t)FX(t)

H AF Y ( t ) < F X ( t ) , по меньшей мере, для одного t , где:AFY(t)<FX(t)t

  • тестовая статистика D=|mint(FY(t)FX(t))| соответствует H 0F Y ( t )F X ( t ) ;0FY(t)FX(t)

  • тестовая статистика D+=|maxt(FY(t)FX(t))|соответствует H 0F Y ( t )F X ( t ) ; и0FY(t)FX(t)

  • FY(t) иFX(t) -эмпирические CDFобразцовY иX ,

тогда было бы разумно создать общую гипотезу интервала для теста эквивалентности по этим направлениям (предполагая, что интервал эквивалентности является симметричным на данный момент):

H - 0| F Y ( t ) - F X ( t ) | Δ и0|FY(t)FX(t)|Δ

H - A| F Y ( t ) - F X ( t ) | < Δ , по крайней мере, для одного т .A|FY(t)FX(t)|<Δt

Это выразится в конкретных два односторонних «негативистской» гипотезы нуль для теста эквивалентности (эти две гипотезы принимают ту же форму, так как D+ и D строго неотрицательное):

H - 01D +Δ или01D+Δ

H - 02D -Δ .02DΔ

Отклонение как H - 01 и H - 02 привело бы к выводу , что - Δ < Р У ( т ) - Р Х ( т ) < Δ . Конечно, не нужно интервал эквивалентности быть симметричными, а - Δ и Δ могут быть заменен А 2 (нижним) и А 1 (верхним) для соответствующих односторонних гипотез нуля.01 02Δ<FY(t)FX(t)<ΔΔΔΔ2Δ1

Статистика теста (Обновлено: Delta находится вне знака абсолютного значения)
Статистика теста и D - 2 (без явных n Y и n X ) соответствуют H - 01 и H - 02 соответственно и составляют:D1+D2nYnX0102

, иD1+=ΔD+=Δ|maxt[(FY(t)FX(t))]|

D2=ΔD=Δ|mint[(FY(t)FX(t))]|

Эквивалентность / Порог актуальности
интервал -ил [ Δ 2 , Δ 1 ] , при использовании асимметричной эквивалентности интервал-выражаются в единицах D + и D - , или величин разностных вероятностей. Когда n Y и n X приближаются к бесконечности, CDF D + или D - для n Y , n X приближается к 0 для t[Δ,Δ][Δ2,Δ1]D+DnYnXD+DnY,nX0 , а для t 0 :t<0t0

limnY,nXp+=P(nYnXnY+nXD+t)=1e2t2

CDF of $D^{+}$ (or $D^{-}$)

Таким образом, мне кажется, что PDF для масштабированной по размеру выборки (или масштабированной по размеру выборки D - ) должен быть 0 для t < 0 и для t 0 :D+D0t<0t0

f(t)=1e2t2ddt=4te2t2

PDF of $D^{+}$ (or $D^{-}$)

Glen_b указывает, что это распределение Рэлея с . Таким образом, функция квантиля большой выборки для масштабированных по размеру выборокD+иD-это:σ=12D+D

CDF1=Q(p)=ln(1p)2

and a liberal choice of Δ might be the critical value Qα+σ/2=Qα+14, and a more strict choice the critical value Qα+σ/4=Qα+18.


1
In the line where you pass from the cdf to the pdf, I think you got that wrong. Let KnY,nX=nYnXnY+nXD+, so (abusing notation), in the limit P(K,t)=1e2t2. Then fK(t)=ddt1e2t2=4te2t2 (note the t after the 4). (note also a missing sign in the exponent in the line above the taking of the derivative. Also I'm not sure why you have an integral symbol there, but maybe I misunderstood something.)
Glen_b -Reinstate Monica

2
@stochazesthai D1 and D2 are two one-sided test statistics. Per TOST you need to reject both the null hypotheses to which these test statistics apply. Qα is a critical value from CDF1 on the above line, and where you want to sub in 1α for p (e.g. Qα=ln(1(1α))2). The choice of Δ depends on how far past Qα (the critical rejection value for a plain old positivist H0) you need to go, before you conclude relevant difference (e.g. liberal 'equivalence' is 14 σ beyond Qα).
Alexis

2
@stochazesthai (Continuing) So if both D1Δ and D2Δ, then you reject H0.
Alexis

2
@stochazesthai Whoops! I should have put the quotes around the word liberal rather than equivalence two comments back. :)
Alexis

2
@stochazesthai If D1Δ, then reject H01, if D1<Δ, then fail to reject H01. If D2Δ, then reject H02, if D2<Δ, then fail to reject H02. If reject both H01 and H02, then reject H0, otherwise fail to reject H0.
Alexis

6

An alternative to TOST in equivalence testing is based on the confidence interval approach:

Let Δ denote the prespecified equivalence margin and

θ:=supt|FX(t)FY(t)|
the Kolmogorov-Smirnov distance between the unknown underlying distribution functions.

Now, if a 90% confidence interval for θ is completely within [Δ,Δ], then we may be 95% certain that θ is enough close to 0 to speak of "equivalence".

Without knowing the underlying distributions, it seems to be hopeless to derive an approximate analytic confidence interval, so we might need to rely on (bias corrected) bootstrap confidence intervals based on resampling from pairs X and Y. (I don't want to find conditions for their validity in this particular application though...)


Excellent. Do you have a citation for anyone undertaking the CI of Dn1,n2 (bootstrap or otherwise)?
Alexis

1
Good point... The short paper tomswebpage.net/images/K-S_test.doc mentions the "Handbook of Parametric and Nonparametric Statistical Procedures, Fifth Edition by David J.Sheskin (Apr 27, 2011)." to offer a two-sample case construcion for D. But at the moment, I don't have access to this book.
Michael M
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.