Почему асимптотическая относительная эффективность теста Уилкоксона


13

Хорошо известно, что асимптотическая относительная эффективность (ARE) критерия Уилкоксона со знаком ранга равна 3π0.955по сравнению стстудента , если данные получены из нормально распределенной популяции. Это верно как для базового теста с одним образцом, так и для варианта с двумя независимыми образцами (Уилкоксон-Манн-Уитни U). Это также АР теста Крускала-Уоллиса по сравнению с ANOVA F -тестом для нормальных данных.

Есть ли у этого замечательного (для меня, одного из « самых неожиданных явлений π ») и удивительно простого результата проницательное, замечательное или простое доказательство?


Учитывая появление π в нормальном СГО, появление π в ARE не должно быть действительно все , что удивительно. Я рискну ответить, но чтобы найти хороший ответ, потребуется время.
Glen_b

1
@Glen_b Действительно - я видел обсуждение «почему π появляется так много в статистике» раньше (хотя не могу вспомнить, было ли это в резюме или нет) и «из-за нормального распределения», которое я знаю, всплывает много, но 3/π все еще приятно удивляет, когда вы впервые видите это. Для сравнения, ARE критерия Манна-Уитни против двух выборок равно 3 для экспоненциальных данных, 1,5 для двойной экспоненциальной и 1 для равномерной - намного более округлый!
Серебряная рыба

1
@ Silverfish Я связал страницу 197 ван дер Ваарта "Асимптотическая статистика". Для одного образца знаковые тесты имеют ARE 2/π относительно t-критерия.
Хашаа

1
@ Серебряная рыба ... и по логистике это (π/3)2 . Существует довольно много хорошо известных ARE (в одном или двух примерах), включающих π и довольно много простых соотношений целых чисел.
Glen_b

1
Для критерия ранга со знаком одной выборки он равен 3/π . Для теста с одним образцом это 2/π . Итак, мы уточнили нашу позицию. Я думаю, что это хороший знак.
Хашаа

Ответы:


10

Краткий эскиз ARE для t теста с одним образцом , подписанный тест и тест со знаком ранга

Я ожидаю, что длинная версия ответа @ Glen_b включает в себя подробный анализ теста с двумя выборками со знаком ранга и интуитивное объяснение ARE. Поэтому я пропущу большую часть вывода. (случай с одним образцом, вы можете найти недостающие детали в Lehmann TSH).

Задача тестирования : Пусть X1,,Xn - случайная выборка из модели местоположения f(xθ) , симметричная относительно нуля. Мы должны вычислить ARE знакового теста, знакового рангового теста для гипотезы H0:θ=0 относительно t-критерия.

Чтобы оценить относительную эффективность тестов, рассматриваются только локальные альтернативы, потому что последовательные тесты имеют тенденцию к 1 против фиксированной альтернативы. Локальные альтернативы, которые приводят к нетривиальной асимптотической степени, часто имеют вид для фиксированногоh, которыйв некоторых литературахназываетсядрейфом Питмана.θn=h/nh

Наша задача впереди

  • найти предельное распределение каждой тестовой статистики под нулевым
  • найти предельное распределение каждой тестовой статистики по альтернативе
  • вычислить локальную асимптотическую мощность каждого теста

Проверка статистики и асимптотики

  1. t-критерий (при наличии ) t n = σt n =
    tn=nX¯σ^dN(0,1)under the null
    tn=nX¯σ^dN(h/σ,1)under the alternative θ=h/n
    • поэтому тест, который отклоняет, если имеет асимптотическую степенную функцию 1 - Φ ( z α - h 1tn>zα
      1Φ(zαh1σ)
  2. подписанный тест Sn=1ni=1n1{Xi>0}
    n(Sn12)dN(0,14)under the null 
    и имеет локальную асимптотическую степень 1 - Φ ( z α - 2 h f ( 0 ) )
    n(Sn12)dN(hf(0),14)under the alternative 
    1Φ(zα2hf(0))
  3. Тест подписал ранга W n d N ( 2 h f 2 , 1
    Wn=n2/3i=1nRi1{Xi>0}dN(0,13)under the null 
    и имеет локальную асимптотическую степень 1 - Φ ( z α -
    WndN(2hf2,13)under the alternative 
    1Φ(zα12hf2)

Следовательно, A

ARE(Sn)=(2f(0)σ)2
Еслиf- стандартная нормальная плотность,ARE(Sn)=2/π,ARE(Wn)=3/π
ARE(Wn)=(12f2σ)2
fARE(Sn)=2/πARE(Wn)=3/π

fARE(Sn)=1/3ARE(Wn)=1/3

Замечание о выводе распределения по альтернативе

Есть, конечно, много способов получить предельное распределение по альтернативе. Один общий подход заключается в использовании третьей леммы Ле Кама. Упрощенная версия этого гласит

ΔnWn

(Wn,Δn)dN[(μσ2/2),(σW2ττσ2/2)]
under the null, then
WndN(μ+τ,σW2)under the alternative

For quadratic mean differentiable densities, local asymptotic normality and contiguity are automatically satisfied, which in turn implies Le Cam lemma. Using this lemma, we only need to compute cov(Wn,Δn) under the null. Δn obeys LAN

Δnhni=1nl(Xi)12h2I0
where l is score function, I0 is information matrix. Then, for instance, for signed test Sn
cov(n(Sn1/2),Δn)=hcov(1{Xi>0},ff(Xi))=h0f=hf(0)

+1 I wasn't going to go into quite this much detail (indeed, with your answer covering things quite nicely already, I probably won't add anything to what I have now) so if you want to put more detail, don't hold back on my account. I would have been several days yet (and still for less than you have already), so it's a good thing you came in.
Glen_b -Reinstate Monica

This is a nice answer particularly for adding in Le Cam's lemma (+1). It seems to me there is quite a big jump between establishing the asymptotics in 1, 2, and 3, and the "therefore" bit where you write the AREs. I think if I were writing this up, I'd define asymptotic efficiency at this point (or maybe earlier, so the upshot of points 1, 2 and 3 would be the AEs not just local asymptotic powers in each case) and then the step to the AREs would be much easier for future readers to follow.
Silverfish

Perhaps it is worth specifying your H1? One-sided and two-sided cases have different-looking asymptotic powers (though they lead to the same AREs).
Silverfish

Feel free to edit my answer or append it to the OP.
Khashaa

1
@Khashaa Thanks. I shall edit your post when I have the right stuff in front of me. Would you mind clarifying the meaning of the in the final equation?
Silverfish

6

This has nothing to do with explaining why π appears (which was explained nicely by others) but may help intuitively. The Wilcoxon test is a t-test on the ranks of Y whereas the parametric test is computed on the raw data. The efficiency of the Wilcoxon test with respect to the t-test is the square of the correlation between the scores used for the two tests. As n the squared correlation converges to π3. You can easily see this empirically using R:

n <- 1000000; x <- qnorm((1:n)/(n+1)); cor(1:n, x)^2; 3/pi
[1] 0.9549402
[1] 0.9549297
n <- 100000000; x <- qnorm((1:n)/(n+1)); cor(1:n, x)^2; 3/pi
[1] 0.9549298
[1] 0.9549297

This is indeed a very helpful comment. Is it slightly conceptually closer to do n <- 1e6; x <- rnorm(n); cor(x, rank(x))^2 (which obviously produces the same result)?
Silverfish


something I don't understand about this answer is that the correlation is higher for lower values of n (I think the proximal reason is that we don't see the tails very well for smaller n). Naively that implies that the relative efficiency of the Wilcoxon is higher for small n, which surprises me ... ?? (I might do some simulations, but (a) if there's an easy answer ... and (b) am I missing a conceptual point somewhere?)
Ben Bolker

To my recollection the small sample efficiency of both the Wilcoxon signed rank test and the W-M-W are a bit lower than the asymptotic value on shift alternatives at the normal distribution.
Glen_b -Reinstate Monica

5

Short version: The basic reason with the Wilcoxon-Mann-Whitney under a shift alternative is that finding the asymptotic relative efficiency (WMW/t) corresponds to evaluating 12σ2[f2(x)dx]2 where f is the common density at the null and σ is the common variance.

So at the normal, f2 is effectively a scaled version of f; its integral will have a 1π term; when squared, that's the source of the π.

The same term - with the same integral - is involved in the ARE for the signed rank test, so it takes the same value.

For the sign test relative to t, the ARE is 4σ2f(0)2... and f(0)2 again has a π in it.

So essentially it's as I said in comments; π is in the ARE for the Wilcoxon-Mann-Whitney vs the two-sample t test, for the Wilcoxon signed rank test vs the one-sample t and the sign test vs the one-sample t test (in each case at the normal) quite literally because it appears in the normal density.

Reference:

J. L. Hodges and E. L. Lehmann (1956),
"The Efficiency of Some Nonparametric Competitors of the t-Test",
Ann. Math. Statist., 27:2, 324-335.


I like the explanation for the intuition for the appearance of π in the denominator; is it essentially coincidence that the Renyi entropy turns up in the WMW/Wilcoxon integrals?
Silverfish

@Silverfish That f2dx turns up is certainly not coincidence. However, that's not because that's connected to Rényi entropy, or at least I don't see any direct connection. We're getting into stuff I don't really know about now, though.
Glen_b -Reinstate Monica

@Silverfish It's only a Renyi entropy for α=2. Otherwise, it is just a plain old square that can come up in a million different ways.
abalter
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.