Это дополнительный вопрос к тому, что Фрэнк Харрелл написал здесь :
По моему опыту, требуемый размер выборки для точного распределения t часто больше, чем размер выборки под рукой. Тест на звание ранга Уилкоксона чрезвычайно эффективен, как вы сказали, и он надежен, поэтому я почти всегда предпочитаю его тесту t
Если я правильно понимаю - при сравнении местоположения двух несопоставленных выборок мы предпочли бы использовать критерий суммы рангов Уилкоксона по сравнению с непарным t-тестом, если размеры наших выборок невелики.
Существует ли теоретическая ситуация, когда мы предпочли бы критерий суммы рангов Уилкоксона, а не непарный t-критерий, даже если размеры выборки в наших двух группах относительно велики?
Моя мотивация для этого вопроса проистекает из наблюдения, что для одного выборочного t-критерия использование его для не очень малой выборки асимметричного распределения приведет к неправильной ошибке типа I:
n1 <- 100
mean1 <- 50
R <- 100000
P_y1 <- numeric(R)
for(i in seq_len(R))
{
y1 <- rexp(n1, 1/mean1)
P_y1[i] <- t.test(y1 , mu = mean1)$p.value
}
sum(P_y1<.05) / R # for n1=n2=100 -> 0.0572 # "wrong" type I error