Давайте идти вперед и убить священную корову на 5%.
Вы (правильно) указали, что проблема заключается в чрезмерной силе теста. Возможно, вы захотите перекалибровать его в сторону более релевантной силы, как, например, более традиционное значение 80%:
- Определите размер эффекта, который вы хотите обнаружить (например, смещение 0,2%)
- Определитесь с мощностью, которая достаточно хороша для вас, чтобы она не была подавлена (например,1 - β= 80 % )
- Вернитесь к существующей теории теста Пирсона, чтобы определить уровень, который сделает ваш тест практическим.
Предположим, у вас есть 5 категорий с равными вероятностями, , и ваша альтернатива - . Таким образом, для , . Асимптотическое распределение является нецентральным хи-квадратом с (# category-1) = 4 df и параметром нецентральности
При этом большое значение , это достаточно близко к . 80% -й коэффициент равенp + δ / √п1= р2= р3= р4= р5= 0,2р + δ/ н--√= ( 0,198 , 0,202 , 0,2 , 0,2 , 0,2 )п = 106δ= ( - 2 , + 2 , 0 , 0 , 0 )к =
λ = ∑Jδ2J/ рJ= 4 / 0,2 + 4 / 0,2 = 40
λ44 + 13 ⋅ Ф - 1 ( 0,8 ) = 44 + 13 ⋅ 0,84 = 54,91 χ 2 4 Р г ö б [ χ 2 4 > 54.91 ] = 3,3 ⋅ 10 - 11N( μ = λ + k = 44 , σ2= 2 ( k + 2 λ ) = 168 )44 + 13 ⋅ Ф- 1( 0,8 ) = 44 + 13 ⋅ 0,84 = 54,91, Следовательно, желаемый уровень теста - обратный хвост cdf из из 54.91:
Так что это будет уровень, который вы должны Рассмотрите возможность тестирования ваших данных, чтобы они могли на 80% обнаружить разницу в 0,2%.
χ24П р о б [ х24> 54,91 ] = 3,3 ⋅ 10- 11
(Пожалуйста, проверьте мою математику, это нелепый уровень теста, но это то, что вы хотели с вашими большими данными, не так ли? С другой стороны, если вы регулярно видите Pearson в диапазоне пары сто, это может быть совершенно значимым критическим значением для развлечения.)χ2
Имейте в виду, однако, что аппроксимации, как для нулевого, так и для альтернативного, могут плохо работать в хвостах, см. Это обсуждение .