Я оставляю этот абзац, чтобы комментарии имели смысл: возможно, предположение о нормальности в исходных популяциях слишком ограничительно, и его можно отказаться от сосредоточения на распределении выборки, и благодаря центральной теореме о пределе, особенно для больших выборок.
T
Как вы упомянули, t-распределение сходится к нормальному распределению при увеличении выборки, поскольку этот быстрый график R демонстрирует:
T
Таким образом, применение z-теста, вероятно, будет хорошо с большими выборками.
Решение вопросов с моим первоначальным ответом. Спасибо, Glen_b за вашу помощь с ОП (вероятные новые ошибки в интерпретации полностью мои).
- Т СТАТИСТИКА СЛЕДУЕТ ПРИ РАСПРЕДЕЛЕНИИ ПРИ ПОЛОЖЕНИИ НОРМАЛЬНОСТИ:
Оставляя в стороне сложности в формулах для одной выборки против двух выборок (парных и непарных), общая t-статистика, сфокусированная на случае сравнения выборочного среднего со средним для популяции :
t-критерий = X¯- μsN√= Х¯- μσ/ н√s2σ2---√= Х¯- μσ/ н--√ΣNх = 1( Х- Х¯)2n - 1σ2--------√(1)
Иксμσ2
- ( 1 ) ∼ N( 1 , 0 )
- ( 1 )s2/ σ2n - 1∼ 1n - 1χ2n - 1( n - 1 ) с2/ σ2∼ χ2n - 1
- Числитель и знаменатель должны быть независимыми.
t-статистика ∼ t ( де= n - 1 )
- ЦЕНТРАЛЬНАЯ ПРЕДЕЛЬНАЯ ТЕОРЕМА:
Тенденция к нормальному распределению выборки означает, что при увеличении размера выборки можно оправдать предположение о нормальном распределении числителя, даже если популяция не является нормальной. Однако это не влияет на два других условия (распределение хи-квадрат знаменателя и независимость числителя от знаменателя).
Но не все потеряно, в этом посте обсуждается, как теорема Слуцкого поддерживает асимптотическую сходимость к нормальному распределению, даже если распределение ци знаменателя не выполняется.
- НАДЕЖНОСТЬ:
Савиловский С.С. и Блэр Р.К. в Психологическом бюллетене, 1992, т. 22, с. «Более реалистичный взгляд на свойства робастности и ошибки типа II критерия Стьюдента при отклонениях от нормальных условий населения» . 111, No. 2, 352–360 , где они тестировали менее идеальные или более «реальные» (менее нормальные) распределения для мощности и ошибок типа I, можно найти следующие утверждения: «Несмотря на консервативный характер в отношении типа В результате t-теста для некоторых из этих реальных распределений было мало влияния на уровни мощности для различных изученных условий обработки и размеров выборки. Исследователи могут легко компенсировать небольшую потерю мощности, выбрав немного больший размер выборки ». ,
« По-видимому, преобладающее мнение состоит в том, что t-тест независимых выборок является достаточно надежным, поскольку ошибки типа I связаны с негауссовой формой совокупности, если (а) размеры выборки равны или почти совпадают, (б) выборка размеры довольно велики (Boneau, 1960, упоминает размеры выборки от 25 до 30), и (c) тесты являются двусторонними, а не односторонними. Отметим также, что при выполнении этих условий различия между номинальной альфа и фактической альфой составляют встречаются несоответствия, как правило, консервативного, а не либерального характера ".
Авторы подчеркивают противоречивые аспекты этой темы, и я с нетерпением жду работы над некоторыми симуляциями, основанными на логнормальном распределении, как упомянул профессор Харрелл. Я также хотел бы предложить некоторые сравнения Монте-Карло с непараметрическими методами (например, U-критерий Манна-Уитни). Так что работа в процессе ...
МОДЕЛИРОВАНИЕ:
Отказ от ответственности: далее следует одно из этих упражнений, так или иначе «доказав это». Результаты не могут быть использованы для обобщения (по крайней мере, не мной), но я думаю, я могу сказать, что эти два (возможно, ошибочные) моделирования MC, кажется, не слишком обескураживающие относительно использования t-теста в данных обстоятельствах. описано.
Ошибка типа I:
n = 50μ = 0σ= 1
5 %4,5 %
На самом деле график плотности полученных t-тестов, похоже, перекрывает фактическое pdf t-распределения:
Самая интересная часть смотрела на «знаменатель» t-теста, часть, которая должна была следовать распределению хи-квадрат:
( n - 1 ) с2/ σ2= 98( 49( SD2A+ SD2A) ) / 98( еσ2- 1 )е2 μ + σ2
Здесь мы используем общее стандартное отклонение, как в этой записи в Википедии :
SИкс1Икс2= ( п1- 1 )S2Икс1+ ( н2- 1 )S2Икс2N1+ n2- 2----------------------√
И, как ни странно (или нет), сюжет был очень непохож на наложенный хи-квадрат pdf:
Ошибка типа II и мощность:
10 мм рт.ст. (SD примерно 9 мм рт.ст. был выбран):
Проведение сравнительных t-тестов на симуляции, аналогичной Монте-Карло, которая аналогична ошибкам типа I между этими фиктивными группами, и с уровнем значимости 5 % мы заканчиваем с 0,024 % ошибки типа II, и сила только 99 %,
Код здесь .