Почему t-тест необходим, если у нас есть z-тест?

9

Может кто-нибудь дать объяснение, почему t-тест «происходит»? Меня учили пользоваться t-тестом, когда вы не знаете стандартное отклонение популяции (т.е. вы знаете только стандартное отклонение вашей выборки), но я не уверен, почему это отличает его от z-теста ,

hypothesis-testing t-test

— jasonbogd
источник

Я обновил ваш заголовок, чтобы ответить на вопрос, который, как мне кажется, вы задаете; не стесняйтесь редактировать, если я неправильно истолковал

— Jeromy Anglim

3

Я не думаю, что понимаю ваш вопрос полностью. Вы спрашиваете, почему вы бы использовали t-тест?

Если вы понимаете, почему вы используете z-тест, у вас должно быть хорошее представление о том, почему вы должны использовать t-тест. Для больших выборок z-тест и t-тест должны давать схожие или идентичные результаты. Но в то время как z-критерий предполагает нормальное распределение, t-критерий учитывает неопределенность в распределении выборки при меньших размерах выборки.

— Бенджамин Мако Хилл
источник

3

Хм-м t-критерий также предполагает нормальное распределение. Возможно, вы хотели сказать, что нам требуется меньше информации об этом распространении.

— JohnK

@JohnK Я не думаю, что имеет смысл говорить, что тест предполагает распределение в первую очередь, но я думаю, что Бенджамин имел в виду, что t-оценка / статистика предполагает T-распределение, а не Z-распределение.

— Датораки

3

Сам z-тест на самом деле является тестом отношения правдоподобия между вероятностью, предполагающей нулевую гипотезу, и вероятностью, предполагающей альтернативную гипотезу. Предполагая лежащие в основе нормальные распределения с известными дисперсиями и проверяя только средние значения, алгебра упрощается до z-критерия, который мы знаем и любим (DeGroot 1986, с. 442–447).

Используя ту же процедуру максимального правдоподобия, но рассматривая дисперсию как неизвестную, создаем другую пару правдоподобий и их отношение, а упрощение алгебры дает статистику: (DeGroot 1986, с. 485–489). Изменяемое тестовое распределение также изменяется, поскольку числитель вышеуказанной статистики обычно распределяется, , а знаменатель распределяется как квадратный корень из квадратов нормалей, , который является квадратным корнем из случайная величина хи-квадрат. Госсет (студент) показал, что если у вас есть случайная величина:

\frac{\sqrt{n} ({\bar{X}}_{n} - μ_{0})}{\sqrt{\frac{S_{n}^{2}}{n - 1}}}

$\frac{\sqrt{n}\left(\bar{X}_n - \mu_0\right)}{\sqrt{\frac{S^2_n}{n-1}}}$

\bar{X}

$\bar{X}$

S^{2}

$S^2$

Y \sim N (0, 1) Z \sim χ_{n}^{2} X \sim \frac{Y}{\sqrt{\frac{Z}{n}}}

$Y \sim N(0, 1)\\ Z \sim \chi^2_n\\ X \sim \frac{Y}{\sqrt{\frac{Z}{n}}}$ тогда X распределяется с t-распределением и n степенями свободы.

Таким образом, чтобы сформулировать это без строгости, t-тест является естественным результатом того же процесса отношения правдоподобия, который стоит за z-тестом, когда дисперсия данных сама по себе неизвестна и оценивается по максимальной вероятности.

ДеГрут, М.Х. Вероятность и статистика Addison-Wesley Publishing Company, 1986

— Авраам
источник

1

это было очень поучительно. Я полностью забыл, что t-тест прибывает из максимально вероятного

— Модерат

1

Не точный ответ заключается в том, что вы хотите использовать t-тест, когда у вас небольшое количество выборок из-за вероятности того, что выборки необычно близко друг к другу (относительно фактической дисперсии совокупности). В этом случае знаменатель в формуле для t-статистики будет необычайно мал, и поэтому сама t-статистика будет необычно большой. Таким образом, у вас гораздо больше шансов получить большое значение для t-stat, когда у вас есть небольшое количество выборок, чем для получения сравнительно большого z-stat, поэтому вам нужно большее значение, чтобы отклонить ноль, используя t-тест, чем z-тест на том же уровне значимости.

— Эван Райт
источник

Я считаю аргумент привлекательным, но, если подумать, неубедительным. В конце концов, если случайно образцы необычно далеко друг от друга (что должно происходить так же легко, как и необычно близко), то, похоже, та же самая логика приведет к противоположному выводу.

— whuber

0

$n$ $30$

Хороший обзор основных предположений и различий (и сходств) обоих тестов дан здесь:
http://www.le.ac.uk/bl/gat/virtualfc/Stats/ttest.html

— vonjd
источник