Оценки «Приблизительно нормально» для t-тестов

Я проверяю равенство средств, используя t-критерий Уэлча. Базовое распределение далеко от нормального (более искажено, чем пример в соответствующем обсуждении здесь ). Я могу получить больше данных, но хотел бы найти принципиальный способ определить, в какой степени это сделать.

Существует ли хорошая эвристика для оценки приемлемости распределения выборки? Какие отклонения от нормы являются наиболее касающимися?
Существуют ли другие подходы, например, основанные на доверительном интервале начальной загрузки для выборочной статистики, которые имеют больше смысла?

— cohoz
источник

Это большой вопрос. Помимо проверки нормальности "по существу бесполезно"? (уже связаны), еще два связанных вопроса: Как выбрать t-критерий или непараметрический критерий, например, Уилкоксон в небольших выборках? и Т-критерий для ненормального, когда N> 50? Хороший ответ на этот вопрос будет потенциально полезен для читателей этих двух связанных вопросов.

— Серебряная

Насколько я знаю, нет никаких принципиальных способов определить, сколько данных вам нужно, чтобы распределение было "достаточно нормальным". Это связано с тем, что определение «достаточно нормально» сложно определить, и оно будет зависеть от того, насколько ненормальным является базовое распределение, в дополнение к тому, как вы отклоняетесь от нормальности. Если у вас есть серьезно ненормальные данные, я бы просто использовал непараметрический тест. Недостатком является то, что вы не сможете получить доверительные интервалы, которые являются более полезными, чем тесты одиночной гипотезы.

— dsaxton

Я согласен с тем, что «достаточно нормально» определить сложно, но каждый практикующий должен сделать оценку, прежде чем рассуждать об эмпирических данных, поэтому я удивлен, как мало дискуссий мне удалось раскрыть (возможно, я смотрю в неправильных местах) , Для случаев использования, которые я здесь имею в виду (которые кажутся достаточно распространенными), непараметрические тесты неудовлетворительны по сравнению со сбором большего количества данных для обеспечения «достаточно нормального» распределения выборки.

— cohoz

Поскольку t- тест предполагает нормальность, а ваши базовые распределения не являются нормальными, не может быть принципиального способа определить, что выборочное распределение является приемлемым. Однако, когда размер выборки становится «большим», включается центральная предельная теорема, и вы можете использовать z-критерий большой выборки, который, по сути, даст вам тот же ответ, что и t -тест, поскольку t приближается к нормальному распределению с большие образцы.

Книги / курсы статистики часто подразумевают, что при выборке 25 или 30 CLT вступает в игру полезным способом. Тем не менее, по моему опыту, даже при размерах выборки в сотнях больших z-тестов выборка все еще может быть довольно плохой (например, с данными подсчета).

На мой взгляд, тест на перестановку хорошо подходит для вашей задачи. Он должен иметь одинаковую или лучшую мощность, чем стандартные непараметрические тесты (например, Манн-Уитни), и вам не нужно беспокоиться о проблеме нормальности. И они весело писать.

— Тим
источник