Я думаю, что тесты на нормальность могут быть полезны в качестве дополнения к графическим экзаменам. Они должны быть использованы правильно, хотя. По моему мнению, это означает, что многие популярные тесты, такие как тесты Шапиро-Уилка, Андерсона-Дарлинга и Жар-Бера, никогда не должны использоваться.
Прежде чем я объясню свою точку зрения, позвольте мне сделать несколько замечаний:
- В недавней интересной статье Rochon et al. изучал влияние теста Шапиро-Вилка на t-критерий с двумя образцами. Двухэтапная процедура проверки на нормальность перед проведением, например, t-теста, не без проблем. С другой стороны, также не существует двухэтапной процедуры графического исследования нормальности перед проведением t-теста. Разница заключается в том, что влияние последнего гораздо сложнее исследовать (так как для этого требуется статистик, чтобы графически исследовать нормальность раз или около того ...).100,000
- Полезно количественно оценить ненормальность , например, путем вычисления асимметрии образца, даже если вы не хотите выполнять формальный тест.
- Многомерную нормальность может быть трудно оценить графически, и сходимость к асимптотическим распределениям может быть медленной для многомерной статистики. Поэтому тесты на нормальность более полезны в многомерной среде.
- Тесты на нормальность, возможно, особенно полезны для практиков, которые используют статистику как набор методов черного ящика . Когда нормальность отклоняется, практикующий врач должен встревожиться и вместо того, чтобы выполнять стандартную процедуру, основанную на допущении нормальности, рассмотреть возможность использования непараметрической процедуры, применения преобразования или консультации с более опытным статистиком.
- Как указывалось другими, если достаточно велико, CLT обычно спасает день. Однако то, что является «достаточно большим», отличается для разных классов распределений.n
(В моем определении) тест на нормальность направлен против класса альтернатив, если он чувствителен к альтернативам из этого класса, но не чувствителен к альтернативам из других классов. Типичными примерами являются тесты, направленные на перекос или куртотические альтернативы. Простейшие примеры используют асимметрию выборки и эксцесс в качестве статистики теста.
Направленные тесты нормальности, вероятно, часто предпочтительнее, чем омнибусные тесты (такие как тесты Шапиро-Уилка и Жарке-Бера), поскольку обычно для некоторых процедур логического вывода важны только некоторые типы ненормальностей .
Давайте рассмотрим t-критерий Стьюдента в качестве примера. Предположим, что у нас есть iid-образец из дистрибутива с асимметрией и (избыточным) эксцессомЕсли симметричен относительно своего среднего значения, . И и равны 0 для нормального распределения.γ=E(X−μ)3σ3κ=E(X−μ)4σ4−3.Xγ=0γκ
При предположениях регулярности мы получаем следующее асимптотическое разложение для cdf тестовой статистики :
TnP(Tn≤x)=Φ(x)+n−1/216γ(2x2+1)ϕ(x)−n−1x(112κ(x2−3)−118γ2(x4+2x2−3)−14(x2+3))ϕ(x)+o(n−1),
где - это cdf, а - это pdf стандартного нормального распределения.Φ(⋅)ϕ(⋅)
γ появляется впервые в термине , тогда как появляется в термине . Асимптотическая производительность гораздо более чувствительны к отклонениям от нормальности в виде перекоса , чем в виде эксцесса.n−1/2κn−1 Т пTn
С помощью моделирования можно проверить, что это верно и для малых . Таким образом, t-критерий Стьюдента чувствителен к асимметрии, но относительно устойчив к тяжелым хвостам, и разумно использовать критерий нормальности, направленный на асимметрию альтернатив, до применения t-теста .n
Как правило ( не закон природы), вывод о средствах чувствителен к асимметрии, а вывод о дисперсиях чувствителен к эксцессу.
Использование направленного теста на нормальность имеет преимущество в получении большей силы против «опасных» альтернатив и меньшей мощности против менее «опасных» альтернатив, а это означает, что мы с меньшей вероятностью отклоним нормальность из-за отклонений от нормальности, которые выиграли не влияет на производительность нашей логической процедуры. Ненормальность количественно определяется таким образом, который имеет отношение к рассматриваемой проблеме. Это не всегда легко сделать графически.
По мере того как становится больше, асимметрия и эксцесс становятся менее важными - и направленные тесты, вероятно, обнаружат, отклоняются ли эти величины от 0 даже на небольшую величину. В таких случаях представляется разумным, например, проверить, является ли или (глядя на первое слагаемое раскрытия выше) а не . Это решает некоторые проблемы, с которыми мы в противном случае сталкиваемся, когда становится больше.n|γ|≤1|n−1/216γ(2z2α/2+1)ϕ(zα/2)|≤0.01
γ=0n