Каковы стандартные статистические тесты, чтобы увидеть, соответствуют ли данные экспоненциальному или нормальному распределению?
Каковы стандартные статистические тесты, чтобы увидеть, соответствуют ли данные экспоненциальному или нормальному распределению?
Ответы:
Кажется, вы пытаетесь решить, моделировать ли ваши данные с помощью нормального или экспоненциального распределения. Это кажется мне несколько странным, так как эти дистрибутивы сильно отличаются друг от друга.
Нормальное распределение является симметричным, тогда как экспоненциальное распределение сильно смещено вправо, без отрицательных значений. Обычно выборка из экспоненциального распределения будет содержать много наблюдений, относительно близких к и несколько аберраций, которые отклоняются далеко вправо от . Эту разницу часто легко увидеть графически.0
Вот пример, где я смоделировал наблюдений из нормального распределения со средним и дисперсией и экспоненциального распределения со средним и дисперсией :2 4 2 4
Симметрия нормального распределения и асимметрии экспоненты можно увидеть с помощью гистограмм, коробчатых диаграмм и диаграмм рассеяния, как показано на рисунке выше.
Еще один очень полезный инструмент - QQ-сюжет . В приведенном ниже примере точки должны приблизительно следовать линии, если образец взят из нормального распределения. Как видите, это относится к нормальным данным, но не к экспоненциальным данным.
Если вам по какой-то причине графического исследования недостаточно, вы все равно можете использовать тест, чтобы определить, является ли ваше распределение нормальным или экспоненциальным. Поскольку нормальное распределение - это семейство масштабов и местоположений, вам нужно использовать тест, который является инвариантным при изменении масштаба и местоположения (т. Е. Результат теста не должен изменяться, если вы измените свои измерения с дюймов на сантиметры или добавите на все ваши наблюдения).
Когда нулевая гипотеза состоит в том, что распределение является нормальным, а альтернативная гипотеза состоит в том, что оно является экспоненциальным, наиболее мощный критерий определения местоположения и масштаба задается статистикой где - среднее значение по выборке, - наименьшее наблюдение в выборке, а - стандартное отклонение по выборке. Нормальность отклоняется в пользу экспоненциальности, если слишком велико.ˉ x x(1)sTE,N
Этот тест на самом деле является односторонней версией теста Граббса на выбросы . Вы найдете, что это реализовано в большинстве статистических программ (но убедитесь, что вы используете правильную версию - есть несколько альтернативных статистик теста, используемых для теста на выбросы!).
Ссылка на являющуюся наиболее мощным тестом: раздел 4.2.4 « Проверка на нормальность » Х. К. Тода.
Для экспоненциального распределения вы можете использовать тест, называемый тестом Морана или Бартлетта. Тестовая статистика включает выборочное среднее значение а также выборочное среднее значение зарегистрированных При нулевой гипотезе мы имеем приблизительно и двусторонний тест работает. Этот тест разработан против гамма-альтернатив.¯ Y ¯ log Y Y i B n = b n × { log ˉ Y - ¯ log Y } B n ∼ χ 2 ( n - 1 )
См. KC Kapur и LR Lamberson. Надежность в проектировании . Wiley 1977.
Для нормальности Андерсон-Дарлинг и Шапиро-Вилк считаются лучшими. Для экспоненциального теста Лиллерфорса разработан специально для него.
Рассматривали ли вы графические методы, чтобы увидеть, как ведут себя данные?
Методы вероятностного графа обычно включают ранжирование данных, применение обратного CDF и последующее отображение результатов на декартовой плоскости. Это позволяет увидеть, отклоняются ли несколько значений от предполагаемого распределения, и, возможно, объяснить причину отклонения.