У вас нет оснований утверждать, что ваши данные в норме. Даже если ваша асимметрия и избыточный эксцесс равны нулю, это не значит, что ваши данные в норме. Хотя асимметрия и эксцесс, далекий от ожидаемых значений, указывают на ненормальность, обратное утверждение не выполняется. Существуют ненормальные распределения, которые имеют ту же асимметрию и эксцесс, что и нормальные. Пример обсуждается здесь , плотность которого приводится ниже:
Как видите, это отчетливо бимодально. В этом случае распределение является симметричным, поэтому до тех пор, пока существуют достаточные моменты, типичная мера асимметрии будет 0 (в действительности все обычные меры будут). Для эксцессов, вклад в 4-е моменты из области, близкой к среднему, будет способствовать уменьшению эксцесса, но хвост является относительно тяжелым, что приводит к его увеличению. Если вы правильно выберете, эксцесс получается с тем же значением, что и для нормального.
Ваша выборочная асимметрия на самом деле составляет около -0,5, что говорит о легкой левой асимметрии. Ваша гистограмма и график QQ указывают на одно и то же - умеренно левостороннее распределение. (Такая легкая асимметрия вряд ли будет проблемой для большинства обычных процедур нормальной теории.)
Вы смотрите на несколько различных индикаторов ненормальности, с которыми не стоит соглашаться априори , так как они учитывают различные аспекты распределения; с небольшими слегка ненормальными образцами они часто не соглашаются.
Теперь о большом вопросе: * Почему вы тестируете на нормальность? *
[отредактировано в ответ на комментарии:]
Я не совсем уверен, я, хотя я должен, прежде чем делать ANOVA
Здесь нужно сделать несколько замечаний.
я. Нормальность - это допущение ANOVA, если вы используете его для вывода (например, проверки гипотез), но она не особенно чувствительна к ненормальности в больших выборках - легкая ненормальность не имеет большого значения, и по мере увеличения размеров выборки распределение может увеличиваться стать более ненормальным, и тест может быть затронут лишь незначительно.
II. Вы, кажется, проверяете нормальность ответа (DV). (Безусловное) распределение самого DV не предполагается нормальным в ANOVA. Вы проверяете невязки, чтобы оценить обоснованность предположения об условном распределении (то есть, это термин ошибки в модели, которая считается нормальной), т.е. вы, похоже, не смотрите на правильные вещи. Действительно, поскольку проверка выполняется для остатков, вы делаете это после подгонки модели, а не раньше.
III. Формальное тестирование может быть практически бесполезным. Интересующий нас вопрос «насколько сильно степень ненормальности влияет на мой вывод?», На которую тест гипотезы действительно не отвечает. По мере того, как размер выборки увеличивается, тест становится все более и более способным обнаруживать тривиальные отличия от нормальности, в то время как влияние на уровень значимости в ANOVA становится все меньше и меньше. То есть, если размер вашей выборки достаточно велик, тест нормальности в основном говорит о том, что у вас большой размер выборки, что означает, что вам не о чем беспокоиться. По крайней мере, с графиком QQ у вас есть визуальная оценка того, насколько это ненормально.
внутривенно при разумных размерах выборки другие предположения - такие как равенство дисперсии и независимости - обычно имеют гораздо большее значение, чем легкая ненормальность. Сначала беспокойтесь о других предположениях ... но опять же, формальное тестирование не отвечает на правильный вопрос
v. Выбор того, выполняете ли вы ANOVA или какой-либо другой тест, основанный на результатах теста на гипотезу, имеет тенденцию иметь худшие свойства, чем простое решение действовать так, как будто предположение не выполняется. (Существует множество методов, которые подходят для одностороннего анализа, подобного ANOVA, для данных, которые не считаются нормальными, которые вы можете использовать, когда не думаете, что у вас есть основания предполагать нормальность. Некоторые обладают очень хорошей силой на нормальном, и с приличным программным обеспечением нет причин избегать их.)
[Я думаю, что у меня была ссылка на этот последний пункт, но я не могу найти его прямо сейчас; если я найду это, я попытаюсь вернуться и вставить это]