Я хочу вычислить значение p, чтобы отклонить H0 на уровне значимости α тогда и только тогда, когда p <α; доказывая, что мое население нормально распределено.
Нормальное распределение возникает, когда данные генерируются серией аддитивных событий iid (см. Изображение quincunx ниже). Это означает отсутствие обратной связи и никакой корреляции. Похоже ли это на процесс, который приводит ваши данные? Если нет, то это, вероятно, не нормально.
Существует вероятность того, что тип процесса может происходить в вашем случае. Самое близкое к тому, что вы можете «доказать», это собрать достаточно данных, чтобы исключить любые другие дистрибутивы, которые могут придумать люди (что, вероятно, не практично). Другой способ состоит в том, чтобы вывести нормальное распределение из некоторой теории наряду с некоторыми другими предсказаниями. Если данные соответствуют всем им, и никто не может придумать другого объяснения, то это было бы хорошим доказательством в пользу нормального распределения.
https://en.wikipedia.org/wiki/Bean_machine
Теперь, если вы не ожидаете какого-либо конкретного распространения априори, все же может быть разумно использовать нормальное распределение для обобщения данных, но признайте, что это по сути выбор из-за незнания ( https://en.wikipedia.org/wiki/ Principle_of_maximum_entropy ). В этом случае вы не хотите знать, нормально ли распределено население, скорее вы хотите знать, является ли нормальное распределение разумным приближением для вашего следующего шага.
В этом случае вы должны предоставить свои данные (или сгенерированные данные, которые похожи) вместе с описанием того, что вы планируете делать с ними, а затем спросить: «Каким образом допущение нормальности в этом случае может ввести меня в заблуждение?»