Традиционно статистический вывод преподается в контексте вероятностных выборок и характера ошибки выборки. Эта модель является основой для проверки значимости. Однако есть и другие способы моделирования систематических отклонений от случайности, и оказывается, что наши параметрические (основанные на выборке) тесты, как правило, являются хорошим приближением к этим альтернативам.
Параметрические проверки гипотез полагаются на теорию выборки для получения оценок вероятной ошибки. Если выборка данного размера берется из популяции, знание систематического характера выборки делает тестирование и доверительные интервалы значимыми. Для популяции теория выборки просто не актуальна, а тесты не имеют смысла в традиционном смысле. Вывод бесполезен, нечего выводить, есть только вещь ... сам параметр.
Некоторые обходят это, обращаясь к суперпопуляциям, которые представляет текущая перепись. Я считаю эти обращения неубедительными - параметрические тесты основаны на вероятностной выборке и ее характеристиках. Популяция в данный момент времени может быть выборкой большей популяции во времени и месте. Тем не менее, я не вижу способа, чтобы можно было обоснованно утверждать, что это случайная (или, в более общем случае, любая форма вероятностной) выборки. Без вероятностной выборки теория выборки и традиционная логика тестирования просто не применимы. С таким же успехом вы можете протестировать на основе удобного образца.
Ясно, что для того, чтобы принять тестирование при использовании совокупности, нам нужно отказаться от основы этих тестов в процедурах отбора проб. Один из способов сделать это - распознать тесную связь между нашими теоретико-выборочными тестами, такими как t, Z и F, и процедурами рандомизации. Рандомизационные тесты основаны на имеющейся выборке. Если я собираю данные о доходах мужчин и женщин, вероятностная модель и основа для наших оценок ошибок - это повторяющиеся случайные распределения фактических значений данных. Я мог бы сравнить наблюдаемые различия между группами с распределением на основе этой рандомизации. (Кстати, мы делаем это все время в экспериментах, где случайная выборка из популяционной модели редко подходит).
Теперь оказывается, что теоретико-выборочные тесты часто являются хорошими приближениями рандомизированных тестов. Таким образом, в конечном счете, я думаю, что тесты от групп населения полезны и значимы в этой структуре и могут помочь отличить систематическое от случайного отклонения - как и в случае тестов на основе выборок. Используемая для этого логика немного отличается, но она не сильно влияет на практическое значение и использование тестов. Конечно, может быть лучше просто использовать рандомизацию и тесты перестановок напрямую, учитывая, что они легко доступны со всеми нашими современными вычислительными возможностями.