С помощью начальной загрузки я вычисляю значения p тестов значимости, используя два метода:
- повторная выборка в соответствии с нулевой гипотезой и подсчет результатов, по крайней мере, таких же экстремальных, как исход исходных данных
- повторная выборка в соответствии с альтернативной гипотезой и подсчет результатов, по крайней мере, столь же далеких от первоначального результата, как и значение, соответствующее нулевой гипотезе
Я полагаю, что 1- й подход является полностью правильным, поскольку он следует определению значения ap. Я менее уверен насчет второго, но обычно он дает очень похожие результаты и напоминает мне тест Вальда.
Я прав? Оба метода верны? Они идентичны (для больших образцов)?
Примеры для двух методов (редактирование после вопросов DWin и ответа Эрика):
Пример 1. Давайте создадим тест начальной загрузки, похожий на два примера T-теста. Метод 1 произведет повторную выборку из одного образца (полученного путем объединения двух оригиналов). Метод 2 будет повторной выборки из обоих образцов независимо.Пример 2. Построим загрузочный тест корреляции между x₁… xₐ и y₁… yₐ. Метод 1 не предполагает корреляции и повторной выборки с учетом (xₑ, yₔ) пар, где e ≠ ə. Метод 2 скомпилирует загрузочный образец исходных (x, y) пар.
Пример 3. Давайте создадим тест начальной загрузки, чтобы проверить, честна ли монета. Метод 1 создаст случайную выборку с настройкой Pr (head) = Pr (tail) = ½. Метод 2 повторно пробует образец экспериментальных значений головы / хвоста и сравнивает пропорции с ½.