Существуют ли «эзотерические» статистические тесты с очень низкой мощностью?

Фон

В информатике, математике, а иногда и в других областях «эзотерические» примеры могут быть не только занимательными, но и полезными для иллюстрации некоторых понятий, например:

Bogosort и Slowsort являются очень неэффективными алгоритмами сортировки, которые можно использовать для понимания свойств алгоритмов, в частности, по сравнению с другими алгоритмами сортировки.
Эзотерические языки программирования демонстрируют, насколько далеко заходит концепция языка программирования, и помогают оценить хорошие языки программирования.
Функции Вейерштрассы и функция Дирихле , прежде всего , находят применение , чтобы проиллюстрировать некоторые неверные представления о концепции непрерывности.

В настоящее время я готовлю некоторые учения по использованию тестов гипотез и думаю, что наличие теста с очень низкой мощностью (но без других недостатков) поможет проиллюстрировать концепцию статистической мощности. (Конечно, я все еще должен решить сам, является ли данный пример дидактически полезным для моей аудитории или просто сбивает с толку.)

Актуальный вопрос

Существуют ли какие-либо статистические тесты с преднамеренно низкой мощностью, а именно:

Тест вписывается в общую структуру проверки гипотез, то есть он работает с нулевой гипотезой, имеет требования и возвращает (правильное) значение p .
Это не предназначено / предложено для серьезного применения.
Он имеет очень низкую мощность (из-за преднамеренного недостатка конструкции, а не из-за низкой выборки или размера эффекта).

Если вы в принципе можете утверждать, что такой тест не может существовать, я также считаю это правильным ответом на мой вопрос. С другой стороны, если существует множество таких тестов, меня интересует наиболее дидактически эффективный, то есть он должен быть легко доступным и иметь поразительный эффект.

Обратите внимание, что я не прошу общий выбор статистических ошибок (сбор вишни и т. Д.) Или аналогичных.

Что я нашел до сих пор

Поиски в интернете мне ничего не дали.

Каждая попытка создать нечто подобное заканчивалось либо каким-либо (полезным) существующим тестом, либо форматом не является обычный тест. Например, я подумал о проверке, имеет ли популяция положительную медиану, которая возвращает только да, если все выборки положительны; но этот тест не возвращает значение p и, следовательно, не вписывается в обычную структуру теста. Если я просто посчитаю положительные и отрицательные знаки как статистику теста (и вычислю значения p соответственно), я получу тест знака , который является разумным тестом.

hypothesis-testing teaching humor

— Wrzlprmft
источник

Будучи более математическими, «эзотерические» примеры (которых предостаточно) имеют тенденцию быть конкретными контрпримерами к распространенным недоразумениям; ряд учебников содержат такие примеры. В своем нынешнем виде ваш вопрос по сути является вопросом типа «большой список» и поэтому он слишком широкий (хотя вы должны заметить, что несколько пользователей пришли к выводу, что вопрос неясен); если вы можете уточнить свой вопрос и сузить сферу его применения, он может лучше соответствовать сайту.

— Glen_b

Низкая мощность по сравнению с чем? Леманн привел пример обобщенного теста отношения правдоподобия, который имел меньшую мощность при любой альтернативной гипотезе, чем при нулевой.

— Scortchi - Восстановить Монику

t

$t$

Я выкопаю газету Лемана, когда буду за компьютером. Мощность теста при нулевом значении - это просто размер теста.

— Scortchi - Восстановить Монику

Пример теста, использовавшегося в классе, в котором я учился (много лет назад), был «бросить честный 20-гранный кубик и отказаться, если вы бросили 1» (как часть обсуждения кривых мощности). Это, конечно, полностью игнорирует данные, но является «действительным» тестом в том смысле, что он не имеет более высокий, чем желаемый уровень ошибок типа I (который составлял 5% в контексте, в котором был приведен пример).

— Glen_b

Ответы:

E ϕ (X) = α

$\operatorname{E}\phi(X)=\alpha$

ϕ (x) = {\begin{cases} 0 & when f_{0} (x) < k f_{1} (x) \\ 1 & when f_{0} (x) > k f_{1} (x) \end{cases}

$\phi(x) = \begin{cases} 0\ & \text{when $f_0(x) < kf_1(x)$} \\ 1\ & \text{when $f_0(x) > kf_1(x)$} \end{cases}$

α

$\alpha$

ϕ

$\phi$

H_{0} :

$H_0:$

f_{0}

$f_0$

H_{1} :

$H_1:$

f_{1}

$f_1$

x

$x$

Из этого результата вы можете получить одинаково наименее мощные, локально наименее мощные, равномерно наименее мощные аналогичные и наименее мощные «полностью предвзятые» тесты (я имею в виду тесты с меньшей мощностью при любой альтернативе, чем при нулевом). Если у вас уже есть самый мощный, и т.д. test, просто умножьте свою статистику теста на -1, чтобы сохранить разбиение пробного пространства, которое оно вызывает, изменяя порядок секционирования.

Возможно, как предполагает @ user54038, «сбой общего метода построения теста» может быть более интересным. Lehmann (1950), "Некоторые принципы теории проверки статистических гипотез", Ann. Математика Statist. , 21 , 1, приписывает следующий пример Штейну:

$X$ $0, \pm 1, \pm 2$

$\begin{array}{rccccc} - 2 & 2 & - 1 & 1 & 0 \\ Hypothesis H : & \frac{α}{2} & \frac{α}{2} & \frac{1}{2} - α & \frac{1}{2} - α & α \\ Alternatives: & p C & (1 - p) C & \frac{1 - C}{1 - α} (\frac{1}{2} - α) & \frac{1 - C}{1 - α} (\frac{1}{2} - α) & α \frac{1 - c}{1 - α} \end{array}$ $\begin{array}{r c c c c c} & -2 & 2 & -1 & 1 & 0 \\ \hline \text{Hypothesis $H$:} & \frac{\alpha}{2} & \frac{\alpha}{2} & \frac{1}{2} - \alpha & \frac{1}{2} - \alpha & \alpha\\ \hline \text{Alternatives:} & pC & (1-p)C & \frac{1-C}{1-\alpha}\left(\frac{1}{2}-\alpha\right) & \frac{1-C}{1-\alpha}\left(\frac{1}{2}-\alpha\right) & \alpha\frac{1-c}{1-\alpha}\\ \end{array}$ $\alpha$ $C$ $0 < \alpha \leq \frac{1}{2}$ $\frac{\alpha}{2-\alpha}< C <\alpha$ $p$ $[0,1]$

$H$ $\alpha$ $X=\pm2$ $C$ $C<\alpha$ $\alpha$ $X$

$p$ $X=-2$ $X=2$ $\hat p=1$ $\hat p=0$ $\frac{2C}{\alpha}$ $X$ $\frac{1-C}{1-\alpha}$

— скортчи
источник

(Связано с комментарием @Scortchi)

$X \sim N(\mu, 1)$

\begin{aligned} H_{0} & : μ = 0 \\ H_{1} & : μ \neq 0 \end{aligned}

$\begin{align*} H_0&: \mu = 0 \\ H_1&: \mu \neq 0 \end{align*}$

$Z \sim Bernoulli(p)$ $p$ $\alpha$ $p \in [\alpha, 1]$

R = {(X, Z) | z = 1 \land | x | > Φ^{- 1} (\frac{α}{2 p})}

$R = \left\{(X, Z) \ | \ z = 1 \ \wedge |x| > \Phi^{-1}\left(\frac{\alpha}{2p}\right) \right\}$

$\alpha$

\begin{aligned} P (X \in R | μ = 0) & = P (Z = 1, | X | > Φ^{- 1} (\frac{α}{2 p})) \\ = P (Z = 1) P (| X | > Φ^{- 1} (\frac{α}{2 p})) \\ = p \frac{α}{p} = α \end{aligned}

$\begin{align*} P(X\in R \ | \ \mu=0) &= P\left(Z=1 \ , \ |X| > \Phi^{-1}\left(\frac{\alpha}{2p}\right)\right) \\ &= P(Z=1)P\left(|X| > \Phi^{-1}\left(\frac{\alpha}{2p}\right)\right) \\ &= p\frac{\alpha}{p} = \alpha \end{align*}$

$p$ $(x, z) = (1000000, 0)$ $p=\alpha$ $X$ $\alpha$

$Z$

— оборота кнрумси
источник

S

$S$

Z = 1 (S < F_{S}^{- 1} (p))

$Z=\boldsymbol{1}(S<F_S^{-1}(p))$

F_{S} (\cdot)

$F_S(\cdot)$

S

$S$