Как проверить медиану населения?

У меня есть образец 250 единиц. Распределение асимметрично. Я хочу проверить гипотезу о том, что медиана популяции отличается от 3,5, поэтому я думаю, что тест с одной выборкой будет уместным. Я знаю, что критерий ранга Уилкоксона не подходит, потому что распределение не симметрично. Подходит ли тест знака? Если это не так, может кто-нибудь порекомендовать какой-либо другой тест?

hypothesis-testing median

— LeonRupnik
источник

Вы потеряли меня на первой линии по нескольким причинам. (1) Образец не может иметь гауссово распределение (но может приблизительно иметь его). (2) Одной из характеристик всех гауссовских распределений (и, следовательно, приближений к ним) является симметрия . Вы противоречили себе. Описывая свои данные в своих собственных терминах, а не в статистическом жаргоне, вы будете лучше передавать то, что имеете. Не могли бы вы также объяснить, насколько это возможно, что вы действительно хотите достичь с помощью ваших данных? Какую информацию вам может дать «образец теста на основе медианы»?

— whuber

Медиана образца - то, что это; не было бы необходимости проверять это. Возможно, вы хотите проверить, равна ли медиана популяции (из которой получена выборка)

? Если это так, важно знать, как было разработано значение

. Возможно, это краткое изложение какого-то другого набора данных? Или это какое-то заранее определенное число, например, стандарт качества?

3.5

$3.5$

3.5

$3.5$

— whuber

Это заранее определенное число

— LeonRupnik

« Распределение асимметрично, поэтому я хочу проверить гипотезу, если медиана популяции отличается от 3,5 ...» - Почему асимметрия в выборке влияет на то, какая гипотеза интересна?

$\:$ « Является ли тест знака приемлемым для использования? » - конечно, но (по крайней мере, в исходной форме) он основан на преемственности - вам нужно адаптировать его, если ваша переменная дискретна (вы не говорите, из чего состоят ваши данные) ,

— Glen_b

Данные непрерывны

— LeonRupnik

конспект

$3.5$ $p$ $p=1/2$ $p\ne 1/2$

Остальная часть этого поста объясняет базовую модель и показывает, как выполнять вычисления. Он предоставляет рабочий Rкод для их выполнения. Подробное изложение основной теории проверки гипотез приведено в моем ответе на вопрос: «Что означают значения p и значения t в статистических тестах?». ,

Статистическая модель

$3.5$ $1/2=50\%$ $3.5$ $3.5$ $250$ $3.5$ $(250,1/2)$ $k$

$3.5$ $3.5$ $1/2$

Нахождение подходящего теста

$k$ $1/2$ $250$ $125$ $125$ $0$ $250$ $125$ $3.5$

$\alpha$ $\alpha$ $k$

$3.5$ $\alpha/2$ $k$ $\alpha/2$ $k$ $k$

Технически, есть два распространенных способа выполнить вычисление: вычислить биномиальные вероятности или приблизить их с помощью нормального распределения.

Расчет с биномиальными вероятностями

Используйте функцию процента (квантиль). В R, например, это называется qbinomи будет вызываться как

alpha <- 0.05 # Test size
c(qbinom(alpha/2, 250, 1/2)-1, qbinom(1-alpha/2, 250, 1/2)+1)

$\alpha=0.05$

109 141

$k$ $0$ $109$ $k$ $141$ $250$ Rk

pbinom(109, 250, 1/2) + (1-pbinom(141-1, 250, 1/2))

$0.0497$ $\alpha$ $\alpha$

Расчет с нормальным приближением

$(250, 1/2)$ $250\times 1/2=125$ $250\times 1/2\times (1-1/2) = 250/4$ $\sqrt{250/4}\approx 7.9$ $\alpha/2=0.05/2$ $-1.95996$ R

qnorm(alpha/2)

$0.05/2$ $+1.95996$ $k$ $1.95996$ $125$ $125 \pm 7.9\times 1.96 \approx 109.5, 140.5$

250*1/2 + sqrt(250*1/2*(1-1/2)) * qnorm(alpha/2) * c(1,-1)

$k$ $109$ $141$ $p$ $1/2$ $0$ $1$ $\alpha$

Этот тест, поскольку он не предполагает ничего о населении (за исключением того, что он не имеет большой вероятности, ориентированной прямо на его медиану), не так силен, как другие тесты, которые делают конкретные предположения о населении. Если тест, тем не менее, отклоняет ноль, нет необходимости беспокоиться о нехватке мощности. В противном случае вы должны сделать несколько деликатных компромиссов между тем, что вы готовы принять, и тем, что вы можете сделать о населении.

— Whuber
источник

Поскольку это практически рабочий пример вашего довольно более абстрактного ответа « значение p-значения », не только в поддержке той же философии, но и в том, как структурирован ваш ответ, я думаю, что вы должны связать его («Пример как это применяется на практике, можно узнать из моего ответа на ... ") в заключении вашего ответа там.

— Серебряная рыба

@ Серебро Спасибо; это действительно приходило мне в голову. Я думал, что мог бы немного подождать сначала. Среди прочего, я не удивлюсь, если какой-нибудь предприимчивый член сообщества выкопает дублирующую ветку, которую я хотел бы изучить более подробно. В конце концов, это основной материал - множество вопросов о биномиальных тестах. Единственная претензия, которую он предъявляет к тому, чтобы быть новой, - это то, что он прибыл сюда для проверки на медиану - так что с самого начала это был не так явно биномиальный тест - и единственное утверждение, что мой ответ должен быть достойным чтение лежит в его усилиях, чтобы объяснить каждый шаг.

— whuber