Как проверить, отличается ли среднее значение подгруппы от общей группы, в которую входит подгруппа?


9

Как я могу проверить, отличается ли среднее значение (например, артериальное давление) подгруппы (например, тех, кто умер) от всей группы (например, всех, у кого было заболевание, включая тех, кто умер)?

Ясно, что первый является подгруппой второго.

Какой тест гипотезы я должен использовать?


Вы тестируете разницу средств?
Макро

Ответы:


9

Как отмечает Майкл, при сравнении подгруппы с общей группой исследователи обычно сравнивают подгруппу с подгруппой общей группы, которая не включает подгруппу.

Подумайте об этом таким образом.

Если - доля умерших, а - доля умерших , ип1-п

Икс¯,знак равнопИкс¯d+(1-п)Икс¯a

гдеявляется общим средним значением, является средним из тех, кто умер, а является средним из тех, кто еще жив. затемИкс¯,Икс¯dИкс¯a

Икс¯dИкс¯a
тогда и только тогда, когда

Икс¯dИкс¯,

Предположим, что . Следовательно, .Иксd¯Иксa¯Икс,¯пИксd¯+(1-п)Иксd¯знак равноИксd¯

Предположим, . Следовательно, , затем и поскольку , то . ¯ Х dр ¯ Х д +(1-р) ¯ Х (1-р) ¯ Х d(1-р) ¯ Х (1-р)0 ¯ Х d ¯ X aИкс,¯Иксd¯Иксd¯пИксd¯+(1-п)Иксa¯(1-п)Иксd¯(1-п)Иксa¯(1-п)0Иксd¯Иксa¯

То же самое можно сделать для неравенства.

Таким образом, исследователи обычно проверяют разницу между подгруппой и подмножеством общей группы, которая не включает подгруппу. Это показывает, что подгруппа отличается от общей группы. Это также позволяет использовать обычные методы, такие как t-критерий независимых групп.


1
Re: «Вы должны сравнить подгруппу с подмножеством общей группы, которая не включает в себя подгруппу» - да, это способ сделать это, но он задает немного другой вопрос - он тестирует мертвых против не мертвых, когда по- видимому, OP хочет проверить разницу средств между мертвыми и кому - то , чей смертность статус неизвестен, так что я не уверен , что должен это правильное слово. Вы можете проверить разницу в средних между подмножеством и группой в целом, если учесть ковариацию между и В стандартном расчете ошибок. ¯ х .Икс¯dИкс¯,
Макро

@ Макро хорошая мысль. Спасибо. Я немного изменил формулировку на «типично исследователи ...»
Jeromy Anglim

@Marco. Спасибо за комментарий. Но как вычисляется ковариация и из не спаренных групп (подгрупп и группы)? ˉ XИкс¯dИкс¯
Джордано

@JeromyAnglim Я не думаю, что вам нужно "как правило". Если мы напишем то, что вы написали, в нотации заполнения (например, mu вместо x-bars) и изучим нулевую и альтернативную гипотезы, используя тот же аргумент, который вы указали, проверка того, что mu отличается от mu_d, идентична проверке mu_a, а не mu_d. Таким образом, выполнение t-теста с двумя образцами всегда правильно. Таким образом, вместо того, чтобы обычно говорить: «Это эквивалентно проведению этого теста с t-тестом с двумя образцами»
Ричард ДиСальво,

2

Чтобы проверить здесь, нужно сравнить тех, кто заболел и умер, с теми, кто заболел и не умер. Вы можете применить t-критерий из двух выборок или критерий суммы рангов Уилкоксона, если нормальность не может быть принята.


Вы можете быть более конкретным? что за два образца t-теста? непарный т-тест? Я думал, что для теста t, вы принимаете независимость и нормальность.
user1061210

1
Когда группы раздельные, как мы и предполагали, образцы независимы. T-тест будет непарным, потому что подгруппы не обязательно должны быть равными, и не существует естественного способа сопряжения выборок, даже если размеры выборок были равны. Я упоминал критерий Уилкоксона, потому что предположение о нормальности может быть неверным, а критерий Уилкоксона не требует нормальности.
Майкл Р. Черник

0

Что вам нужно сделать, это проверить пропорции населения (большой размер выборки). Статистические данные о доле населения часто имеют большой размер выборки (n => 30), поэтому нормальное распределение аппроксимации и соответствующие статистические данные используются для определения критерия того, соответствует ли доля выборки (артериальное давление умерших) доле населения (каждый). у кого было заболевание, в том числе и тех, кто умер).

То есть, когда размер выборки больше или равен 30, мы можем использовать статистику z-показателя, чтобы сравнить пропорцию выборки с долей населения, используя значение p-hat стандартного отклонения выборки, чтобы оценить стандартное отклонение выборки, p если не известно.

Распределение выборки P (пропорции) приблизительно нормальное со средним или ожидаемым значением, E (P) = p-hat и стандартная ошибка, сигма (r) = sqrt (p * q / n).

Ниже приведены вероятные вопросы гипотезы теста, которые можно задать при сравнении двух пропорций:

  1. (Двусторонний тест)

H0: p-hat = p против H1: p-hat не равен p

  1. (Тест с правым хвостом)

H0: p-hat = p против H1: p-hat> p

  1. (Тест левого хвоста)

H0: p-hat = p против H1: p-hat <p

Статистика, используемая для проверки большого размера выборки:

Статистика теста связана со стандартным нормальным распределением:

Статистика z-показателя для пропорций

п-HAT-P / SQRT (рд / п)

где p = оценка доли, q = 1-p и доля населения.

Пропорция означает:

np / n = p-hat = x / n

Среднеквадратичное отклонение:

= sqrt (npq / n) = sqrt (pq / n)

Правила принятия решений:

Тест с верхним хвостом (): (H0: P-hat> = P)

Примите H0, если Z <= Z (1-альфа)

Отклонить H0, если Z> Z (1-альфа)

Тест с нижним хвостом (Ha: P-hat <= P):

Примите H0, если Z> = Z (1-альфа)

Отклонить H0, если Z

Двусторонний тест (Ха: P-шляпа не равна P):

Примите H0, если Z (альфа / 2) <= Z <= Z (1-альфа / 2)

Отклонить H0, если Z <Z (альфа / 2) или если Z> Z (1-альфа / 2)

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.