Разница в средних и средних значениях


11

При изучении двух независимых выборочных средств нам говорят, что мы смотрим на «разницу двух средних». Это означает, что мы берем среднее значение из совокупности 1 ( ) и вычитаем из него среднее значение из совокупности 2 ( ). Итак, наша «разница двух средних» есть ( \ bar y_1 - \ bar y_2 ). ˉ у 2y¯1y¯2 ˉ у 2y¯1y¯2

При изучении парных выборочных средств нам говорят, что мы смотрим на «среднее различие», d¯ . Это рассчитывается по разности между каждой парой, а затем по среднему значению всех этих различий.

Мой вопрос: получаем ли мы то же самое ( y¯1 - y¯2 ) по сравнению с его d¯ если мы вычислили их по двум столбцам данных, и в первый раз посчитал, что это две независимые выборки, а во второй раз - в паре данные? Я поиграл с двумя столбцами данных, и кажется, что значения одинаковы! В таком случае, можно ли сказать, что разные имена используются только по неколичественным причинам?


2
Подумайте об этом так: как бы вы вычислили с непарными данными? d¯
shadowtalker

3
@ssdecontrol Особенно, если размеры выборки разные.
Алексис

Ответы:


12

(Я предполагаю, что вы имеете в виду «образец», а не «население» в первом абзаце.)

Эквивалентность легко показать математически. Начните с двух образцов одинакового размера: и . Затем определите{ y 1 , , y n } ˉ x{x1,,xn}{y1,,yn}

x¯=1ni=1nxiy¯=1ni=1nyid¯=1ni=1nxiyi

Тогда у вас есть:

x¯y¯=(1ni=1nxi)(1ni=1nyi)=1n(i=1nxii=1nyi)=1n((x1++xn)(y1++yn))=1n(x1++xny1yn)=1n(x1y1++xnyn)=1n((x1y1)++(xnyn))=1ni=1nxiyi=d¯.

1
Но два доверительных интервала, рассчитанные для «разности средних» и «средней разницы», будут разными, верно? Это можно увидеть, посмотрев на и . Парная «средняя разница» будет отличаться для (который все равен нулю) по сравнению с (который не является всем нулем); Различие средств не зависит от порядка элементов. B = [ . , , , 5 , 4 , 3 , 2 , 1 ] A - A A - BA=[1,2,3,4,5,...]B=[...,5,4,3,2,1]AAAB
Берс

Больше не могу редактировать мой предыдущий пост. Третье предложение должно начинаться «Последовательность спаренных„средних различий“...»
Берс

@bers, при чем здесь ? AA
Shadowtalker

Пусть . Тогда и - две разные последовательности. Доверительный интервал для средней парной разности, безусловно, будет различным в обоих случаях. Но разница средних и доверительного интервала будет одинаковой как для и для . Или я не прав? A - C A - B A - C A - BC=AACABACAB
Берс

@Bers Я думаю, что вы в замешательстве, но я не понимаю, о чем вы смущены.
Shadowtalker

0

Распределение среднего значения должно быть более жестким, чем распределение среднего значения. Посмотрите на это на простом примере: среднее значение в образце 1: 1 10 100 1000, среднее значение в образце 2: 2 11 102 1000, разность средних составляет 1 1 2 0 (в отличие от самих образцов) имеет малое стандартное отклонение.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.