В чем разница между наличием чего-либо статистически значимого (например, разницы между двумя выборками) и указанием, является ли группа чисел независимой или зависимой.
В чем разница между наличием чего-либо статистически значимого (например, разницы между двумя выборками) и указанием, является ли группа чисел независимой или зависимой.
Ответы:
Значение в t-тесте с независимыми выборками просто означает, что вероятность (если ноль были истинны) выборки средней разности, столь же экстремальной, как средняя разница, которую вы фактически выбрали, составляет менее 0,05.
Это совершенно не связано с зависимостью / независимостью. «Зависимый» означает, что распределение одних отдельных наблюдений связано с распределением других, например, A) это один и тот же человек, проходящий один и тот же тест во второй раз, B) люди в каждой группе сопоставляются по некоторой переменной предварительного теста, В) люди в двух группах связаны между собой (то есть семья). «Независимый» означает, что такой связи нет.
Зачем останавливаться на тестах?
Можно представить, что две переменные некоррелированы как два ортогональных вектора, точно так же, как оси и в двумерной декартовой системе координат.у
Когда любой из двух векторов, скажем, и коррелирует с другим, будет определенная часть x, которую можно спроецировать на y и наоборот. Имея это в виду, это довольно легко увидеть, так как,у
Где - коэффициент корреляции Пирсона, а - внутреннее произведение аргументов. Когда я узнал об этом, я был полностью поражен тем, насколько геометрически проста идея корреляции. И это определенно не единственный способ измерить корреляцию между двумя (или более) переменными.
Тестирование значимости - это другая игра с мячом. Часто мы хотим знать , насколько две (или более) группы различаются по некоторой переменной результата в результате некоторой манипуляции, которая была выполнена в указанных группах. Как сказал Брайан, вы хотите знать, происходят ли две группы из одного и того же распределения, таким образом, вы вычисляете вероятность выборки средней разницы (рассчитанной по стандартной ошибке среднего), которую вы получили из своего эксперимента, учитывая, что нулевая гипотеза (нет значительного различия в средствах) верно. В поведенческих исследованиях (и часто в других местах), если эта вероятность меньше 0,05, вы можете заключить, что разница в двух (или более) средних значениях, вероятно, связана с вашими манипуляциями.
РЕДАКТИРОВАТЬ : Дилип Сарват указал, что две некоррелированные переменные могут быть статистически зависимыми, поэтому я вынул первую часть. Спасибо за это.