Пусть по к - мерный случайный вектор, т.е. коллекция фиксированной позиции случайных величин (измеримых вещественных функций).x=(X1,...,Xj,...,Xk)k−
Рассмотрим множество таких векторов, скажем , , и индекс этих векторов на я = 1 , . , , , П , так, скажем ,ni=1,...,n
и рассматривать ихкачестве коллекции под названием "образец",S=( х 1 ,..., х я ,..., х п ). Тогда мы называем каждыйк-
xi=(X1i,...,Xji,...,Xki)
S=(x1,...,xi,...,xn)k− мерный вектор - «наблюдение» (хотя оно действительно становится единым только после того, как мы измерим и запишем реализации задействованных случайных величин).
fi(xi),i=1,...,nf(x1,...,xi,...,xn)
S
f(x1,...,xi,...,xn)=∏i=1nfi(xi),∀(x1,...,xi,...,xn)∈DS
DSn
Это означает, что «наблюдения» являются «совместно независимыми» (в статистическом смысле или «независимыми по вероятности», как это было со старым высказыванием, которое иногда все еще встречается сегодня). Привычка просто называть их «независимыми наблюдениями».
i
Отметим также, что в тех случаях, когда у нас есть непрерывные случайные величины без плотностей, вышеизложенное можно выразить через функции распределения.
Это то, что означает «независимые наблюдения» . Это точно определенное свойство, выраженное в математических терминах. Давайте посмотрим, что из этого следует .
НЕКОТОРЫЕ ПОСЛЕДСТВИЯ НЕЗАВИСИМЫХ НАБЛЮДЕНИЙ
A. Если два наблюдения являются частью группы совместно независимых наблюдений, то они также «попарно независимы» (статистически),
f(xi,xm)=fi(xi)fm(xm)∀i≠m,i,m=1,...,n
Это, в свою очередь, означает, что условные PMF / PDF-файлы равны «маргинальным»
f(xi∣xm)=fi(xi)∀i≠m,i,m=1,...,n
Это обобщает многие аргументы, обусловленные или обусловленные, скажем,
f(xi,xℓ∣xm)=f(xi,xℓ),f(xi∣xm,xℓ)=fi(xi)
и т. д., если индексы слева отличаются от индексов справа от вертикальной линии.
Это означает, что если мы действительно наблюдаем одно наблюдение, вероятности, характеризующие любое другое наблюдение выборки, не изменяются. Что касается прогноза , независимая выборка не наш лучший друг. Мы бы предпочли иметь зависимость, чтобы каждое наблюдение могло помочь нам сказать что-то больше о любом другом наблюдении.
Б. С другой стороны, независимый образец имеет максимальную информативность. Каждое наблюдение, будучи независимым, несет информацию, которая не может быть выведена, полностью или частично, каким-либо другим наблюдением в выборке. Таким образом, общая сумма максимальна по сравнению с любой сопоставимой выборкой, где существует некоторая статистическая зависимость между некоторыми наблюдениями. Но какая польза от этой информации, если она не может помочь нам улучшить наши прогнозы?
Ну, это косвенная информация о вероятностях, которые характеризуют случайные величины в выборке. Чем больше этих наблюдений имеют общие характеристики (в нашем случае общее распределение вероятностей), тем больше мы в лучшем положении, чтобы обнаружить их, если наша выборка независима.
Другими словами, если выборка независима и «одинаково распределена», то есть
fi(xi)=fm(xm)=f(x),i≠m
f(x)fj(xji)
f(xi∣xm)=fi(xi)xi fi
Следовательно, что касается оценки (которая иногда используется как универсальный термин, но здесь ее следует отличать от концепции прогнозирования ), независимая выборка является нашим «лучшим другом», если она сочетается с «идентично распределенным». " свойство.
C. Из этого также следует, что независимая выборка наблюдений, каждый из которых характеризуется совершенно разным распределением вероятностей, без каких-либо общих характеристик, является настолько бесполезным сбором информации, насколько это возможно (конечно, каждая отдельная информация является Стоит отметить, что проблема в том, что вместе они не могут быть объединены, чтобы предложить что-нибудь полезное). Представьте образец, содержащий три наблюдения: одно, содержащее (количественные характеристики) фрукты из Южной Америки, другое, содержащее горы Европы, и третье, содержащее одежду из Азии. Все три из них представляют довольно интересную информацию, но в качестве образца мы не можем сделать ничего статистически полезного для нас.
Иными словами, необходимым и достаточным условием полезности независимой выборки является то, что наблюдения имеют некоторые общие статистические характеристики. Вот почему в статистике слово «образец» является синонимом не «сбора информации» в целом, а «сбора информации о сущностях, имеющих некоторые общие характеристики».
ПРИМЕНЕНИЕ К ПРИМЕРУ ДАННЫХ ОП
Отвечая на запрос пользователя @gung, давайте рассмотрим пример OP в свете вышеизложенного. Мы разумно предполагаем, что у нас в школе более двух учителей и более шести учеников. Итак, а) мы проводим выборку как учеников, так и учителей, и б) мы включаем в наш набор данных оценку, соответствующую каждой комбинации учитель-ученик.
GPTS=(s1,...,s6)
s1=(T1,P1,G1)s2=(T1,P2,G2)s3=(T1,P3,G3)s3=(T2,P4,G4)s4=(T2,P5,G5)s5=(T2,P6,G6)
PiGi
T1,T2
s1,s2,s3T1s4,s5,s6T2
Обратите внимание на различие между «одной и той же случайной величиной» и «двумя различными случайными переменными, которые имеют идентичные распределения».
s1,s2,s3T1s4,s5,s6T2
Предположим теперь, что мы исключаем случайную переменную "teacher" из нашей выборки. Является ли (Pupil, Grade) выборка из шести наблюдений независимой выборкой?
Здесь важны предположения о структурных отношениях между учителями, учениками и классами.
T1T2G1,G2,G3T1
Но скажем, что учителя в этом отношении идентичны. Затем в соответствии с заявленным предположением «учителя влияют на учеников» мы снова имеем, что первые три наблюдения зависят друг от друга, потому что учителя влияют на учеников, которые влияют на оценки, и мы достигаем того же результата, хотя и в этом случае косвенно (и аналогично для другие три). Итак, еще раз, образец не является независимым.
ДЕЛО ГЕНДЕР
GeM,F
s1=(Ge1,P1,G1)s2=(Ge2,P2,G2)s3=(Ge3,P3,G3)s3=(Ge4,P4,G4)s4=(Ge5,P5,G5)s5=(Ge6,P6,G6)
Обратите внимание, что то, что мы включили в описание образца в отношении пола, это не фактическое значение, которое оно принимает для каждого ученика, а случайная переменная «Пол» . Вспомните начало этого очень длинного ответа: образец не определяется как набор чисел (или фиксированных числовых или не значений в целом), а как набор случайных величин (т. Е. Функций).
Gei1Ge1P2,P3,...затем исчезает еще один возможный источник зависимости между наблюдениями. Наконец, влияет ли пол ученика на оценки другого ученика? если мы утверждаем, что это не так, мы получаем независимую выборку (при условии, что все ученики имеют одного и того же учителя).