Да, мы можем получить аналогичный результат, используя среднее значение и дисперсию выборки, и, возможно, в процессе появятся пара небольших сюрпризов.
Во-первых, нам нужно немного уточнить формулировку вопроса и изложить несколько предположений. Важно отметить, что мы не можем надеяться заменить дисперсию совокупности дисперсией выборки в правой части, поскольку последняя случайна ! Итак, переориентируем наше внимание на эквивалентное неравенство
В случае, если не ясно, что они эквивалентны, обратите внимание, что мы просто заменили t на t σ в исходном неравенстве без потери общности.
P ( X- E X≥ t σ) ≤ 11 + т2,
Tt σ
Во-вторых, мы предполагаем, что у нас есть случайный образец и нас интересует верхняя оценка для аналогичной величины
PИкс1, … , XN , где ˉ X - среднее значение выборки, а S стандартное отклонение выборки.P(X1−X¯≥tS)X¯S
Полшага вперед
Отметим, что уже применяя оригинальное одностороннее неравенство Чебышева к , мы получаем, что
P(X1- ˉ X ≥tσ)≤1X1−X¯
P(X1−X¯≥tσ)≤11+nn−1t2
где
, что
меньше, чем в правой части оригинальной версии. Это имеет смысл! Любая конкретная реализация случайной величины из выборки будет (немного) ближе к среднему значению выборки, в которое она вносит вклад, чем к среднему значению для популяции. Как мы увидим ниже, мы получим замену
σ на
S при еще более общих предположениях.
σ2=Var(X1)σS
Примерный вариант одностороннего Чебышева
Утверждение : пусть - случайная выборка такая, что P ( S = 0 ) = 0X1,…,XnP (S= 0 ) = 0 . Тогда В частности, примерная версия границыболее жесткая,чем исходная популяционная версия.
P ( X1- Х¯≥ t S) ≤ 11 + nn - 1T2,
Примечание : мы не предполагаем, что имеет либо конечное среднее значение, либо дисперсию!Икся
Доказательство . Идея состоит в том, чтобы адаптировать доказательство первоначального одностороннего неравенства Чебышева и использовать симметрию в процессе. Во-первых, установите для удобства обозначения. Затем заметим, что
P ( Y 1 ≥ t S ) = 1Yя= Xя- Х¯
P ( Y1≥ t S) = 1NΣя = 1NP ( Yя≥ t S) = E 1NΣя = 1N1( Yя≥ t S),
Теперь, для любого , на { S > 0 } ,
1 ( Y я ≥ т S ) = 1 ( Y я + т с S ≥ T S ( 1 + гр ) ) ≤ 1 ( ( Y яс > 0{ S> 0 }
1( Yя≥tS)=1(Yi+tcS≥tS(1+c))≤1((Yi+tcS)2≥t2(1+c)2S2)≤ (Yi+ т сS)2T2( 1 + с)2S2,
Тогда
поскольку ˉ Y = 0 и ∑ i Y 2
1NΣя1( Yя≥ t S)≤ 1NΣя( Yя+tcS)2t2(1+c)2S2=(n−1)S2+nt2c2S2nt2(1+c)2S2= ( п−1)+nt2c2nt2( 1+c)2,
Y¯= 0.
∑iY2i=(n−1)S2
Правая часть является константой ( ! ), Поэтому при ожидании с обеих сторон получаем
Наконец, минимизируя по c , получаем c = n - 1
P(X1−X¯≥tS)≤(n−1)+nt2c2nt2(1+c)2.
c , который после небольшой алгебры устанавливает результат.
c=n−1nt2
Это надоедливое техническое состояние
P(S=0)=0S20=Yi=tS=0it>0
Мы можем пошевелиться, установив q=P(S=0)
q=P(S=0)>0
P(X1−X¯≥tS)≤(1−q)11+nn−1t2+q.
{S>0}{S=0}{S>0}{S=0}
Несколько более чистое неравенство получается, если мы заменим нестрогое неравенство в утверждении вероятности строгой версией.
q=P(S=0)
P(X1−X¯>tS)≤(1−q)11+nn−1t2.
X (кроме того, что она не была почти наверняка постоянной в случае нестрого неравенства, которое первоначальная версия также подразумевает), по сути, потому что выборочное среднее и выборочная дисперсия всегда существуют независимо от того, существуют ли их популяционные аналоги.