Существует ли примерная версия одностороннего чебышевского неравенства?


32

Меня интересует следующая односторонняя версия неравенства Чебышева Кантелли :

п(Икс-Е(Икс)T)Вaр(Икс)Вaр(Икс)+T2,

По сути, если вы знаете среднее значение и дисперсию населения, вы можете рассчитать верхнюю границу вероятности наблюдения определенного значения. (Это было мое понимание, по крайней мере.)

Однако я хотел бы использовать выборочное среднее значение и выборочную дисперсию вместо фактического среднего значения и дисперсии.

Я предполагаю, что, поскольку это внесет больше неопределенности, верхняя граница увеличится.

Существует ли неравенство, аналогичное приведенному выше, но которое использует выборочное среднее значение и дисперсию?

Редактировать : «Образец» аналог неравенства Чебышева (не односторонний), был разработан. На странице Википедии есть некоторые детали. Тем не менее, я не уверен, как это будет переводиться в односторонний случай, который я описал выше.


Спасибо Glen_b. Это довольно интересная проблема. Я всегда думал, что неравенство Чебышева было мощным (так как оно позволяет вам делать статистический вывод, не требуя распределения вероятностей); так что возможность использовать его со средним и дисперсией выборки была бы просто потрясающей.
Касандра

Ответы:


26

Да, мы можем получить аналогичный результат, используя среднее значение и дисперсию выборки, и, возможно, в процессе появятся пара небольших сюрпризов.

Во-первых, нам нужно немного уточнить формулировку вопроса и изложить несколько предположений. Важно отметить, что мы не можем надеяться заменить дисперсию совокупности дисперсией выборки в правой части, поскольку последняя случайна ! Итак, переориентируем наше внимание на эквивалентное неравенство В случае, если не ясно, что они эквивалентны, обратите внимание, что мы просто заменили t на t σ в исходном неравенстве без потери общности.

п(Икс-ЕИксTσ)11+T2,
TTσ

Во-вторых, мы предполагаем, что у нас есть случайный образец и нас интересует верхняя оценка для аналогичной величины PИкс1,...,ИксN , где ˉ X - среднее значение выборки, а S стандартное отклонение выборки.P(X1X¯tS)X¯S

Полшага вперед

Отметим, что уже применяя оригинальное одностороннее неравенство Чебышева к , мы получаем, что P(X1- ˉ Xtσ)1Икс1-Икс¯

п(Икс1-Икс¯Tσ)11+NN-1T2
где , что меньше, чем в правой части оригинальной версии. Это имеет смысл! Любая конкретная реализация случайной величины из выборки будет (немного) ближе к среднему значению выборки, в которое она вносит вклад, чем к среднему значению для популяции. Как мы увидим ниже, мы получим замену σ на S при еще более общих предположениях.σ2знак равноВaр(Икс1)σS

Примерный вариант одностороннего Чебышева

Утверждение : пусть - случайная выборка такая, что P ( S = 0 ) = 0Икс1,...,ИксNп(Sзнак равно0)знак равно0 . Тогда В частности, примерная версия границыболее жесткая,чем исходная популяционная версия.

п(Икс1-Икс¯TS)11+NN-1T2,

Примечание : мы не предполагаем, что имеет либо конечное среднее значение, либо дисперсию!Икся

Доказательство . Идея состоит в том, чтобы адаптировать доказательство первоначального одностороннего неравенства Чебышева и использовать симметрию в процессе. Во-первых, установите для удобства обозначения. Затем заметим, что P ( Y 1t S ) = 1Yязнак равноИкся-Икс¯

п(Y1TS)знак равно1NΣязнак равно1Nп(YяTS)знак равноЕ1NΣязнак равно1N1(YяTS),

Теперь, для любого , на { S > 0 } , 1 ( Y ят S ) = 1 ( Y я + т с S T S ( 1 + гр ) )1 ( ( Y яс>0{S>0}

1(YяTS)знак равно1(Yя+TсSTS(1+с))1((Yя+TсS)2T2(1+с)2S2)(Yя+TсS)2T2(1+с)2S2,

Тогда поскольку ˉ Y = 0 иi Y 2

1ni1(YяTS)1NΣя(Yя+TсS)2T2(1+с)2S2знак равно(N-1)S2+NT2с2S2NT2(1+с)2S2знак равно(N-1)+NT2с2NT2(1+с)2,
Y¯знак равно0.iYi2=(n1)S2

Правая часть является константой ( ! ), Поэтому при ожидании с обеих сторон получаем Наконец, минимизируя по c , получаем c = n - 1

P(X1X¯tS)(n1)+nt2c2nt2(1+c)2.
c , который после небольшой алгебры устанавливает результат.c=n1nt2

Это надоедливое техническое состояние

P(S=0)=0S20=Yi=tS=0it>0

Мы можем пошевелиться, установив q=P(S=0)

q=P(S=0)>0

P(X1X¯tS)(1q)11+nn1t2+q.

{S>0}{S=0}{S>0}{S=0}

Несколько более чистое неравенство получается, если мы заменим нестрогое неравенство в утверждении вероятности строгой версией.

q=P(S=0)

P(X1X¯>tS)(1q)11+nn1t2.

X (кроме того, что она не была почти наверняка постоянной в случае нестрого неравенства, которое первоначальная версия также подразумевает), по сути, потому что выборочное среднее и выборочная дисперсия всегда существуют независимо от того, существуют ли их популяционные аналоги.


15

NИкся

Икся-Икс¯<sN-1,язнак равно1,,,,N
ssзнак равно(1NΣязнак равно1N(Икся-Икс¯)2)1/2,

Затем, используя обозначение ответа кардинала, мы можем утверждать, что

п(Икс1-Икс¯SN-1)знак равно0a,s,[1]

Поскольку нам требуются три различных значения, мы будем иметь S0по предположению. Итак, постановкаTзнак равноN-1 в неравенстве кардинала (начальная версия) получаем

P(X1X¯Sn1)11+n,[2]

Eq. [2] is of course compatible with eq. [1]. The combination of the two tells us that Cardinal's Inequality is useful as a probabilistic statement for 0<t<n1.

If Cardinal's Inequality requires S to be calculated bias-corrected (call this S~) then the equations become

P(X1X¯S~n1n)=0a.s.[1a]

and we choose t=n1n to obtain through Cardinal's Inequality

P(X1X¯S~n1n)1n,[2a]
and the probabilistically meaningful interval for t is 0<t<n1n.

2
(+1) Кстати, как я впервые рассматривал эту проблему, тот факт, что Максимумя|Икся-Икс¯|SN-1был фактически начальный признак того, что выборочное неравенство должно быть более жестким, чем оригинал. Я хотел втиснуть это в свой пост, но не мог найти (удобное) место для этого. Я рад, что вы упомянули об этом (на самом деле очень небольшое улучшение) здесь вместе с вашей очень хорошей дополнительной проработкой. Приветствия.
кардинал

Cheers @Cardinal, great answer -just clarify for me -does it matter for your Inequality how one defines the sample variance (bias-corrected or not)?
Алекос Пападопулос

Только очень немного. Я использовал отклонение выборки с поправкой на смещение. Если вы используетеN вместо того N-1 нормализовать, то вы в конечном итоге
1+T2с2T2(1+с)2
вместо того
(N-1)+NT2с2NT2(1+с)2,
что означает N/(N-1)срок в окончательном неравенстве исчезнет. Таким образом, вы получите ту же оценку, что и в исходном одностороннем чебышевском неравенстве в этом случае. (Предполагая, что я правильно выполнил алгебру.) :-)
кардинал

@Cardinal ...which means that the relevant equations in my answer are 1a and 2a, which means that your inequality tells us that for t chosen to activate Samuelson Inequality, the probability of the event we are examining, cannot be greater than 1/n, i.e. not greater than randomly choosing any one realized value from the sample... which somehow makes some hazy intuitive sense: what is proven certainly impossible in deterministic terms, when approached probabilistically its probability bound does not exceed equiprobability... not clear in my mind yet.
Алекос Пападопулос
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.