Я не могу найти ссылку, поэтому я просто набросал доказательство здесь.
Теорема. Пусть - реальные случайные величины. Пусть являются константами. Предположим, что для всех и всех в поддержке , у нас естьX1,⋯,Xna1,⋯,an,b1,⋯,bni∈{1,⋯,n}(x1,⋯,xi−1)(X1,⋯,Xi−1)
- E[Xi|X1=x1,⋯,Xi−1=xi−1]≤0 и
- P[Xi∈[ai,bi]]=1 .
Тогда для всех ,t≥0
P[∑i=1nXi≥t]≤exp(−2t2∑ni=1(bi−ai)2).
Доказательство. Определить . Мы утверждаем, что Для всех и у нас есть
По предположению, и для всех в поддержкуYi=∑ij=1Xj
∀i∈{1,⋯,n} ∀λ≥0 E[eλYi]≤e18λ2∑ij=1(bj−aj)2.(*)
iλE[eλYi]=E[eλYi−1⋅eλXi]=E[eλYi−1⋅E[eλXi∣∣Yi−1]].
μ(yi−1):=E[Xi|Yi−1=yi−1]≤0P[Xi∈[ai,bi]]=1yi−1Yi−1, (Обратите внимание, что .) Таким образом, по
лемме Хеффдинга , для всех в поддержку и всех . Так , мы имеем, для всех ,
Теперь индукция дает иск (*) выше.
Yi−1=X1+⋯+Xi−1E[eλXi∣∣Yi−1=yi−1]≤eλμ(yi−1)+18λ2(bi−ai)2
yi−1Yi−1λ∈Rμ(yi−1)≤0λ≥0E[eλYi]≤E[eλYi−1⋅e0+18λ2(bi−ai)2].
Теперь мы применяем неравенство Маркова к и используем наше утверждение (*). Для всех ,
Наконец, установите чтобы минимизировать выражение правой руки и получить результат. eλYnt,λ>0
P[∑i=1nXi≥t]=P[Yn≥t]=P[eλYn≥eλt]≤E[eλYn]eλt≤e18λ2∑ni=1(bi−ai)2eλt.
λ=4t∑ni=1(bi−ai)2■
Как я упоминал в своем комментарии, ключевое отличие между этим и «обычным» утверждением о неравенстве заключается в том , что вместо требуется . Первый обеспечивает большую гибкость, и в некоторых случаях это экономит коэффициент 2.Xi∈[ai,bi]Xi∈[−a,a]
Обратите внимание, что случайные величины в доказательстве являются супермартингалом. Вы можете получить обычную версию неравенства взяв мартингейл , установив и (где ) с последующим применением вышеуказанного результата.YiY1,⋯,YnXi=Yi−Yi−1[ai,bi]=[−ci,ci]P[|Yi−Yi−1|≤ci]=1