Настоящий вопрос представляет собой особый случай, когда вы имеете дело с величиной, которая является линейной функцией полиномиальной случайной величины. Можно точно решить вашу проблему, перечислив полиномиальные комбинации, которые удовлетворяют требуемому неравенству, и суммируя распределение по этому диапазону. В случае, когда велико, это может стать невозможным в вычислительном отношении. В этом случае можно получить приближенное распределение, используя нормальное приближение к многочлену. Обобщенная версия этого приближения показана ниже, а затем применяется к вашему конкретному примеру.N
Задача общего приближения. Предположим, у нас есть последовательность заменяемых случайных величин с диапазоном . Для любого мы можем сформировать вектор счета , который подсчитывает число вхождения каждого исхода в первые значений последовательности. Поскольку базовая последовательность является заменяемой, вектор счета распределяется как:n ∈ N X ≡ X ( n ) ≡ ( X 1 , X 21,2,...,mn∈NпX≡X(n)≡(X1,X2,...,Xm)n
X ~ Mu(n,θ)θ=limn→∞X(n)/n.
Теперь предположим, что у нас есть некоторый вектор неотрицательных весов и мы используем эти веса для определения линейной функции:w=(w1,w2,...,wm)
A(n)≡∑i=1mwiXi.
Поскольку веса неотрицательны, эта новая величина не уменьшается по . Затем мы определяем число , которое является наименьшим числом наблюдений, необходимых для получения определенного минимального значения для нашей линейной функции. Мы хотим приблизить распределение в случае, когда это значение (стохастически) велико.N ( a ) ≡ min { n ∈ N | A ( n ) ⩾ a }nN(a)≡min{n∈N|A(n)⩾a}N(a)
Решение проблемы общей аппроксимации. Во-первых, отметим, что, поскольку не уменьшается по (что верно, поскольку мы предположили, что все веса неотрицательны), имеем:nA(n)n
P(N(a)⩾n)=P(N(a)>n−1)=P(A(n−1)<a).
Следовательно, распределение непосредственно связано с распределением . Предполагая, что первая величина велика, мы можем приблизить распределение последней, заменив дискретный случайный вектор непрерывным приближением из многомерного нормального распределения. Это приводит к нормальному приближению для линейного количества , и мы можем непосредственно вычислить моменты этой величины. Для этого мы используем тот факт, что , и для . С некоторой базовой алгеброй это дает нам:Х ( п ) Е ( Х я ) = п θ я В ( Х я ) = п θ я ( 1 - θ я ) С ( Х я , Х J ) = - п θ я θ J я ≠ JNAXA(n)E(Xi)=nθiV(Xi)=nθi(1−θi)C(Xi,Xj)=−nθiθji≠j
μ≡E(1nA(n))=∑i=1mwiθi,
σ2≡V(1n−−√A(n))=∑i=1mwiθi−(∑i=1mwiθi)2=μ(1−μ).
Принятие нормального приближения к полиному дает теперь приблизительное распределение . Применение этого приближения дает:A(n) ~ N(nμ,nμ(1−μ))
P(N(a)⩾n)=P(A(n−1)<a)≈Φ(a−(n−1)μ(n−1)μ(1−μ)−−−−−−−−−−−−−√).
(Символ является стандартным обозначением для стандартной функции нормального распределения.) Можно применить это приближение, чтобы найти вероятности, относящиеся к величине для заданного значения . Это базовое приближение, которое не пыталось включить коррекцию непрерывности на значения базовых значений многочленного счета. Его получают, взяв нормальное приближение, используя те же первые два центральных момента, что и точную линейную функцию.N ( a ) aΦN(a)a
Применение к вашей проблеме: в вашей задаче у вас есть вероятности , веса и предельное значение . Поэтому у вас есть (округление до шести десятичных знаков) . Применяя вышеприведенное приближение, мы имеем (округление до шести десятичных знаков):w=(0,ln2,ln3)a=ln100000μ=1θ=(12,16,13)w=(0,ln2,ln3)a=ln100000μ=16ln2+13ln3=0.481729
P(N(a)⩾25)≈Φ(ln100000−24⋅0.48172924−−√⋅0.499666)=Φ(−0.019838)=0.492086.
Используя точное полиномиальное распределение, суммируя по всем комбинациям, удовлетворяющим требованию , можно показать, что точный результат равен . Следовательно, мы можем видеть, что приближение довольно близко к точному ответу в данном случае.Р ( Н ( ) ⩾ 25 ) = 0,483500P(A(24)<a)P(N(a)⩾25)=0.483500
Надеемся, что этот ответ даст вам ответ на ваш конкретный вопрос, а также поместит его в более общие рамки вероятностных результатов, которые применяются к линейным функциям полиномиальных случайных векторов. Настоящий метод должен позволить вам получить приблизительные решения проблем общего типа, с которыми вы сталкиваетесь, с учетом изменения конкретных чисел в вашем примере.