Как мы можем ограничить вероятность того, что случайная величина максимальна?


21

Предположим, у нас есть N независимых случайных величин X1 , , Xn с конечными средними μ1μN и дисперсиями σ12 , , σN2 . Я ищу границы без распределения для вероятности того, что любой XiXN больше, чем все другие Xj , ji .

Другими словами, если для простоты мы предполагаем, что распределения Xi непрерывны (например, P(Xi=Xj)=0 ), я ищу границы на:

P(Xi=maxjXj).
Если N=2 , мы можем использовать неравенство Чебышева, чтобы получить:
P(X1=maxjXj)=P(X1>X2)σ12+σ22σ12+σ22+(μ1μ2)2.
Я хотел бы найти простые (не обязательно плотно) оценки для общих N , но я не смог найти (эстетический) приятные результаты для общего N .

Обратите внимание, что переменные не считаются iid. Любые предложения или ссылки на связанные работы приветствуются.


Обновление: напомним, что по предположению μjμi . Затем мы можем использовать вышеуказанную границу для получения:

P(Xi=maxjXj)minj>iσi2+σj2σi2+σj2+(μjμi)2σi2+σN2σi2+σN2+(μNμi)2.
Это подразумевает:
(μNμi)P(Xi=maxjXj)(μNμi)σi2+σN2σi2+σN2+(μNμi)212σi2+σN2.
Это, в свою очередь, подразумевает:
i=1NμiP(Xi=maxjXj)μNN2i=1N1(σi2+σN2).
Теперь мне интересно, можно ли улучшить эту границу до того, что не зависит линейно от N ? Например, имеет ли место следующее:
i=1NμiP(Xi=maxjXj)μNi=1Nσi2?
А если нет, то что может быть контрпримером?

3
Эта оценка может быть сильнее , если вы используете индекс , который дает вам меньше верхней границы вместо . Обратите внимание, что это значение зависит как от среднего значения, так и от дисперсии. NjN

5
@MichaelChernick: Я не верю, что это правильно. Предположим, например, что у нас есть три равномерных распределения на . Тогда, если я не ошибаюсь, , тогда как . Я не знаю, если вы хотели написать , но тогда тот же пример показывает, что он все еще не действителен. Р ( Х 1 < макс J Х J ) = 2 / 3 Р ( Х 1 < Х 2 ) = Р ( Х 1 < Х 3 ) = 1 / 2 Р ( Х я > макс J Х J )[0,1]P(X1<maxjXj)=2/3P(X1<X2)=P(X1<X3)=1/2P(Xi>maxjXj)
MLS

2
@Michael: К сожалению, это все еще не так. События для фиксированного не являются независимыми. iAj={Xi>Xj} i
кардинал

2
@cardinal: Среди прочего, это связано с многорукими бандитами. Если вы выбираете руку на основе предыдущих наград, насколько велика вероятность того, что вы выбрали лучшую руку (это будет в нотации выше), и можем ли мы связать ожидаемую потерю при выборе -оптимальная рука? P(XN=maxjXj)
MLS

2
Внесено в MathOverflow: mathoverflow.net/questions/99313
кардинал

Ответы:


1

Вы можете использовать многомерное неравенство Чебышева.

Случай двух переменных

Для одной ситуации, против , я прихожу в ту же ситуацию, что и комментарий Йохена 4 ноября 2016 г.X 2X1X2

1) Если то P ( X 1 > X 2 ) ( σ 2 1 + σ 2 2 ) / ( μ 1 - μ 2 ) 2μ1<μ2P(X1>X2)(σ12+σ22)/(μ1μ2)2

(и мне интересно также о вашем происхождении)

Вывод уравнения 1

  • используя новую переменнуюX1X2
  • превращая его так, чтобы он имел среднее значение в ноль
  • принимая абсолютное значение
  • применяя неравенство Чебышева

P(X1>X2)=P(X1X2>0)=P(X1X2(μ1μ2)>(μ1μ2))P(|X1X2(μ1μ2)|>μ2μ1)σ(X1X2(μ1μ2))2(μ2μ1)2=σX12+σX22(μ2μ1)2

Многомерный случай

Неравенство в уравнении (1) можно изменить в многомерный случай, применив его к нескольким преобразованным переменным для каждого (обратите внимание, что они коррелированы).i < n(XnXi)i<n

Решение этой проблемы (многомерное и коррелированное) было описано И. Олкиным и Дж. В. Праттом. «Многомерное неравенство Чебышева» в анналах математической статистики, том 29, страницы 226-234 http://projecteuclid.org/euclid.aoms/1177706720

Примечание теорема 2.3

P(|yi|kiσi for some i)=P(|xi|1 for some i)(u+(ptu)(p1))2p2

в которой число переменных, и .t = k - 2 i u = ρ i j / ( kpt=ki2u=ρij/(kikj)

Теорема 3.6 дает более жесткую оценку, но ее не так просто вычислить.

редактировать

Более точная оценка может быть найдена с помощью многомерного неравенства Кантелли . Это неравенство является типом, который вы использовали ранее и предоставили вам границу который острее, чем .( σ 2 1 + σ 2 2 ) / ( μ 1 - μ 2 ) 2(σ12+σ22)/(σ12+σ22+(μ1μ2)2)(σ12+σ22)/(μ1μ2)2

Я не потратил время на изучение всей статьи, но в любом случае вы можете найти решение здесь:

А. В. Маршалл и И. Олкин «Одностороннее неравенство чебышевского типа» в анналах математической статистики, том 31, стр. 488-491 https://projecteuclid.org/euclid.aoms/1177705913

(примечание позже: это неравенство для равных корреляций и недостаточной помощи. Но в любом случае ваша задача, чтобы найти самую точную границу, равна более общему, многомерному неравенству Кантелли. Я был бы удивлен, если бы решения не существовало)


Не могли бы вы дать четкое утверждение о многомерном неравенстве Чебышева?
whuber

1
Я отредактировал решение, предоставив всю теорему.
Секст Эмпирик

-1

Я нашел теорему, которая может вам помочь, и постараюсь приспособить ее к вашим потребностям. Предположим, у вас есть:

exp(tE(max1inXi))

Тогда по неравенству Дженсена (поскольку exp (.) - выпуклая функция), мы получим:

exp(tE(max1inXi))E(exp(tmax1inXi))=E(max1in exp(tXi))i=1nE(exp(tXi)

Теперь для вы должны подключить любую функцию, генерирующую момент вашей случайной величины (поскольку это просто определение mgf). Затем, после этого (и потенциально упрощая ваш термин), вы берете этот термин и берете логарифм и делите его на t, чтобы получить утверждение о термине . Затем вы можете выбрать t с некоторым произвольным значением (лучше всего, чтобы член был маленьким, чтобы граница была жесткой). X i E ( m a x 1 i n X i )exp(tXiXiE(max1inXi)

Затем у вас есть заявление об ожидаемом значении максимума за n rvs. Чтобы получить утверждение о вероятности того, что максимум этих rv отклоняется от этого ожидаемого значения, вы можете просто использовать неравенство Маркова (предполагая, что ваш rv неотрицательный) или другой, более конкретный rv, применимый к вашему конкретному rv.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.