Сумма произведений случайных величин Радемахера


9

x1xa,y1yb+11S=i,jxi×yjP(|S|>t)2ectmax(a,b)cуниверсальная константа. Это достигается путем ограничения вероятности Pr(|x1++xn|<t) и Pr(|y1++yn|<t) путем применения простых черновских оценок. Могу ли я надеяться получить что-то, что значительно лучше, чем этот предел? Для начала я могу хотя бы получить ectab . Если я смогу получить субгауссовые хвосты, которые, вероятно, будут лучшими, но можем ли мы ожидать этого (я так не думаю, но не могу придумать аргумента)?


Рассматривали ли вы применение Черноффа, связанного непосредственно с S ? Возможно, вы сможете что-то сделать с помощью
E[exp(λS]=E[λijXiYj]=E[λ(iXi)(jYj)]
Дилип Сарват

Существует очевидное улучшение вашей оценки для t>ab , поскольку тогда вероятность должна быть равна нулю. Мне кажется, что это «субгауссовский» хвост :-). Также кажется, что ваша оценка неверна: переменные, которые постоянно равны 1 удовлетворяют условиям этого вопроса. Для a=b и t=a21 вероятность 1 , но ваша оценка является асимптотически 2exp(ca)0 , как растет большой. a
whuber

Вероятность того, что все переменные равны 1, уменьшается в геометрической прогрессии. Я не думаю, что понимаю ваш комментарий. Для и указанная мною оценка довольно тривиально верна, поскольку вероятность того, что сумма больше равнаt = a 2 - 1 t 2 - 1 2 - ( a - 1 )e - l n ( 2 ) c ( a - 1 / a )a=bt=a21t212(a1)eln(2)c(a1/a)
user1189053

1
Я действительно сожалею о моей ошибке. Я думал, что я упомянул выше равномерно. Таким образом, p = 1/2, и мы можем взять a и b больше, чем любая константа (если необходимо) для выполнения неравенства
user1189053

2
Если мои глаза не обманывают меня, вы рассматриваете сумму продуктов, а не продукт сумм. :-)
кардинал

Ответы:


7

Алгебраическое отношение

S=i,jxiyj=ixijyj

показывает как произведение двух независимых сумм. Поскольку и являются независимыми переменными Бернулли , является биномиальной переменной, которая был удвоен и сдвинут. Следовательно, его среднее значение равно а его дисперсия равна . Точно так же имеет среднее значение и дисперсию . Давайте стандартизировать их прямо сейчас, определив( х я + 1 ) / 2 ( у J + 1 ) / 2 ( 1 / 2 ) Х = Σ я = 1 х я ( , 1 / 2 ) 0S(xi+1)/2(yj+1)/2(1/2)X=i=1axi(a,1/2)0 Y = Σ б J = 1 у J 0 бaY=j=1byj0b

Xa=1ai=1axi,

откуда

S=abXaXb=abZab.

С высокой (и поддающейся количественной оценке) степенью точности увеличении приближается к стандартному нормальному распределению. Поэтому давайте приблизим как умноженное на произведение двух стандартных нормалей.х а с aXaSab

Следующим шагом будет заметить, что

Zab=XaXb=12((Xa+Xb2)2(XaXb2)2)=12(U2V2).

кратно разности квадратов независимых стандартных нормальных величин и . Распределение может быть вычислено аналитически (путем обращения характеристической функции ): его pdf пропорционально функции Бесселя нулевого порядка, . Поскольку эта функция имеет экспоненциальные хвосты, мы сразу же заключаем, что для больших и и фиксированного нет лучшего приближения к чем дано в вопросе.V Z a b K 0 ( | z | ) / π a b t Pr a , b ( S > t )UVZabK0(|z|)/πabtPra,b(S>t)

Существует некоторая возможность для улучшения, когда один (по крайней мере) из и невелик или в точках в хвосте близких к . Прямые расчеты распределения показывают искривленное сужение вероятностей хвоста в точках, намного превышающих , примерно за . Эти логарифмические графики CDF для для различных значений (приведены в заголовках) и (примерно одинаковые с , различаются по цвету на каждом графике) показывают, что происходит. Для справки, график предельногоb S ± a b S abS±abSab SabaK0S0Pr(S>t)=Pr(-S<-t)abmax(a,b)SabaK0распределение показано черным. (Поскольку симметрично относительно , , поэтому достаточно взглянуть на отрицательный хвост.)S0Pr(S>t)=Pr(S<t)

фигуры

По мере увеличения CDF становится ближе к контрольной линии.b

Для характеристики и количественной оценки этой кривизны потребуется более тщательный анализ нормального приближения к биномиальным переменным.

Качество приближения функции Бесселя становится более ясным в этих увеличенных частях (в верхнем правом углу каждого графика). Мы уже довольно далеко в хвостах. Хотя логарифмическая вертикальная шкала может скрывать существенные различия, ясно, что к тому времени, когда достигло приближение хорошо для .500 | S | < a500|S|<ab

Вставки


R код для расчета распределенияS

Следующее выполнение займет несколько секунд. (Он вычисляет несколько миллионов вероятностей для 36 комбинаций и .) На более медленных машинах пропустите большее одно или два значения и и увеличьте нижний предел построения графика с до .б 10 - 300 10 - 160abab1030010160

s <- function(a, b) {
  # Returns the distribution of S as a vector indexed by its support.
  products <- factor(as.vector(outer(seq(-a, a, by=2), seq(-b, b, by=2))))
  probs <- as.vector(outer(dbinom(0:a, a, 1/2), dbinom(0:b, b, 1/2)))
  tapply(probs, products, sum)
}

par(mfrow=c(2,3))
b.vec <- c(51, 101, 149, 201, 299, 501)
cols <- terrain.colors(length(b.vec)+1)
for (a in c(50, 100, 150, 200, 300, 500)) {
  plot(c(-sqrt(a*max(b.vec)),0), c(10^(-300), 1), type="n", log="y", 
       xlab="S/sqrt(ab)", ylab="CDF", main=paste(a))
  curve(besselK(abs(x), 0)/pi, lwd=2, add=TRUE)
  for (j in 1:length(b.vec)) {
    b <- b.vec[j]
    x <- s(a,b)
    n <- as.numeric(names(x))
    k <- n <= 0
    y <- cumsum(x[k])
    lines(n[k]/sqrt(a*b), y, col=cols[j], lwd=2)
  }
}

1
Очень красиво сделано! Можно получить точную форму для cdf произведения 2 стандартных нормалей ... для отрицательного хвоста, это так 1/2 (1 + y BesselK[0,-y] StruveL[-1, y] - y BesselK[1,-y] StruveL[0, y]). Было бы интересно посмотреть, как: (a) выполняется оценка OP, и (b) выполняется ваше нормальное приближение для случая, который мы рассматривали выше, то есть полученных с использованием точного дискретного решения pmf. a=5,b=7
волки

1
@wolfies Да, я тоже получил это выражение: оно объединяет хвост . Поскольку точное распределение действительно отклоняется от него в крайних хвостах, дальнейшее изучение этого интеграла не представляется целесообразным. Следующим логическим шагом является более проницательный анализ хвостов, что означает выход за пределы нормального приближения. K0
whuber

3

Комментарий: я отредактировал заголовок, чтобы лучше отразить, какие типы rv рассматриваются в этом вопросе. Любой, не стесняйтесь отредактировать.

Мотивация: я думаю, что нет необходимости соглашаться на верхнюю границу, если мы можем получить распределение, ( ОБНОВЛЕНИЕ : Мы не можем видеть комментарии и ответ Уубера).|Sab|

Обозначим . Легко проверить , что «s имеют такое же распределение, что » с и «s. Генерирующая функция моментаZ X YZk=XiYj,k=1,...,abZXY

MZ(t)=E[ezt]=12et+12et=cosh(t)

Кроме того, , для начала, попарно независимы: переменная (индексы могут быть любыми, конечно), имеет поддержку с соответствующими вероятностями . Его генерирующая момент функцияW = Z 1 + Z 2 { - 2 , 0 , 2 } { 1 / 4 , 1 / 2 , 1 / 4 }ZW=Z1+Z2{2,0,2}{1/4,1/2,1/4}

MW(t)=E[e(z1+z2)t]=14e2t+12+14e2t==14(e2t+1)+14(e2t+1)=142etcosh(t)+142etcosh(t)=cosh(t)cosh(t)=MZ1(t)MZ2(t)

Я попытаюсь заподозрить, что полная независимость имеет место, следующим образом (это очевидно для более мудрых?): Для этой части обозначим . Тогда по правилу цепочки P [ Z Ь , . , , , Z 11 ] = Р [ Z б | Z , б - 1 , . , , , Z 11 ] . , , P [ Z 13Z 12 , Z 11 ] P [Zij=XiYj

P[Zab,...,Z11]=P[ZabZa,b1,...,Z11]...P[Z13Z12,Z11]P[Z12Z11]P[Z11]

В силу парной независимости . Рассмотрим . и являются независимыми условными для поэтому мы имеем второе равенство по попарной независимости. Но это подразумевает, чтоP [ Z 13 , Z 12Z 11 ] Z 13 Z 12P[Z12Z11]=P[Z12]
P[Z13,Z12Z11]Z13Z12 P [ Z 13Z 12 , Z 11 ] = P [ Z 13Z 11 ] = P [ Z 13 ]Z11

P[Z13Z12,Z11]=P[Z13Z11]=P[Z13]

P[Z13Z12,Z11]P[Z12Z11]P[Z11]=P[Z13,Z12,Z11]=P[Z13]P[Z12]P[Z11]

И т. Д. (Я думаю). ( ОБНОВЛЕНИЕ : я думаю, что неправильно . Независимость, вероятно, справедлива для любого триплета, но не для всей группы. Так что следует лишь вывод распределения простого случайного блуждания, а не правильный ответ на вопрос - см. Wolfies 'и Уубер отвечает).

Если полная независимость действительно имеет место, у нас есть задача получить распределение суммы iid дихотомических rv

Sab=k=1abZk

которая выглядит как простая случайная прогулка , хотя и без четкой интерпретации последней как последовательности.

Если поддержка будет четными целыми числами в включая ноль, тогда как если поддержка будет нечетными целыми числами в , без нуля. S [ - Ь , . , , , Ь ] б = уплотнительное d d S [ - а Ь , . , , , Б ]ab=evenS[ab,...,ab]ab=oddS[ab,...,ab]

Рассмотрим случай . Обозначим как число , принимающих значение . Тогда носитель можно записать в виде . Для любого , мы получим уникальное значение для . Более того, из-за симметричных вероятностей и независимости (или просто взаимозаменяемости ?) Все возможные совместные реализации переменных равновероятны. Поэтому мы считаем , и мы находим , что функция вероятности массы естьab=odd
mZ1SS{ab2m;mZ+{0};mab}mSZ{Z1=z1,...,Zab=zab}S

P(S=ab2m)=(abm)12ab,0mab

Определив , и нечетное число по построению, и типичный элемент поддержки , мы имеемsab2mS

P(S=s)=(ababs2)12ab

Переезд в, поскольку, если , распределение симметрично относительно нуля без распределения массы вероятности до нуля, поэтому распределениеполучается путем "сворачивания" графика плотности вокруг вертикальной оси, по существу, удваивая вероятности для положительных значений,|S|ab=oddS|S|

P(|S|=|s|)=(ababs2)12ab1

Тогда функция распределения

P(|S||s|)=12ab11is,iodd(ababi2)

Поэтому для любого действительного , , получаем требуемую вероятность t1t<ab

P(|S|>t)=1P(|S|t)=112ab11it,iodd(ababi2)

Обратите внимание, что указание гарантирует, что сумма будет работать только до значений, включенных в поддержку- например, если мы установим , все равно буду работать до , так как он должен быть нечетным, а не целым числом.i=odd|S|t=10.5i9


Количество отрицательных значений в должно быть четным . Поэтому эти четыре случайные величины (я полагаю, что это четыре из ваших s - обозначение неясно) не являются независимыми. (X1Y1,X1Y2,X2Y1,X2Y2)Z
whuber

@whuber Спасибо. Проблема (то есть моя проблема) в том, что я продолжаю получать независимость в любом конкретном примере, который я работаю. Я буду работать с конкретными четырьмя переменными, которые вы пишете.
Алекос Пападопулос

Да, это сложно, потому что разные s попарно независимы и (я полагаю) любые три разных тоже независимы. (Я проголосовал за ваш ответ из-за его творческой атаки на проблему, и я надеюсь, что ошибаюсь в своей оценке отсутствия независимости!)ZZ
whuber

@whuber Еще раз спасибо, whuber, это действительно поддерживает. Я думаю, что нам нужно для того, чтобы вывод распределения был действительным, это то, что все события равновероятны. Возможно ли владение такой собственностью, когда совместная независимость терпит неудачу? Я имею в виду, совместная независимость достаточна для равноправия, но необходима ли она? S{k=1abZk}
Алекос Пападопулос

Боюсь, я не понимаю вашу запись, которая, по-видимому, относится к пересечению случайных величин (что бы это ни значило).
whuber

3

Не ответ, но комментарий на интересный ответ Алекоса, который слишком длинный, чтобы поместиться в поле для комментариев.

Пусть независимые случайные величины Радемахера, и пусть независимые случайные величины Радемахера. Алекос отмечает, что:(X1,...,Xa)(Y1,...,Yb)

Sab=k=1abZkwhereZk=XiYj

«… Выглядит как простое случайное блуждание ». Если бы это было похоже на простое случайное блуждание, то распределение было бы симметричным «колоколообразным унимодальным» вокруг 0.S

Чтобы проиллюстрировать, что это не простая случайная прогулка, вот краткое сравнение Монте-Карло:

  • Треугольные точки: моделирование методом Монте-Карло pmf для учетом иa = 5 b = 7Sa=5b=7
  • круглые точки: симуляция Монте-Карло простого случайного блуждания с шагамиn=35

введите описание изображения здесь

Ясно, что не простая случайная прогулка; Также обратите внимание, что S не распространяется на все четные (или нечетные) целые числа.S

Монте-Карло

Вот код (в Mathematica ), используемый для генерации одной итерации суммы , заданной и :a bSab

 SumAB[a_, b_] :=  Outer[Times, RandomChoice[{-1, 1}, a], RandomChoice[{-1, 1}, b]] 
                         // Flatten // Total 

Затем 500 000 таких путей, скажем, когда и , могут быть сгенерированы с помощью:б = 7a=5b=7

 data57 = Table[SumAB[5, 7], {500000}];

Домен поддержки для этой комбинации и :бab

{-35, -25, -21, -15, -9, -7, -5, -3, -1, 1, 3, 5, 7, 9, 15, 21, 25, 35}

1
+1 Симуляция (или какой-то конкретный пример) давно нужна, чтобы дать нам ссылку для дальнейшего анализа. Ваше моделирование можно сделать намного более эффективным (примерно в 25 раз быстрее), отметив, что факторов как . Это сразу объясняет, почему никакие достаточно большие простые числа не могут отображаться в вашей треугольной диаграмме, и принудительно демонстрирует, что не может иметь распределение «случайного блуждания» (масштабированное биномиальное). ( i x i ) ( j yS S(ixi)(jyj)S
whuber

1
Вместо того, чтобы имитировать, вы можете быстро получить точный ответ (в любом случае aи для b1000, и менее), как rademacher[a_] := Transpose[{Range[-a, a, 2], Array[Binomial[a, #] &, a + 1, 0] /2^a}]; s[a_, b_] := {#[[1, 1]], Total[#[[;; , 2]]]} & /@ GatherBy[Flatten[Outer[Times, rademacher[a], rademacher[b], 1], 1], First]; ListLogPlot[s[5, 7]] , например, Попробуйте с s[100,211].
whuber

@whuber re первый комментарий - ваша факторизация супер аккуратна! :) На моем Mac, используя: ......... WHuberSumAB[a_, b_] := Total[RandomChoice[{-1, 1}, a]] * Total[RandomChoice[{-1, 1}, b]]... это в два раза быстрее, чем Outerподход. Вам интересно, какой код вы используете? [Оба подхода, конечно, могут быть сделаны быстрее, используя ParallelTable, и т. Д.]
волки

Попробуйте это: sum[n_, a_, b_] := Block[{w, p}, w[x_] := Array[Binomial[x, #] &, x + 1, 0] /2^x; p[x_] := RandomChoice[w[x] -> Range[-x, x, 2], n]; p[a] p[b]]. Потом время Tally[sum[500000, 5, 7]]. Для Raficianodos следующее делает то же самое , и занимает только 50% больше , чем Mathematica : s <- function(n, a, b) (2 * rbinom(n, a, 1/2) - a)*(2 * rbinom(n, b, 1/2) - b); system.time(x <- table(s(5*10^5, 5, 7))); plot(log(x), col="#00000020").
whuber

@whuber - re comment2 - точный pmf: так что у вас есть , где каждая сумма Радемахера является Биномом, и поэтому мы имеем произведение 2-х биномов. Почему бы не написать это как ответ !? - это красиво, аккуратно, элегантно и полезно ...S=(iXi)(jYj)
волки
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.