Бросая шары в мусорные ведра, оцените нижнюю границу ее вероятности


14

Это не домашнее задание, хотя выглядит так. Любая ссылка приветствуется. :-)

Сценарий: есть n разных шаров и n разных бинов (помечены от 1 до n слева направо). Каждый шар брошен независимо и равномерно в мусорные ведра. Пусть f(i) будет количеством шаров в i й корзине. Пусть Ei обозначает следующее событие.

Для каждого ji , kjf(k)j1

То есть первые j бинов (самые левые j бинов) содержат меньше j шаров для каждого ji .

Вопрос: Оцените i<nPr(Ei) в терминах n ? Когда n уходит в бесконечность. Нижний предел является предпочтительным. Я не думаю, что существует легко рассчитанная формула.

limnPr(E1)=limn(n1n)n=1ePr(En)=0

Мое предположение: я предполагаю , когда уходит в бесконечность. Я рассмотрел первые пунктов в суммировании.n ln ni<nPr(Ei)=lnnnlnn


1
Похоже на подмножество из задачи на день рождения ..
Гопи

@Gopi Я не могу убедить себя, что мой вопрос - проблема с ограниченным днем ​​рождения. Можете ли вы объяснить это явно? Большое спасибо. Примечание. Ограничение определяется суммой шаров в первых ячейках, а не количеством ячеек в конкретной ячейке. j
Пэн Чжан

Действительно, мой плохой, перечитав статью в Википедии о проблеме дня рождения, я понял, что рассматривал другую проблему, которая была адаптирована из проблемы дня рождения.
Гопи

2
Некоторые неверные идеи ... Итак, подумайте о том, как кодировать состояние: прочитайте форму для полей слева направо. Если в первом бине есть i шариков, выведите последовательность из i, а затем 0. Сделайте это для всех бинов слева направо. Вы, кажется, считаете, что вас интересует наибольшее значение i, такое, что эта двоичная строка (которая имеет n нулей и n единиц) впервые содержит больше единиц, чем нулей. Теперь давайте совершим прыжок судьбы и сгенерируем 0 и 1 с равной вероятностью . (Это может быть полная чушь). Эта проблема связана с каталонскими числами и словами Дейка. И...??? 1/2
Сариэль Хар-Пелед

4
Я не вижу в вашем определении, почему это важно, что шары разные. Кроме того, строковое значение принимает во внимание тот факт, что ячейки разные.
Сариэль Хар-Пелед

Ответы:


11

РЕДАКТИРОВАТЬ: (2014-08-08) Как указывает Дуглас Заре в комментариях, аргумент ниже, в частности, «мост» между двумя вероятностями, является неправильным. Я не вижу прямой способ исправить это. Я оставлю ответ здесь , как я считаю , что это все еще дает некоторую интуицию, но знаю , что является не верно в целом.

Pr(Em)l=1mPr(Fl)

Это не будет полным ответом, но, надеюсь, у него будет достаточно контента, чтобы вы или кто-то более знающий, чем я, могли закончить его.

Рассмотрим вероятность попадания ровно k шаров в первые l (из n ) бинов:

(nk)(ln)k(nln)nk

Назовите вероятность того, что меньше чем шаров попадет в первые l бинов F l :llFl

Pr(Fl)=k=0l1(nk)(ln)k(nln)nk

Вероятность того, что событие, , происходит выше, меньше, чем если бы мы рассматривали каждое из событий F l, происходящих независимо и все сразу. Это дает нам мост между двумя:ElFl

Pr(Em)l=1mPr(Fl)=l=1m(k=1l1(nk)(lnk)(nln)nk)=l=1mF(l1;n,ln)

Где -кумулятивная функция распределения для биномиального распределениясp=lF(l1;n,ln) . Просто прочитав несколько строк на странице Википедии и отметив, что(l-1pn), мы можем использоватьнеравенство Черноффа,чтобы получить:p=LN(L-1пN)

Pr(Em)l=1mexp[12l]=exp[12l=1m1l]=exp[12Hm]exp[12(12m+ln(m)+γ)]

Где - это mчисло гармоник , γ - постоянная Эйлера-Маскерони, а неравенство для H m взято со страницы Вольфрама, связанной с MathWorld.HmmγHm

Не заботясь о фактор, это , наконец , дает нам:e1/4m

Pr(Em)eγ/2m

Ниже приведен логарифмический график в среднем 100 000 экземпляров для как функции m с функцией e - γ / 2.n=2048m также нанесено для справки:eγ/2m

введите описание изображения здесь

Пока константы выключены, форма функции выглядит правильной.

Ниже приведен график log-log для варьирования где каждая точка представляет собой среднее значение 100 000 экземпляров как функцию m :nm

введите описание изображения здесь

Наконец, перейдем к исходному вопросу, на который вы хотели получить ответ, поскольку мы знаем, что у нас есть:Pr(Em)1m

i<nPr(Ei)n

И в качестве числовой проверки ниже приведен логарифмический график суммы, , против размера экземпляра, n . Каждая точка представляет собой среднее из суммы 100 000 экземпляров. Функция х 1 / 2 была построена для справки:Snx1/2

введите описание изображения здесь

Хотя я не вижу прямой связи между ними, уловки и окончательная форма этой проблемы имеют много общего с проблемой дня рождения, как первоначально предполагалось в комментариях.


4
Как вы получаете ? Например, для n = 100 я вычисляю, что P r ( E 2 ) = 0,267946 > 0,14761 = P r ( F 1 ) P r ( F 2 ) .Pr(E2)Pr(F1)×Pr(F2)n=100Pr(E2)=0.267946>0.14761=Pr(F1)Pr(F2).Если вам говорят, что первая корзина пуста, повышает ли это вероятность того, что первые две корзины содержат не более шара? Это более вероятно, поэтому P r ( F 1 ) P r ( F 2 ) является заниженной. 1Pr(F1)Pr(F2)
Дуглас Заре

@DouglasZare, я проверил твои расчеты, ты прав. Служит мне правильно, чтобы не быть более строгим.
user834

15

Ответ .Θ(n)

Во-первых, давайте вычислим .En1

Давайте предположим, что мы бросаем шаров в nnn бинов и посмотрим на вероятность того, что бин содержит ровно шаров. Эта вероятность исходит из распределения Пуассона, и когда n переходит к ∞, вероятность того, что в данном бине ровно k шаров, равна 1knk,1e1k!

Теперь давайте посмотрим на другой способ распределения шаров по корзинам. Мы бросаем несколько шаров в каждую ячейку, выбранную из распределения Пуассона, и при условии, что всего будет шаров. Я утверждаю, что это дает точно такое же распределение, как и бросание n шаров в n бинов. Почему? Легко видеть, что вероятность наличия k j шаров в jnnnkjj ом бине пропорциональна в обоих дистрибутивах.j=1n1kj!

Итак, давайте рассмотрим случайную прогулку, где на каждом шаге вы переходите от к t + 1 - k с вероятностью 1tt+1k, Я утверждаю, что если вы при условии, что эта случайная прогулка возвращается к 0 послеп1e1k!n шагов, вероятность того, что это случайное число всегда останется выше - это вероятность, которую ОП хочет вычислить. Почему? Эта высота случайного блуждания после s шагов равна s минус количество шаров в первых s корзинах.0sss

Если бы мы выбрали случайную прогулку с вероятностью 12 при подъеме или опускании на каждом шаге, это будет классическая проблема голосования , для которой ответ 11 . Это вариант проблемы голосования, который был изучен (см.Эту статью), и ответ до сих порΘ(112(n1) . Я не знаю, есть ли простой способ вычислить константу дляΘ ( 1Θ(1n)для этого случая.Θ(1n)

В той же статье показано, что, когда случайное блуждание обусловлено окончанием на высоте , вероятность всегда оставаться положительной составляет Θ ( k / n ), пока k = O ( kΘ(k/n). Этот факт позволит нам оценитьEsдля любогоs.k=O(n)Ess

Я собираюсь быть немного неуклюжим до конца моего ответа, но стандартные методы вероятности могут использоваться, чтобы сделать это строгим.

Мы знаем, что при переходе к это случайное блуждание сходится к броуновскому мосту, т. Е. Броуновскому движению, обусловленному началом и концом в 0 . Из общих теорем вероятностей для ϵ n < s < (n0 случайное блуждание примерно равно Θ ( ϵn<s<(1ϵ)nотосих. В случае, если он имеет высотуt>0, вероятность того, что он оставался выше0 втечение всего времени, предшествующегоs,равнаΘ(t/s). Посколькут, вероятно, будетΘ(Θ(n)xt>00sΘ(t/s)tкогдаs=Θ(n), имеемEsΘ(1/Θ(n)s=Θ(n).EsΘ(1/n)


4

[Edit 2014-08-13: Благодаря комментарию Питера Шора я изменил свою оценку асимптотического темпа роста этой серии.]

Я считаю, что растет как limni<nPr(Ei) . У меня нет доказательств, но я думаю, что у меня есть убедительный аргумент.n

Пусть - случайная величина, которая дает количество шаров в bin i . Пусть B i , j = j k = i B k - случайная величина, которая дает общее количество шаров в бинах i черезBi=f(i)iBi,j=k=ijBki включительно.j

Теперь вы можете написать для любого j < i . Для этого введем функции π и g i .Pr(Ei)=b<jPr(EjB1,j=b)Pr(EiEjB1,j=b)j<iπgi

π(j,k,b)=Pr(Bj=kB1,j1=b)=(nbk)(1nj+1)k(njnj+1)nbk

gi(j,k,b)=Pr(EiBj,ikEj1B1,j1=b)={0k<01k>=0j>il=0jb1π(j,l,b)gi(j+1,kl,b+l)otherwise

We can write Pr(Ei) in terms of gi:

Pr(Ei)=gi(1,i1,0)

Now, it's clear from the definition of gi that

Pr(Ei)=(ni)ni+1nnhi(n)

where hi(n) is a polynomial in n of degree i1. This makes some intuitive sense too; at least ni+1 balls will have to be put in one of the (i+1)th through nth bins (of which there are ni).

Since we're only talking about Pr(Ei) when n, only the lead coefficient of hi(n) is relevant; let's call this coefficient ai. Then

limnPr(Ei)=aiei

How do we compute ai? Well, this is where I'll do a little handwaving. If you work out the first few Ei, you'll see that a pattern emerges in the computation of this coefficient. You can write it as

ai=μi(1,i1,0)
where
μi(j,k,b)={0k<01k>=0i>jl=0jb11l!μi(j+1,kl,b+l)otherwise

Now, I wasn't able to derive a closed-form equivalent directly, but I computed the first 20 values of Pr(Ei):

N       a_i/e^i
1       0.367879
2       0.270671
3       0.224042
4       0.195367
5       0.175467
6       0.160623
7       0.149003
8       0.139587
9       0.131756
10      0.12511
11      0.119378
12      0.114368
13      0.10994
14      0.105989
15      0.102436
16      0.0992175
17      0.0962846
18      0.0935973
19      0.0911231
20      0.0888353

Now, it turns out that

Pr(Ei)=iii!ei=Pois(i;i)

where Pois(i;λ) is the probability that a random variable X has value i when it's drawn from a Poisson distribution with mean λ. Thus we can write our sum as

limni=1nPr(Ei)=x=1xxx!ex

Wolfram Alpha tells me this series diverges. Peter Shor points out in a comment that Stirling's approximation allows us to estimate Pr(Ei):

limnPr(Ex)=xxx!ex12πx

Let

ϕ(x)=12πx

Since

  • limxϕ(x)ϕ(x+1)=1
  • ϕ(x) is decreasing
  • 1Nφ(Икс)dИкс в качестве N

наша серия растет как 1Nφ(Икс)dИкс(См., Например, теорему 2 ). То есть,

Σязнак равно1Nпр(Ея)знак равноΘ(N)

1
Вольфрам Альфа не прав. Используйте формулу Стерлинга . Это говорит о том, чтоИксИкс/(Икс!еИкс)1/2πИкс,
Питер Шор

@PeterShor Спасибо! Я обновил заключение благодаря вашей проницательности, и теперь я согласен с двумя другими ответами. Мне интересно увидеть 3 совершенно разных подхода к этой проблеме.
ruds

4

Исчерпывающая проверка первых нескольких терминов (путем изучения всех n ^ n случаев) и небольшого поиска показывает, что ответ https://oeis.org/A036276 /NN, Это подразумевает, что ответ~N12π2,

Точнее, ответ:

N!2NNΣКзнак равно0N-2NКК!
и нет закрытого ответа.

Oeis довольно круто
Томас Але
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.