Каков самый мощный результат о максимуме ид гауссиан? Наиболее используемый на практике?


9

Учитывая X1,,Xn,N(0,1) iid, рассмотрим случайные величины

Zn:=max1inXi.

Вопрос: Какой самый «важный» результат для этих случайных величин?

Чтобы прояснить «важность», какой результат имеет большинство других таких результатов как логическое следствие? Какой из результатов чаще всего используется на практике?

Более конкретно, среди (теоретических) статистиков, кажется, есть фольклорные знания о том, что Zn "в основном такие же, как" 2logn , хотя бы асимптотически. (См.Этот связанный вопрос.)

Тем не менее, есть много связанных результатов этого типа, и похоже, что большинство из них не эквивалентны и не подразумевают друг друга. Например , * ,

(1)Zn2logna.s.1,

что, если не что иное, также подразумевает соответствующие результаты в вероятности и распределении.

Тем не менее, это даже не предполагает, по-видимому, также связанные результаты (см. Этот другой вопрос ), как

(2)limnEZn2logn=1,

(это упражнение 2.17 на стр. 49 из ) или другой фольклорный результат :

(3)EZn=2logn+Θ(1).

Не асимптотически также известно, что для каждого n (см. Здесь для доказательства),

(4)clognEZn2logn

для небольшого c . Подобные результаты также могут быть показаны для |Zn|, поскольку Zn сильно перекошен.

Доказательство этого последнего результата гораздо проще, чем доказательства других результатов. Я надеялся, что первый асимптотический результат подразумевал бы все другие асимптотические результаты, так что я мог чувствовать себя уверенно, сосредотачивая все свое время и энергию для понимания этого результата. Но, опять же, это, по-видимому, не соответствует действительности , поэтому сейчас мне неясно, на чем я должен сосредоточиться.

См. Стр. 265-267 второго издания «Галамбоса»,«Асимптотическая теория статистики экстремальных порядков», напечатанного в 1987 году. Возможно, это также указано где-то в первом издании.

Бушерон, Лугоши, Массарт,Концентрационные неравенства: неасимптотическая теория независимости. В стороне:Эта книга на самом деле цитирует Galambos для рассматриваемого результата, но я не могу найти упоминание о нем нигде в Galambos - только первый результат, который я упомянул.


1
Знаете ли вы, что когда вы используете \ dots в MathJax, результат иногда выглядит так, как будто вы использовали \ ldots, а иногда, как если бы вы использовали \ cdots, в зависимости от контекста?
X_1, \dots, X_n, \dots \sim \mathscr{N}(0,1)X1,,Xn,N(0,1)X_1, \ldots, X_n, \ldots \sim \mathscr{N}(0,1)X1,,Xn,N(0,1)
этом вопросе я заменил \ dots на \ ldots.
Майкл Харди

@MichaelHardy О, я думал, что это всегда было в центре. Спасибо за исправление!
Chill2Macht

Ответы:


4

В любом вероятностном приложении наиболее фундаментальным объектом является распределение, из которого вытекают моменты и предельные свойства. Следовательно, самый «важный» результат, в том смысле, который вы описали, это полная функция распределения FZn(z)=Φn(z) (эквивалентно, соответствующая функция плотности). На практике этот результат распределения, возможно, менее показателен, чем некоторые из основных асимптотических свойств, которые вы уже перечислили. Хотя это логически подразумевает эти асимптотические результаты, на мой взгляд, эти результаты, вероятно, будут более полезными для понимания меняющейся природы экстремального значения при измененииn .

Из вашего вопроса ясно, что вы хорошо понимаете свойства экстремальных значений в случае максимума стандартных нормальных случайных величин IID. Все эти свойства логически выводятся из функции распределения для Zn , так что это самый фундаментальный объект в этой задаче. Как и во многих случаях, самый фундаментальный объект не обязательно является самым осветительным, и поэтому вы, вероятно, обнаружите, что вам нужно обойтись, зная все результаты и зная, что они освещают различные аспекты проблемы.


Спасибо за этот ответ - я ценю это. Знаете ли вы справочную информацию о том, как получить все эти свойства из функции распределения для ? Мне было чрезвычайно трудно найти что-нибудь, что объясняет это, потому что все это или «фольклор», или «рука». Zn
Chill2Macht

Для справки, я прочитал ссылки, и они не помогают. Вот почему я задал вопрос.
Chill2Macht

1
У меня нет конкретных рекомендаций, но я думаю, что эти результаты будут получены в книгах по теории экстремальных ценностей. Я бы посоветовал вам начать с поиска текстов для выпускников по этому предмету и посмотреть, сможете ли вы найти там выводы.
Бен - Восстановить Монику

1

WIP: работа в процессе

После р. 370 из 1946 математических методов статистики Крамера , определите

Ξn=n(1Φ(Zn)).
ЗдесьΦ - кумулятивная функция распределения стандартного нормального распределения,N(0,1) . Как следствие его определения, мы гарантируем, что0Ξnn почти наверняка.

Рассмотрим данную реализацию ωΩ нашего выборочного пространства. Тогда в этом смысле Zn является функцией от n и ω , а Ξn является функцией от Zn,n и ω . Для фиксированного ω мы можем считать Zn детерминированной функцией n , а Ξn детерминированной функцией Zn и n , что упрощает задачу. Мы стремимся показать результаты, которые почти наверняка справедливы для всех ωΩ , что позволяет нам переносить наши результаты из недетерминированного анализа в недетерминированный сеттинг.

После р. 374 из Крамерских математических методов статистики 1946 года , предположим на данный момент (я собираюсь вернуться и предоставить доказательство позже), что мы можем показать, что (для любого заданного ωΩ ) справедливо следующее асимптотическое разложение (используя интегрирование по частям и определение Φ ):

(~)2πnΞn=1ZneZn22(1+O(1Zn2))  as  Zn.

Ясно, что Zn+1Zn для любого n , и Zn почти наверняка является возрастающей функцией n при n , поэтому в дальнейшем мы утверждаем, что для (почти наверняка всех) фиксированных ω :

Znn.

Отсюда следует, что имеем (где обозначает асимптотическую эквивалентность ):

2πnΞn1Zne1Zn2  as  Znn.

То, как мы поступим в дальнейшем, по существу равнозначно методу доминирующего баланса , и наши манипуляции будут формально оправданы следующей леммой:

Лемма. Предположим, что f(n)g(n) при n и f(n) (таким образом, g(n) ). Тогда, учитывая любую функцию h которая формируется с помощью композиций, сложений и умножений логарифмов и степенных законов (по существу, любой функции « полилога »), мы также должны иметь это при n :

h(f(n))h(g(n)).
Другими словами, такие функции «полилога»сохраняют асимптотическую эквивалентность.

Истинность этой леммы является следствием теоремы 2.1. как написано здесь . Также обратите внимание, что ниже приводится в основном расширенная (более подробная) версия ответа на похожий вопрос, найденный здесь .

Взяв логарифмы обеих сторон, получим, что:

(1)log(2πΞn)lognlogZnZn22.

Это где Крамер несколько ловкий; он просто говорит , что «при условии , Ξn ограничена», мы можем заключить , бла - бла - бла. Но показывая, что Ξn соответственно ограничен, почти наверняка кажется немного нетривиальным. Кажется, что доказательство этого, по сути, может быть частью того, что обсуждается на стр. 265-267 Галамбоса, но я не уверен, учитывая, что я все еще работаю над пониманием содержания этой книги.

Во всяком случае, предполагая , можно показать , что logΞn=o(logn) , то из этого следует (так как Zn2/2 Термин доминирует logZn термин) , что:

lognZn22Zn2logn.

Это несколько приятно, так как это уже большая часть того, что мы хотим показать, хотя, опять же, стоит отметить, что это, по сути, только пинает банку в будущем, так как теперь мы должны показать некоторую определенную почти наверняка ограниченность Ξn , С другой стороны, Ξn имеет одинаковое распределение для любого максимума iid непрерывных случайных величин, так что это может быть отслеживаемым.

Во всяком случае, если Zn2logn как, то ясно также можно сделать вывод, чтоZn2logn(1+α(n))для любогоα(n)который равенo(1)приn. Используя нашу лемму о функциях полилога, сохраняющих асимптотическую эквивалентность выше, мы можем подставить это выражение обратно в(1)чтобы получить:

log(2πΞn)lognlog(1+α)12log212loglognlogn2αlognα2logn.

log(Ξn2π)log(1+α)+12log2+12loglogn+2αlogn+α2logn.

Здесь мы должны пойти еще дальше и предположить, что logΞn=o(loglogn)  as  n почти наверняка . Опять же , все Крамер говорит, «предполагая , Ξn ограничена». Но поскольку все, что можно априори сказать о Ξn состоит в том, что 0Xinn as, то вряд ли кажется очевидным, что Ξn=O(1) почти наверняка следует иметь , что, по-видимому, является сущностью утверждения Крамера.

But anyway, assuming one believes that, then it follows that the dominant term which does not contain α is 12loglogn. Since α=o(1), it follows that α2=o(α), and clearly log(1+α)=o(α)=o(o(αlogn)), so the dominant term containing α is 2αlogn. Therefore, we can rearrange and (dividing everything by 12loglogn or 2αlogn) find that

12loglogn2αlognαloglogn4logn.

Therefore, substituting this back into the above, we get that:

Zn2lognloglogn22logn,

again, assuming we believe certain things about Ξn.

We rehash the same technique again; since Zn2lognloglogn22logn, then it also follows that

Zn2lognloglogn22logn(1+β(n))=2logn(1loglogn8logn(1+β(n))),

when β(n)=o(1). Let's simplify a little before substituting directly back into (1); we get that:

logZnlog(2logn)+log(1loglogn8logn(1+β(n)))log(O(1))=o(logn)log(2logn).

Zn22logn12loglogn(1+β)+(loglogn)28logn(1β)2o((1+β)loglogn)logn12(1+β)loglogn.

Substituting this back into (1), we find that:

log(2πΞn)lognlog(2logn)logn+12(1+β)loglognβlog(4πΞn2)loglogn.

Therefore, we conclude that almost surely

Zn2lognloglogn22logn(1+log(4π)+2log(Ξn)loglogn)=2lognloglogn+log(4π)22lognlog(Ξn)2logn.

This corresponds to the final result on p.374 of Cramer's 1946 Mathematical Methods of Statistics except that here the exact order of the error term isn't given. Apparently applying this one more term gives the exact order of the error term, but anyway it doesn't seem necessary to prove the results about the maxima of i.i.d. standard normals in which we are interested.


Given the result of the above, namely that almost surely:

()Zn2lognloglogn+log(4π)22lognlog(Ξn)2lognZn=2lognloglogn+log(4π)22lognlog(Ξn)2logn+o(1).

2. Then by linearity of expectation it follows that:

EZn=2lognloglogn+log(4π)22lognE[log(Ξn)]2logn+o(1)EZn2logn=1E[logΞn]2logn+o(1).

Therefore, we have shown that

limnEZn2logn=1,

as long as we can also show that

E[logΞn]=o(logn).

This might not be too difficult to show since again Ξn has the same distribution for every continuous random variable. Thus we have the second result from above.

1. Similarly, we also have from the above that almost surely:

Zn2logn=1log(Ξn)2logn+o(1),.

Therefore, if we can show that:

(*)log(Ξn)=o(logn) almost surely,

then we will have shown the first result from above. Result (*) would also clearly imply a fortiori that E[log(Ξn)]=o(logn), thereby also giving us the first result from above.

Also note that in the proof above of () we needed to assume anyway that Ξn=o(logn) almost surely (or at least something similar), so that if we are able to show () then we will most likely also have in the process needed to show Ξn=o(logn) almost surely, and therefore if we can prove () we will most likely be able to immediately reach all of the following conclusions.

3. However, if we have this result, then I don't understand how one would also have that EZn=2logn+Θ(1), since o(1)Θ(1). But at the very least it would seem to be true that

EZn=2logn+O(1).


So then it seems that we can focus on answering the question of how to show that

Ξn=o(logn) almost surely.

We will also need to do the grunt work of providing a proof for (~), but to the best of my knowledge that is just calculus and involves no probability theory, although I have yet to sit down and try it yet.

First let's go through a chain of trivialities in order to rephrase the problem in a way which makes it easier to solve (note that by definition Ξn0):

Ξn=o(logn)limnΞnlogn=0ε>0,Ξnlogn>ε only finitely many timesε>0,Ξn>εlogn only finitely many times.

One also has that:

Ξn>εlognn(1F(Zn))>εlogn1F(Zn)>εlognnF(Zn)<1εlognnZninf{y:F(y)1εlognn}.

Correspondingly, define for all n:

un(ε)=inf{y:F(y)1εlognn}.

Therefore the above steps show us that:

Ξn=o(logn) a.s.P(Ξn=o(logn))=1P(ε>0,Ξn>εlogn only finitely many times)=1P(ε>0,Znun(ε) only finitely many times)=1P(ε>0,Znun(ε) infinitely often)=0.

Notice that we can write:

{ε>0,Znun(ε) infinitely often}=ε>0{Znun(ε) infinitely often}.

The sequences un(ε) become uniformly larger as ε decreases, so we can conclude that the events

{Znun(ε) infinitely often}
are decreasing (or at least somehow monotonic) as ε goes to 0. Therefore the probability axiom regarding monotonic sequences of events allows us to conclude that:

P(ε>0,Znun(ε) infinitely often)=P(ε>0{Znun(ε) infinitely often})=P(limε0{Znun(ε) infinitely often})=limε0P(Znun(ε) infinitely often).

Therefore it suffices to show that for all ε>0,

P(Znun(ε) infinitely often)=0

because of course the limit of any constant sequence is the constant.

Here is somewhat of a sledgehammer result:

Theorem 4.3.1., p. 252 of Galambos, The Asymptotic Theory of Extreme Order Statistics, 2nd edition. Let X1,X2, be i.i.d. variables with common nondegenerate and continuous distribution function F(x), and let un be a nondecreasing sequence such that n(1F(un)) is also nondecreasing. Then, for un<sup{x:F(x)<1},

P(Znun infinitely often)=0 or 1
according as
j=1+[1F(uj)]exp(j[1F(uj)])<+ or =+.

The proof is technical and takes around five pages, but ultimately it turns out to be a corollary of one of the Borel-Cantelli lemmas. I may get around to trying to condense the proof to only use the part required for this analysis as well as only the assumptions which hold in the Gaussian case, which may be shorter (but maybe it isn't) and type it up here, but holding your breath is not recommended. Note that in this case ω(F)=+, so that condition is vacuous, and n(1F(n)) is εlogn thus clearly non-decreasing.

Anyway the point being that, appealing to this theorem, if we can show that:

j=1+[1F(uj(ε))]exp(j[1F(uj(ε))])=j=1+[εlogjj]exp(εlogj)=εj=1+logjj1+ε<+.

Note that since logarithmic growth is slower than any power law growth for any positive power law exponent (logarithms and exponentials are monotonicity preserving, so loglognαlognlognnα and the former inequality can always be seen to hold for all n large enough due to the fact that lognn and a change of variables), we have that:

j=1+logjj1+εj=1+jε/2j1+ε=j=1+1j1+ε/2<+,

since the p-series is known to converge for all p>1, and ε>0 of course implies 1+ε/2>1.

Thus using the above theorem we have shown that for all ε>0, P(Znun(ε) i.o.)=0, which to recapitulate should mean that Ξn=o(logn) almost surely.

We need to show still that logΞn=o(loglogn). This doesn't follow from the above, since, e.g.,

1nlogn=o(logn),logn+loglogno(logn).

However, given a sequence xn, if one can show that xn=o((logn)δ) for arbitrary δ>0, then it does follow that log(xn)=o(loglogn). Ideally I would like to be able to show this for Ξn using the above lemma (assuming it's even true), but am not able to (as of yet).

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.