Ожидаемое значение статистики минимального заказа из обычной выборки


9

ОБНОВЛЕНИЕ 25 января 2014: ошибка теперь исправлена. Пожалуйста, игнорируйте рассчитанные значения ожидаемого значения в загруженном изображении - они неверны - я не удаляю изображение, потому что оно сгенерировало ответ на этот вопрос.

ОБНОВЛЕНИЕ 10 января 2014: ошибка была найдена - математическая опечатка в одном из использованных источников. Готовимся к исправлению ...

Плотность статистики минимального порядка из коллекции iid непрерывных случайных величин с cdf и pdf равна F X ( x ) f X ( x ) f X ( 1 ) ( x ( 1 ) ) = n f X ( x ( 1 ) ) [ 1 - F X ( x ( 1 ) ) ] n - 1nFX(x)fX(x)

fX(1)(x(1))=nfX(x(1))[1FX(x(1))]n1[1]

Если эти случайные величины стандартно нормальны, то

fX(1)(x(1))=nϕ(x(1))[1Φ(x(1))]n1=nϕ(x(1))[Φ(x(1))]n1[2]
поэтому его ожидаемое значение равно
E(X(1))=nx(1)ϕ(x(1))[Φ(x(1))]n1dx(1)[3]

где мы использовали симметричные свойства стандартной нормали. В Owen 1980 , p. 402, уравнение [ n, 011 ] мы находим, что

-Zφ(Z)[Φ(aZ)]мdZзнак равноaм(a2+1)(2π)-φ(Z)[Φ(aZa2+1)]м-1dZ[4]

Сопоставляя параметры между уравнениями и ( , ), получаем[3][4]aзнак равно-1мзнак равноN-1

Е(Икс(1))знак равно-N(N-1)2π-φ(Икс(1))[Φ(-Икс(1)2)]N-2dИкс(1)[5]

Снова в Оуэн 1980, р. 409, экв [ n0,010.2 ], мы находим, что

-[Πязнак равно1мΦ(чася-dяZ1-dя2)]φ(Z)dZзнак равноZм(час1,,,,,часм;{ρяJ})[6]

где - стандартная многомерная нормаль, - коэффициенты парной корреляции и .Zм()ρяJзнак равноdяdJ,яJ-1dя1

Соответствуя и мы имеем, , и [5][6]мзнак равноN-2часязнак равно0,я

dя1-dя2знак равно12dязнак равно±13яρяJзнак равноρзнак равно1/3

Используя эти результаты, уравнение становится[5]

Е(Икс(1))знак равно-N(N-1)2πZN-2(0,,,,,0;ρзнак равно1/3)[7]

Этот многовариантный стандартный нормальный интеграл вероятности от равноскоррелированных переменных, все оцениваемые в нуле , получил достаточное количество исследований, и были получены различные способы его аппроксимации и вычисления. Обширным обзором (связанным с вычислением многомерных нормальных интегралов вероятности в целом) является Гупта (1963) . Gupta предоставляет явные значения для различных коэффициентов корреляции и максимум для 12 переменных (таким образом, он охватывает набор из 14 переменных). Результаты (ПОСЛЕДНЯЯ КОЛОННА НЕПРАВИЛЬНА) :

введите описание изображения здесь

Теперь, если мы построим график изменения значения зависимости от , получимZN-2(0,,,,,0;ρзнак равно1/3)N

введите описание изображения здесь

Так я приезжаю в моих трех вопросов / запросов:
1) Не могли бы проверить , что ктото аналитически и / или проверить с помощью моделирования , что результаты для ожидаемого значения являются правильными (т.е. проверить справедливость формулы )?[7]

2) Предполагая, что подход правильный, может ли кто-нибудь дать решение для нормалей с ненулевым средним и неунитарной дисперсией? При всех трансформациях я чувствую головокружение.

3) Значение интеграла вероятности, кажется, развивается плавно. Как насчет аппроксимации какой-нибудь функцией ?N

Ответы:


6

Ваши результаты не отображаются правильно. Это легко увидеть без каких-либо вычислений, потому что в вашей таблице ваш увеличивается с размером выборки ; очевидно, ожидаемое значение минимума выборки должно уменьшаться (то есть становиться более отрицательным) по мере увеличения размера выборки .Е[Икс(1)] NN

Проблема концептуально довольно проста.

Вкратце: если ~ с pdf :ИксN(0,1)е(Икс)

введите описание изображения здесь

... тогда pdf статистики 1-го порядка (в выборке размера ):N

введите описание изображения здесь

... полученный здесь с помощью OrderStatфункции in mathStatica, с областью поддержки:

введите описание изображения здесь

Тогда для можно легко получить точно так же, как:Е[Икс(1)]Nзнак равно1,2,3

введите описание изображения здесь

Точный случай приблизительно , что, очевидно, отличается от вашей работы -1,06 (строка 1 вашей таблицы), поэтому кажется, что с вашей работой что-то не так (или, возможно, мое понимание того, что вы ищете) ,Nзнак равно3-0.846284

Для получение решений в замкнутой форме более сложно, но даже если символическое интегрирование оказывается трудным, мы всегда можем использовать численное интегрирование (с произвольной точностью, если это необходимо). Это действительно очень просто ... вот, например, для размера выборки с использованием Mathematica :N4Е[Икс(1)]Nзнак равно1

 sol = Table[NIntegrate[x g, {x, -Infinity, Infinity}], {n, 1, 14}]

{0., -0.56419, -0.846284, -1.02938, -1.16296, -1.26721, -1.35218, -1.4236, -1.48501, -1.53875, -1.58644, -1.62923, -1.66799, -1.70338}

Все сделано. Эти значения, очевидно, сильно отличаются от значений в вашей таблице (правая колонка).

Чтобы рассмотреть более общий случай родителя , действуйте точно так же, как описано выше, начиная с общего нормального pdf.N(μ,σ2)


Спасибо за ответ. Действительно, я слишком заметил, что с числовыми результатами что-то не так - в конце концов, ожидаемое значение должно увеличиваться в абсолютном размере, а не уменьшаться при увеличении . Я оставил ответ, как есть, чтобы посмотреть, смогу ли я получить представление от любого ответа. Я все еще ищу на теоретическом уровне, где именно ошибка, подозреваемым является первое уравнение, которое я использую от Оуэна (потому что второе было проверено другими источниками) ... кстати, не могли бы вы проверить, является ли это уравнение в мой пост (как самостоятельное преобразование) правильный? Буду признателен. 4N4
Алекос Пападопулос
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.