Преобразование статистики заказов


9

X1,...,XnY1,...,YnU(0,a)Zn=nlogmax(Y(n),X(n))min(Y(n),X(n))Exp(1)

Я начал эту проблему, установив Тогда будет распределяться как а будет распределяться как Плотности можно легко найти как и{X1,...,Xn,Y1,...Yn}={Z1,...,Zn}max(Yn,Xn)=Z(2n)мин(Yn,Xn)=Z(1)1-(1-z(Za)2Nмин(YN,ИксN)знак равноZ(1)fZ 1 (z)=(2n)(1-z1(1za)2n fZ ( 2 n ) (z)=(2n)(zfZ1(z)=(2n)(1za)2n11afZ(2n)(z)=(2n)(za)2n11a

Это где мне трудно знать, куда идти дальше, когда они рассчитаны. Я думаю, что это должно сделать что-то с преобразованием, но я не уверен ...


Конечно, вы должны предположить, кроме того, что не только и , но также не зависят от . Учитывая это, вы думали о работе напрямую с ? Y i X i Y j log ( Z i )XiYiXiYjlog(Zi)
whuber

@whuber Моя мысль из вашего комментария будет состоять в том, чтобы настроить преобразование, где я решу плотность n * log (Z )? i
Сьюзен

Я немного переформатировал (особенно превратив и в и ), но если вам не нравится, как он есть, вы можете вернуться к предыдущей версии (нажав на ссылку «отредактировано <x> назад») выше моего граватара внизу вашего поста) и затем нажмите ссылку "откат" над вашей предыдущей версией. м я н лог минlogminlogmin
Glen_b

3
Сьюзен, ты, кажется, неправильно понял / неправильно понял вопрос. Вопрос ищет соотношение Знаменатель относится к : где - статистика максимального порядка s, а - статистика максимального порядка s. Другими словами, ищет min (maxX, maxY), а НЕ минимум всех s и s, поэтому вы не можете использовать свой трюк Z чтобы сгладить / объединить все значения X и Y. ....... min(Y(n),X(n))Y(n)YX(n)Xmin(
max(Y(n),X(n))min(Y(n),X(n))
min(Y(n),X(n))Y(n)YX(n)Xmin(Y(n),X(n))XY
волки

2
В любом случае, и как отдельный вопрос, нет смысла (как вы это делали) вычислять плотность , а отдельно плотность , потому что статистика разных порядков не как правило, независимый Чтобы найти соотношение , нужно сначала найти совместный pdf из , если это было проблемой под рукой (чего нет). Z ( 2 n ) Z ( 2 n ) / Z ( 1 ) ( Z ( 1 ) , Z ( 2 n ) )Z(1)Z(2n)Z(2n)/Z(1)(Z(1),Z(2n))
волки

Ответы:


2

Эта проблема может быть решена только из определений: единственный сложный расчет - это интеграл от монома.


Предварительные наблюдения

Работа Давайте с переменными и Y я / во всем : это не меняет Z п , но это делает ( X 1 , ... , Y п ) IID с Uniform ( 0 , 1 ) распределения, устраняя все отвлекающие появлений а в расчетах. Таким образом, мы можем принять a = 1 без потери общности.Xi/aYi/aZn(X1,,Yn)(0,1)aa=1

Обратите внимание, что независимость и их равномерное распределение подразумевают, что для любого числа y, для которого 0 y 1 ,Yiy0y1

Pr(yY(n))=Pr(yY1,,yYn)=Pr(yY1)Pr(yYn)=yn,

с идентичным результатом для . Для дальнейшего использования это позволяет нам вычислитьX(n)

E(2X(n)n)=012xnd(xn)=012nx2n1dx=1.

Решение

Пусть будет положительным вещественным числом. Чтобы найти распределение Z n , подставьте его определение и упростите полученное неравенство:tZn

Pr(Zn>t)=Pr(Zn/n>t/n)=Pr(exp(Zn/n)>et/n)=Pr(max(X(n),Y(n))min(X(n),Y(n))>et/n)=Pr(et/nmax(X(n),Y(n))>min(X(n),Y(n))).

Это событие разбивается на два равновероятных случая, в зависимости от того, является ли или Y ( n ) меньшим из двух (и их пересечение с нулевой вероятностью может быть проигнорировано). Таким образом, нам нужно только вычислить вероятность одного из этих случаев (скажем, где Y ( n ) меньше) и удвоить его. Так как t 0 , 0 e - t / n X ( n )1 , что позволяет нам (при сдаче e - t / n XX(n)Y(n)Y(n)t00et/nX(n)1 играть рольy) применять вычисления в предварительном разделе:et/nX(n)y

Pr(Zn>t)=2Pr(et/nX(n)>Y(n))=2E[(et/nX(n))n]=etE[2X(n)n]=et.

Вот что значит для распределение Exp ( 1 ) .Zn(1)


4

Я нарисую решение, используя компьютерную алгебру, чтобы сделать все необходимое ...

Решение

Если - выборка размера n на родительском X Uniform ( 0 , a ) , тогда pdf максимума выборки: f n ( x ) = nX1,...,XnnXUniform(0,a)и аналогично дляY.

fn(x)=nanxn1
Y

Подход 1: Найти совместную pdf из (X(n),Y(n))

Поскольку и Y независимы, объединенный pdf из 2 выборочных максимумов ( X ( n ) , Y ( n ) ) является просто произведением 2 pdf, скажем, f ( n ) ( x , y ) :XY(X(n),Y(n))f(n)(x,y)

введите описание изображения здесь

Дано . Тогда cdf дляZn- этоP(Zn<z):Zn=nlogmax(Y(n),X(n))min(Y(n),X(n))ZnP(Zn<z)

введите описание изображения здесь

где я использую Probфункцию из пакета mathStatica для Mathematica для автоматизации. Дифференцирование cdf по дает pdf из Z n как стандартную экспоненциальную.zZn


Подход 2: Статистика заказов

Мы можем использовать статистику заказов, чтобы «обойти» механику необходимости иметь дело с функциями Max и Min.

Еще раз: Если - выборка размера n в родительском X Uniform ( 0 , a ) , тогда pdf максимума выборки W = X ( n ) , скажем, f n ( w ) : X1,...,XnnXUniform(0,a)W=X(n)fn(w)

введите описание изображения здесь

Выборочные максимумы и Y ( n ) являются всего лишь двумя независимыми чертежами из этого распределения W ; т. е. статистика W порядка 1 s t и 2 n d (в выборке размера 2) - это как раз то, что мы ищем:X(n)Y(n)W1st2ndW

  • W(1)=min(Y(n),X(n))

  • W(2)=max(Y(n),X(n))

Объединенный PDF в выборке размером 2, скажем, g ( . , . ) , Имеет вид:(W(1),W(2))g(.,.)

введите описание изображения здесь

Дано . Тогда cdf дляZn- этоP(Zn<z):Zn=nlogmax(Y(n),X(n))min(Y(n),X(n))ZnP(Zn<z)

enter image description here

Преимущество этого подхода состоит в том, что при вычислении вероятности больше не используются функции max / min, что может сделать вывод (особенно вручную) несколько проще для выражения.

Другой

Согласно моему комментарию выше, похоже, вы неправильно поняли вопрос ...

Нас просят найти:

Zn=nlogmax(Y(n),X(n))min(Y(n),X(n))

где знаменатель мин (Xmax, YMAX), ... не менее все в «с и Y » s.XY


Следуя вашему эскизу, я понимаю, как неправильно понял вопрос. Я понимаю, как рассчитать совместный pdf двух образцов максимума, но я все еще не уверен, как мы должны интерпретировать отношение макс / мин.
Сьюзен

Я добавил альтернативный вывод, используя статистику заказов, которая «обходит» максимум / мин.
волки

Если бы вы начали с журналов данных, Сьюзан, то вы бы смотрели на различия в статистике заказов, а не на отношения .
whuber

Я не уверен, что использование компьютерных формальных вычислений - лучший способ объяснить причину, по которой отношение является случайной величиной Exp (1).
Сиань

1
Хороший вопрос ... кроме того, что OP не спрашивает причину ... но показать, что это Exp [1]. Я также не уверен относительно того, является ли это домашним заданием (или заданием) ... и это на самом деле одно приятное преимущество использования компьютера: каждый обеспечивает шаги, которые нужно выполнить, проверяет результат, чтобы у каждого был правильный подход , но механика все еще оставлена ​​на ОП. Было бы неплохо, чтобы кто-то изучил предложение @ whuber о том, чтобы брать логи с самого начала.
волки
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.