Упорядочить статистику (например, минимум) бесконечного набора переменных хи-квадрат?

Это мой первый раз здесь, поэтому, пожалуйста, дайте мне знать, если я смогу уточнить свой вопрос каким-либо образом (включая форматирование, теги и т. Д.). (И, надеюсь, я смогу редактировать позже!) Я пытался найти ссылки и пытался решить сам, используя индукцию, но потерпел неудачу в обоих случаях.

Я пытаюсь упростить распределение, которое, кажется, сводит к статистике порядка счетного бесконечного набора независимых случайных величин с различными степенями свободы; в частности, каково распределение го наименьшего значения среди независимых ? $\chi^2$ $m$ $\chi^2_2,\chi^2_4,\chi^2_6,\chi^2_8,\ldots$

Я был бы заинтересован в особом случае : каково распределение минимума (независимых) ? $m=1$ $\chi^2_2,\chi^2_4,\chi^2_6,\ldots$

Для случая минимума я смог написать интегральную функцию распределения (CDF) как бесконечный продукт, но не могу упростить ее дальше. Я использовал тот факт, что CDF имеет вид (При это подтверждает второй комментарий ниже об эквивалентности с экспоненциальным распределением с ожиданием 2.) Тогда CDF минимума можно записать как Первый член в произведении - это просто , а «последний» - это $\chi^2_{2m}$

F_{2 m} (x) = γ (m, x / 2) / Γ (m) = γ (m, x / 2) / (m - 1)! = 1 - e^{- x / 2} \sum_{k = 0}^{m - 1} x^{k} / (2^{k} k!) .

$F_{2m}(x)=\gamma(m,x/2)/\Gamma(m)=\gamma(m,x/2)/(m-1)!=1-e^{-x/2}\sum_{k=0}^{m-1}x^k/(2^k k!).$

m = 1

$m=1$

F_{m i n} (x) = 1 - (1 - F_{2} (x)) (1 - F_{4} (x)) \dots = 1 - \prod_{m = 1}^{\infty} (1 - F_{2 m} (x))

$F_{min}(x) = 1-(1-F_2(x))(1-F_4(x))\ldots = 1-\prod_{m=1}^\infty (1-F_{2m}(x))$

= 1 - \prod_{m = 1}^{\infty} (e^{- x / 2} \sum_{k = 0}^{m - 1} \frac{x^{k}}{2^{k} k!}) .

$= 1- \prod_{m=1}^\infty \left(e^{-x/2}\sum_{k=0}^{m-1}\frac{x^k}{2^k k!}\right).$

e^{- x / 2}

$e^{-x/2}$

e^{- x / 2} \sum_{k = 0}^{\infty} x^{k} / (2^{k} k!) = 1

$e^{-x/2}\sum_{k=0}^\infty x^k/(2^k k!)=1$ . Но я не знаю, как (если это возможно?) Упростить это оттуда. Или, может быть, совершенно другой подход лучше.

Другое потенциально полезное напоминание: - это то же самое, что и экспоненциальное распределение с ожиданием 2, а - это сумма двух таких экспонент и т. Д. $\chi^2_2$ $\chi^2_4$

Если кому-то интересно, я пытаюсь упростить теорему 1 в этой статье для случая регрессии по константе ( для всех ). (У меня есть вместо так как я умножил на .) $x_i=1$ $i$ $\chi^2$ $\Gamma$ $2\kappa$

— Дэвид М Каплан
источник

Имеет ли это ответ на ваш вопрос?

— mpiktas

χ_{2}^{2}

$\chi^2_2$

χ_{4}^{2}, χ_{6}^{2}, \dots

$\chi^2_4,\chi^2_6,\ldots$

X_{k}

$X_k$

λ / 2

$\lambda/2$

k = 1, 2, \dots

$k=1,2,\ldots$

1 - F_{m i n} (λ)

$1-F_{min}(\lambda)$

X_{k} \leq k

$X_k \le k$

T_{1}, T_{2}, \dots

$T_1, T_2, \ldots$

E x p (1 / 2)

$\mathrm{Exp}(1/2)$

N (t) := sup {n : \sum_{i = 1}^{n} T_{i} \leq t}

$N(t) := \sup\{n: \sum_{i=1}^n T_i \leq t\}$

1 / 2

$1/2$

U_{1} = T_{1}

$U_1 = T_1$

U_{2} = T_{2} + T_{3}

$U_2 = T_2 + T_3$

U_{3} = T_{4} + T_{5} + T_{6}

$U_3 = T_4 + T_5 + T_6$

U_{i} \sim χ_{2 i}^{2}

$U_i\sim\chi_{2i}^2$ являются независимыми и благодаря стационарному свойству независимых приращений пуассоновского процесса имеем .

P (U_{i} \geq t) = P (N (t) \leq i)

$\mathbb{P}(U_i \geq t) = \mathbb{P}( N(t) \leq i)$

— кардинал

@Cardinal Конечно, это хороший способ увидеть это. Любопытство не в отношениях между Пуассоном и Гаммой; оно заключается в описании самого события!

— whuber

Ответы:

Нули бесконечного произведения будут объединением нулей слагаемых. Вычисление до 20-го семестра показывает общую закономерность:

участок сложных нулей

Этот график нулей в комплексной плоскости различает вклад отдельных членов в произведение с помощью различных символов: на каждом шаге кажущиеся кривые расширяются еще дальше, а новая кривая начинается еще левее.

Сложность этой картины демонстрирует, что не существует решения в замкнутой форме с точки зрения хорошо известных функций высшего анализа (таких как гамма, тэты, гипергеометрические функции и т. Д.), А также элементарных функций, которые рассматриваются в классическом тексте, таком как Уиттекер. И Уотсон ).

Таким образом, проблема может быть более плодотворно сформулирована немного по-другому : что вам нужно знать о распределении статистики заказов? Оценки их характерных функций? Моменты низкого порядка? Приближения к квантилям? Что-то другое?

— Whuber
источник

Почему нули продукта важны? Я чувствую, что упускаю что-то тривиальное.

— mpiktas

@mp Нули и полюсы показывают кое-что о сложности функции. Рациональные функции имеют конечное число из них. Элементарные функции обычно имеют строку нулей, например, при , интеграл для ; типичные «трансцендентные» функции имеют несколько более сложные паттерны нулей, например, у всех неположительных целых чисел (обратных к гамма-функции) или на решетке точек (тета-функции и эллиптические функции). Сложный образец, представленный здесь, предполагает, что будет трудно или невозможно выразить CDF в терминах этих знакомых функций.

2 i π n

$2i\pi n$

n

$n$

\exp ()

$\exp()$

— whuber

@whuber (1/2), спасибо! Я не знал о различных классах функций, имеющих эти различные структуры нулей в комплексной плоскости; это звучит очень полезно, и ваш график, кажется, отвечает на мой вопрос (как изложено).

— Дэвид М Каплан

@whuber (2/2), это проверял особый случай (сложного) распределения оценки, приведенной в другой статье. Они использовали существование дистрибутива, чтобы оправдать использование начальной загрузки; Мой советник предложил мне приблизиться к распределению. Кажется, что их распространение может быть отключено для этого особого случая (где я знаю, что это должно быть), поэтому я проверю с моим консультантом после его крайнего срока предоставления гранта; но, возможно, я бы попытался взять расширение порядка го порядка более высокого порядка (деленное на ) как , в более сложной ситуации. Опубликуем еще раз, если так; еще раз спасибо!

m

$m$

m

$m$

m \to \infty

$m\to\infty$

— Дэвид М Каплан

Каково распределение минимума (независимых) ? $\chi^2_2,\chi^2_4,\chi^2_6,\ldots$

Извиняюсь за опоздание примерно на 6 лет. Несмотря на то, что ФП, вероятно, перешел к другим проблемам, вопрос остается свежим, и я подумал, что мог бы предложить другой подход.

Нам даны где где с pdf : $(X_1, X_2, X_3, \dots)$ $X_i \sim \text{Chisquared}(v_i)$ $v_i= 2i$ $f_i(x_i)$

Вот график соответствующего pdf при увеличении размера выборки для : $f_i(x_i)$ $i = 1 \text{ to } 8$

Нас интересует распределение . $\text{min}(X_1, X_2, X_3, \dots)$

Каждый раз, когда мы добавляем дополнительный термин, pdf предельного последнего добавленного термина смещается все дальше и дальше вправо, так что эффект от добавления все большего и большего количества терминов становится не только все менее и менее актуальным, но после нескольких терминов , становится практически незначительным - на минимуме выборки. По сути, это означает, что только очень небольшое количество терминов, вероятно, действительно имеет значение ... и добавление дополнительных терминов (или наличие бесконечного числа терминов) в значительной степени не имеет значения для проблемы минимума выборки.

Тест

Чтобы проверить это, я вычислил pdf из в 1 термин, 2 условия, 3 условия, 4 условия, 5 условий, 6 условий, 7 условий, 8 условий, до 9 сроков и до 10 сроков. Для этого я использовал функцию из mathStatica , указав ее здесь для вычисления pdf минимума выборки ( порядка порядка ) в выборке размера и где параметр (вместо этого) быть исправленным) : $\text{min}(X_1, X_2, X_3, \dots)$ OrderStatNonIdentical $1^{\text{st}}$ $j$ $i$ $v_i$

Это становится немного сложнее, так как количество терминов увеличивается ... но я показал вывод для 1 термина (1-я строка), 2 терминов (вторая строка), 3 терминов (3-я строка) и 4 терминов выше.

На следующей диаграмме сравнивается pdf образца минимума с 1 термином (синий), 2 терминами (оранжевый), 3 терминами и 10 терминами (красный). Обратите внимание, насколько похожи результаты только с 3 терминами против 10 терминов:

На следующей диаграмме сравниваются 5 терминов (синий) и 10 (оранжевый). Графики очень похожи, они стирают друг друга, и разницы даже не видно:

Другими словами, увеличение количества слагаемых с 5 до 10 практически не оказывает заметного визуального влияния на распределение минимума выборки.

Полулогистическая аппроксимация

Наконец, отличное простое приближение pdf образца min - это полу-логистическое распределение с pdf:

g (x) = \frac{2 e^{- x}}{{(e^{- x} + 1)}^{2}} for x > 0

$g(x) = \frac{2 e^{-x}}{\left(e^{-x}+1\right)^2} \quad \text{ for } x>0$

На следующей диаграмме сравнивается точное решение с 10 терминами (которые неотличимы от 5 или 20 терминов) и полулогистическим приближением (пунктир):

Увеличение до 20 сроков не делает никакой заметной разницы.

— wolfies
источник