Какова сумма квадратов т переменных?

Пусть из t-распределения Стьюдента с степенями свободы для среднего размера (скажем, менее 100). Определить Распространяется ли почти как хи-квадрат с степенями свободы? Есть ли что-то вроде центральной предельной теоремы для суммы квадратов случайных величин? $t_i$ $n$ $n$

T = \sum_{1 \leq i \leq k} t_{i}^{2}

$T = \sum_{1\le i \le k} t_i^2$

T

$T$

k

$k$

chi-squared central-limit-theorem t-distribution

— shabbychef
источник

@suncoolsu: там написано «почти» ...

— shabbychef

мои извенения. не видел этого.

— Suncoolsu

Ответы:

Отвечая на первый вопрос.

Мы могли бы начать с того факта, что mpiktas отметил, что . А затем попробуйте сначала сделать более простой шаг - найти распределение суммы двух случайных величин, распределенных по . Это можно сделать либо путем вычисления свертки двух случайных величин, либо путем вычисления произведения их характеристических функций. $t^2 \sim F(1, n)$ $F(1,n)$

Статья на PCB Филлипс показывает , что мое первое предположение о «[сливающемся] гипергеометрических функциях , связанных» было действительно так. Это означает, что решение будет не тривиальным, а грубая сила - сложным, но необходимым условием для ответа на ваш вопрос. Так как фиксировано и вы суммируете t-распределения, мы не можем точно сказать, каким будет конечный результат. Если только у кого-то нет хороших навыков игры с продуктами слитых гипергеометрических функций. $n$

— Дмитрий Челов
источник

+1 за ссылку, не знал, что характеристическая функция F распределения была настолько сложной.

— mpiktas

Это даже не близкое приближение. Для малых ожидание равно $n$ $T$ тогда как ожиданиеравно. Когданевелико (скажем, менее 10), гистограммыидаже не имеют одинаковую форму, что указывает на то, что сдвиг и изменение масштабавсе равно не сработает. $\frac{k n}{n-2}$ $\chi^2(k)$ $k$ $k$ $\log(T)$ $\log(\chi^2(k))$ $T$

Наглядно, для малых степеней свободы Стьюдента тяжела хвостатых. Квадрат подчеркивает эту тяжесть. Следовательно, суммы будут более искажены - обычно гораздо больше - чем суммы квадратов нормалей ( распределение ). Расчеты и моделирование подтверждают это. $t$ $\chi^2$

Иллюстрация (по запросу)

alt text

Каждая гистограмма изображает независимое моделирование 100 000 испытаний с указанными степенями свободы ( ) и слагаемыми ( ), стандартизированными, как описано в @mpiktas. Значение на нижней строке аппроксимирует случая. Таким образом, вы можете сравнить с , просматривая каждый столбец. $n$ $k$ $n=9999$ $\chi^2$ $T$ $\chi^2$

Обратите внимание, что стандартизация невозможна при потому что соответствующие моменты даже не существуют. Отсутствие стабильности формы (при сканировании слева направо по любому ряду или сверху вниз по любому столбцу) еще более заметно при . $n \lt 5$ $n \le 4$

— Whuber
источник

Я боялся этого, но я думал, что суммирование принесет немного хвостов.

— Шаббычеф

Я также подумал о проведении своего рода экспериментов Монте-Карло, пытаясь понять, для каких

приближение может быть достаточно близко к

, возможно,

которое нам здесь нужно. Но для малых

и особенно

это будет очень тяжелый хвост. Может быть, вы могли бы добавить сюда эти две гистограммы, просто для ленивых людей, как я?

n

$n$

k

$k$

χ^{2} (k)

$\chi^2(k)$

k (n)

$k(n)$

k

$k$

n

$n$

— Дмитрий Челов

@Dmitrij Моделирование выполняется быстро (рисование гистограмм занимает больше времени), поэтому я добавил 12 из них.

— whuber

+1 за рисунок. Иллюстрации всегда приятно видеть.

— Дмитрий Челов

Я отвечу на второй вопрос. Центральная предельная теорема для любой последовательности iid, квадрат или не квадрат. Так что в вашем случае, если достаточно велико, мы имеем $k$

$\dfrac{T-kE(t_1)^2}{\sqrt{kVar(t_1^2)}}\sim N(0,1)$

где и - соответственно среднее значение и дисперсия квадрата распределения Стьюдента t с степенями свободы. Обратите внимание, что распространяется как F-распределение с и степенями свободы. Таким образом, мы можем получить формулы для среднего и дисперсии со страницы Википедии . Окончательный результат тогда: $Et_1^2$ $Var(t_1^2)$ $n$ $t_1^2$ $1$ $n$

$\dfrac{T-k\frac{n}{n-2}}{\sqrt{k\frac{2n^2(n-1)}{(n-2)^2(n-4)}}}\sim N(0,1)$

— mpiktas
источник

T ^ 2 Хотеллинга: (f - d + 1) / fd T ^ 2 ∼ F (d, f + 1 - d)

— DWin

@DWin, не уверен, что

Хотеллинга действительно применим здесь. По крайней мере из формул со страницы википедии не сразу понятно, что

в вопросе OP можно представить как

. Можете ли вы уточнить это подробнее?

T^{2}

$T^2$

T

$T$

T^{2}

$T^2$

— mpiktas

будет искать свертку

, боясь каких-то гипергеометрических вещей, но где-то должна быть известна.

F (1, n) + F (1, n)

$F(1,n)+F(1,n)$

— Дмитрий Челов

Я считаю, что это сводится к вашей ситуации, когда матрица дисперсии диагональна. Недиагональные элементы из выборки должны быть близки к нулю, если выборки были из Normal, но могут быть не совсем равны нулю, если из t. Тем не менее, вы попросили что-то приблизительное, поэтому я думаю, что ответ, вероятно, F при этом условии.

— DWin

F (1, n)

$F(1,n)$

F

$F$