Как параметризовать отношение двух нормально распределенных переменных или обратное к одной?


12

Проблема: я параметризирую распределения для использования в качестве априоров и данных в байесовском метаанализе. Данные представлены в литературе как сводная статистика, почти исключительно предполагаемая нормально распределенной (хотя ни одна из переменных не может быть <0, некоторые являются отношениями, некоторые являются массовыми и т. Д.).

Я столкнулся с двумя случаями, для которых у меня нет решения. Иногда интересующим параметром является обратная величина данных или отношение двух переменных.

Примеры:

  1. соотношение двух нормально распределенных переменных:
    • Данные: среднее и SD для процента азота и процента углерода
    • параметр: отношение углерода к азоту.
  2. инверсия нормально распределенной переменной:
    • данные: масса / площадь
    • параметр: площадь / масса

Мой текущий подход заключается в использовании симуляции:

например, для набора процентных данных по содержанию углерода и азота со значениями: xbar.n, c, дисперсия: se.n, c и размер выборки: nn, nc:

set.seed(1)
per.c <- rnorm(100000, xbar.c, se.c*n.c) # percent C
per.n <- rnorm(100000, xbar.n, se.n*n.n) # percent N

Я хочу параметризовать ratio.cn = perc.c / perc.n

# parameter of interest
ratio.cn <- perc.c / perc.n

Затем выберите наиболее подходящие дистрибутивы с диапазоном для моего предыдущего0

library(MASS)
dist.fig <- list()
for(dist.i in c('gamma', 'lognormal', 'weibull')) {
    dist.fit[[dist.i]] <- fitdist(ratio.cn, dist.i)
}

Вопрос: это правильный подход? Есть ли другие / лучшие подходы?

Заранее спасибо!

Обновление: распределение Коши, которое определяется как отношение двух нормалей с , имеет ограниченную полезность, так как я хотел бы оценить дисперсию. Возможно, я мог бы рассчитать дисперсию симуляции n розыгрышей с Коши?μ=0

Я нашел следующие аппроксимации в замкнутой форме, но я не проверял, дают ли они одинаковые результаты ... Хайя и др., 1975 σ 2 у : х =σ 2 x ×μy/mu 4

μ^y:x=μy/mux+σx2μy/μx3+cov(x,y)σx2σy2/μx2
σ^y:x2=σx2×μy/mux4+σy2/mux22cov(x,y)σx2σy2/mux3

Hayya, J. and Armstrong, D. and Gressis, N., 1975. Примечание о соотношении двух нормально распределенных переменных. Наука управления 21: 1338-1341


я должен опубликовать вопрос об обновлении о расчете дисперсии на случайных ничьях из Коши как отдельный вопрос?
Дэвид Лебауэр

Дэвид - так как все твои переменные положительны, почему ты хочешь суетиться с ? Кстати, в вашей симуляции вы, кажется, генерируете переменные per.c и per.n, которые являются независимыми. это правильно - и если да, то это то, что вы хотите? μ=0
Ронаф

нет, я не хочу суетиться с = 0; эти переменные, как правило, рассматриваются как независимые, и ковариационные данные редко доступны. Поскольку C довольно постоянен, независимость является разумным предположением. μ
Дэвид Лебауэр

Я не понимаю, почему ожидание соотношения не существует. Если и совместно нормально распределены со средним, отличным от нуля, то среднее значение задается как , чего мне не хватает? Y Z = XXYxZ=XYxyp(x,y)dxdy
Рой

Ответы:


6

Возможно, вы захотите взглянуть на некоторые ссылки в статье Википедии о распределении коэффициентов . Возможно, вы найдете лучшие приближения или распределения для использования. В противном случае ваш подход кажется обоснованным.

Обновление Я думаю, что лучшая ссылка может быть:

См. Формулы 2-4 на стр. 195.

Обновление 2

На ваш обновленный вопрос относительно дисперсии от Коши - как отметил Джон Кук в комментариях, дисперсия не существует. Таким образом, выборочная дисперсия просто не будет работать как «оценщик». Фактически, вы обнаружите, что ваша дисперсия выборки не сходится вообще и сильно колеблется, когда вы продолжаете брать образцы.


Спасибо за ссылку, здесь я нашел ссылку на Haaya 1975 и уравнения в моем вопросе, хотя я был бы признателен за подтверждение того, что уравнения подходят для моей задачи.
Дэвид Лебауэр

Бегло глядя на Haaya, кажется, что они заинтересованы в получении нормального приближения для отношения и используют моделирование, чтобы определить, когда это применимо (используя коэффициент вариации, cv). Соответствует ли резюме в вашем случае критериям? Если это так, аппроксимации применяются.
АРС

1
@ Давид: используйте Marsaglia 1965 вместо обновленного в ответе.
АРС


Я не понимаю, почему ожидание соотношения не существует. Если и совместно нормально распределены со средним, отличным от нуля, то среднее значение задается как , чего мне не хватает? Y Z = XXYxZ=XYxyp(x,y)dxdy
Рой

0

Не могли бы вы предположить, что Для инверсии нормальной случайной величины и выполнить необходимые байесовские вычисления после определения соответствующих параметров для нормального распределения.y1N(.,.)

Мое предложение ниже использовать Коши не работает, как указано в комментариях Арса и Джона.

Соотношение двух обычно случайных величин следует распределению Коши . Возможно, вы захотите использовать эту идею для определения параметров Коши, которые наиболее точно соответствуют вашим данным.


а. Мне нужно оценить дисперсию, а дисперсия распределения Коши не определена.
Дэвид Лебауэр

б. Если я понимаю ваш второй пункт, да, я мог бы предположить, что y-1 ~ N (mu, sigma), но мне все еще нужно вычислить mu и sigma из сводной статистики, приведенной для y; Кроме того, я решил не рассматривать распределения со значениями <0 для переменных, определенных только> 0 (хотя во многих случаях p (X <0 | X ~ N (mu, s)) -> 0)
Дэвид ЛеБауэр

Разве Коши не применяется для нормалей с нулевым средним?
АРС

@ars Вы правы. Тогда коши могут иметь ограниченное применение.

Арс: Да, я считаю, что результат Коши требует нулевого значения. Но это все еще означает, что по крайней мере в этом особом случае дисперсия, которую Давид пытается оценить, НЕ СУЩЕСТВУЕТ.
Джон Д. Кук
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.