Как рассчитать доверительные интервалы для объединенных нечетных отношений в метаанализе?


9

У меня есть два набора данных из общих исследований генома ассоциации. Единственной доступной информацией являются нечетные отношения и их доверительные интервалы (95%) для каждого генотипированного SNP. Я хочу создать лесной участок, сравнивая эти два коэффициента, но я не могу найти способ рассчитать комбинированные доверительные интервалы для визуализации суммарных эффектов. Я использовал программу PLINK для выполнения мета-анализа с использованием фиксированных эффектов, но программа не показала эти доверительные интервалы.

  • Как я могу рассчитать такие доверительные интервалы?

Доступные данные:

  • Нечетные соотношения для каждого исследования,
  • 95% доверительные интервалы и
  • Стандартные ошибки.

Ответы:


10

В большинстве мета-анализа отношений шансов стандартные ошибки основаны на журнале отношений шансов . Итак, вы случайно не знаете, как были оценены ваши (и какой показатель они отражают? или )? Учитывая, что основаны на , объединенная стандартная ошибка (в модели с фиксированным эффектом) может быть легко вычислена. Сначала давайте вычислим весовые коэффициенты для каждого размера эффекта: . Во-вторых, объединенная стандартная ошибка: . Кроме того, пусть л о г ( О Р я ) ы е я О Р л о г ( О Р ) с е я л о г ( О Р я ) ш я = 1sеяLог(Оря)sеяОрLог(Ор)sеяLог(Оря) ыеFEM=весязнак равно1sея2sеFЕMзнак равно1ΣвесLог(ОрFЕM)быть общим эффектом (модель с фиксированным эффектом). Затем 95-процентный доверительный интервал («объединенный») равен .Lог(ОрFЕM)±1,96sеFЕM

Обновить

Поскольку BIBB любезно предоставил данные, я могу провести «полный» метаанализ в R.

library(meta)
or <- c(0.75, 0.85)
se <- c(0.0937, 0.1029)
logor <- log(or)
(or.fem <- metagen(logor, se, sm = "OR"))

> (or.fem <- metagen(logor, se, sm = "OR"))
    OR            95%-CI %W(fixed) %W(random)
1 0.75  [0.6242; 0.9012]     54.67      54.67
2 0.85  [0.6948; 1.0399]     45.33      45.33

Number of trials combined: 2 

                         OR           95%-CI       z  p.value
Fixed effect model   0.7938  [0.693; 0.9092] -3.3335   0.0009
Random effects model 0.7938  [0.693; 0.9092] -3.3335   0.0009

Quantifying heterogeneity:
tau^2 < 0.0001; H = 1; I^2 = 0%

Test of heterogeneity:
    Q d.f.  p.value
 0.81    1   0.3685

Method: Inverse variance method

Ссылки

См., Например, Lipsey / Wilson (2001: 114)


Большое спасибо за Ваш ответ. Стандартные ошибки основаны на натуральном логарифме ИЛИ Ln (ORi). Сначала я вычисляю веса для SE1 (0,0937) = 10,67 и для SE2 (0,1029) = 9,71. Таким образом, вычисленная SE в соответствии с FEM равна = 0,2215. Объединенное ИЛИ для этих SNP составляет = 0,7645, поэтому 95% доверительные интервалы равны = (0,515-1,228). Правильно ли я? Если да, то я волнуюсь, потому что, когда я сравниваю все результаты на лесных участках, комбинированные интервалы слишком велики по сравнению с оригиналами в каждом исследовании = исследование 1 = 95% ДИ (0,63-0,91) ИЛИ = 0,75, исследование 2 95% ДИ (0,69-1,04) ИЛИ = 0,85. Это все хорошо? Спасибо
BIBB

Нет, к сожалению нет. Обратите внимание, что моя формула для была неправильной, это не . Как видите, «объединенный» 95% ДИ составляет [0,693; 0,9092]. Мне также интересно, почему ваше объединенное ИЛИ отличается (0,7645 против 0,7938). Извините, мне нужно идти, но я вернусь к нему завтра ...вес1/(sе2)1/sе
Бернд Вайс

Спасибо большое !!!, этот результат более последовательный, чем мой. Объединенное ИЛИ, которое я вам даю, было в выводе PLINK ... теперь я очень обеспокоен всеми результатами моего мета-анализа ... Я бы лучше использовал R.
BIBB

Я включил ссылку на книгу Липси / Уилсона «Практический метаанализ» (см. Список литературы). Я немного обеспокоен тем, что PLINK и мои результаты отличаются. Вы знаете, какую методологию мета-анализа они используют? Вы также должны принять во внимание, что я абсолютно не имею понятия об «исследованиях геномных ассоциаций».
Бернд Вайс

Спасибо за решение, мне интересно, могу ли я применить метод мета-анализа к моей проблеме. Что я делаю, так это симулирую регрессию, вызывая некоторый шум. Я запускаю анализ n раз (скажем, n равно 500) и получаю n OR и CI. Вот ссылка на вопрос: stats.stackexchange.com/questions/206042/… . Таким образом, я могу реализовать функцию «метаген», вызывающую каждое логическое ИЛИ и стандартную ошибку. n
Предвзято

3

На самом деле, вы можете использовать программное обеспечение, такое как METAL, которое специально разработано для метаанализа в контексте GWA.

журнал(ИЛИ)пZ

Метод Бернда еще точнее.

Помните, что меня больше беспокоит направление эффекта, так как похоже, что у вас есть только сводные статистические данные по каждому исследованию, но нет уверенности, что это за аллель ИЛИ. Если вы не знаете, что это сделано на том же аллеле.

Кристиан


0

Это комментарий (не хватает реп. Баллов). Если вы знаете размер выборки (#cases и #controls) в каждом исследовании и отношение шансов для SNP, вы можете восстановить таблицу 2x2 case / control по a / b (где a и b - два аллеля) для каждое из двух исследований. Затем вы можете просто добавить эти значения, чтобы получить таблицу для мета-исследования, и использовать ее для вычисления комбинированного отношения шансов и доверительных интервалов.


Спасибо за ваш ответ. К сожалению, у меня нет частот или количества аллелей, авторы не показывали эти данные, они просто указали SNP ID, OR и доверительные интервалы (95%). Я просто извлекал значение SE из каждого исследования, но теперь не объединяю их (SE или CI) !!!! Помогите!!
BIBB

О, вы правы - здесь нужна еще одна степень свободы. Обычно авторы приводят аллель freq. (иногда похоронен в оп. информации.). Если нет, вы можете найти его из внешнего источника, такого как HAPMAP (при условии, что GWAS был сделан для аналогичного населения). Другая идея: сам доверительный интервал может сказать вам аллель частоты. При прочих равных условиях (размер выборки и ИЛИ), SNP с низкой частотой аллеля. иметь меньше носителей в обеих группах, следовательно, более широкий доверительный интервал. Вы можете попробовать разные частоты аллелей, рассчитать доверительный интервал для каждого и получить частоту аллелей. соответствует тому, что было сообщено
или Zuk

Я постараюсь это сделать, но пока мне интересно, как PLINK может вычислять объединенное ИЛИ только с такими параметрами: идентификатор SNP, отношение шансов ИЛИ (или БЕТА и т. Д.) И стандартная ошибка SE ИЛИ (или пользователя определено поле веса). Вы можете понять, что PLINK не просил аллельные частоты ... так что есть способ сделать это ...
BIBB

0

Вот код для получения КИ для мета-анализа, как в PLINK:

getCI = function(mn1, se1, method){
    remov = c(0, NA)
    mn    = mn1[! mn1 %in% remov]
    se    = se1[! mn1 %in% remov]
    vars  <- se^2
    vwts  <- 1/vars

    fixedsumm <- sum(vwts * mn)/sum(vwts)
    Q         <- sum(((mn - fixedsumm)^2)/vars)
    df        <- length(mn) - 1
    tau2      <- max(0, (Q - df)/(sum(vwts) - sum(vwts^2)/sum(vwts)) )

    if (method == "fixed"){ wt <- 1/vars } else { wt <- 1/(vars + tau2) }

    summ <- sum(wt * mn)/sum(wt)
    if (method == "fixed") 
         varsum <- sum(wt * wt * vars)/(sum(wt)^2)
    else varsum <- sum(wt * wt * (vars + tau2))/(sum(wt)^2)

    summtest   <- summ/sqrt(varsum)
    df         <- length(vars) - 1
    se.summary <- sqrt(varsum)
    pval       = 1 - pchisq(summtest^2,1)
    pvalhet    = 1 - pchisq(Q, df)
    L95        = summ - 1.96*se.summary
    U95        = summ + 1.96*se.summary
    # out = c(round(c(summ,L95,U95),2), format(pval,scientific=TRUE), pvalhet)   
    # c("OR","L95","U95","p","ph")
    # return(out)

    out = c(paste(round(summ,3), ' [', round(L95,3), ', ', round(U95,3), ']', sep=""),
            format(pval, scientific=TRUE), round(pvalhet,3))
    # c("OR","L95","U95","p","ph")
    return(out)
}

Вызов функции R:

getCI(log(plinkORs), plinkSEs)
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.