Как отображать панели ошибок для перекрестных (парных) экспериментов


19

Следующий сценарий стал наиболее часто задаваемыми вопросами в трио исследователя (I), рецензента / редактора (R, не связанного с CRAN) и меня (M) как создателя сюжета. Мы можем предположить, что (R) является типичным медицинским рецензентом большого босса, который знает только, что на каждом графике должна быть строка ошибок, в противном случае это неверно. Когда участвует статистический рецензент, проблемы гораздо менее критичны.

сценарий

В типичном перекрестном фармакологическом исследовании два препарата A и B тестируются на их влияние на уровень глюкозы. Каждый пациент проверяется дважды в случайном порядке и при условии отсутствия переноса. Первичной конечной точкой является разница между глюкозой (BA), и мы предполагаем, что парный t-тест является адекватным.

(I) хочет график, который показывает абсолютные уровни глюкозы в обоих случаях. Он боится (R) стремления к барам ошибок и просит стандартных ошибок в гистограммах. Давайте не будем начинать гистограмму войны здесь ._)

гистограммы и глюкоза SE для двух процедур

(I): Это не может быть правдой. Бары перекрываются, и мы имеем р = 0,03? Это не то, что я узнал в средней школе.

(M): у нас есть парный дизайн здесь. Запрашиваемые полосы ошибок совершенно не имеют значения, то есть SE / CI парных разностей, которые не показаны на графике. Если бы у меня был выбор и данных было не слишком много, я бы предпочел следующий график

Объединенные линии показывают спаривание, точки исходных значений

Добавлено 1: Это параллельный координатный график, упомянутый в нескольких ответах

(M): Линии показывают спаривание, и большинство линий идет вверх, и это правильное впечатление, потому что имеет значение наклон (хорошо, это категорично, но тем не менее).

(I): Эта картина сбивает с толку. Никто не понимает это, и у него нет баров ошибок (R скрывается).

(M): Мы могли бы также добавить еще один график, который показывает соответствующий доверительный интервал разницы. Расстояние от нулевой линии создает впечатление величины эффекта.

(I): Никто не делает это

(R): И это тратит впустую драгоценные деревья

(М): (Как хороший немец): Да, точка на деревьях взята. Но я, тем не менее, использую это (и никогда не публикую это), когда у нас есть несколько обработок и несколько контрастов.

доверительный интервал разницы

Какие-либо предложения ? R-код ниже, если вы хотите создать сюжет.

# Graphics for Crossover experiments
library(ggplot2)
library(plyr)
theme_set(theme_bw()+theme(panel.margin=grid::unit(0,"lines")))
n = 20
effect = 5 
set.seed(4711)
glu0 = rnorm(n,120,30)
glu1 = glu0 + rnorm(n,effect,7)
dt = data.frame(patient = rep(paste0("P",10:(9+n))),              
                treatment = rep(c("A","B"), each=n),glucose = c(glu0,glu1))

dt1 = ddply(dt,.(treatment), function(x){
  data.frame(glucose = mean(x$glucose), se = sqrt(var(x$glucose)/nrow(x)) )})

tt = t.test(glucose~treatment,paired=TRUE,data=dt,conf.int=TRUE)
dt2 = data.frame(diff = -tt$estimate,low=-tt$conf.int[2], up=-tt$conf.int[1])
p = paste("p =",signif(tt$p.value,2))

png(height=300,width=300)
ggplot(dt1, aes(x=treatment, y=glucose, fill=treatment))+      
  geom_bar(stat="identity")+  
  geom_errorbar(aes(ymin=glucose-se, ymax=glucose+se),size=1., width=0.3)+
  geom_text(aes(1.5,150),label=p,size=6)

ggplot(dt,aes(x=treatment,y=glucose, group=patient))+ylim(0,190)+
  geom_line()+geom_point(size=4.5)+
  geom_text(aes(1.5,60),label=p,size=6)

ggplot(dt2,aes(x="",y=diff))+
  geom_errorbar(aes(ymin=low,ymax=up),size=1.5,width=0.2)+ 
  geom_text(aes(1,-0.8),label=p,size=6)+
  ylab("95% CI of difference glucose B-A")+  ylim(-10,10)+
  theme(panel.border=element_blank(), panel.grid.major.x=element_blank(),
         panel.grid.major.y=element_line(size=1,colour="grey88"))

dev.off()

О, боже мой, Dieter-Menne, отличный вопрос! Это зависит от типа журнала, в который вы отправляете статью. Я буду держаться подальше от графических войн, но мне нравятся графики 2 и 3: так много информации в таком небольшом пространстве.
doug.nun

4
Masson and Loftus (2003) часто упоминается. Они показывают примеры графиков, на которых они отображают CI разницы во второй панели того же графика. Сделает ли это всех в цирке счастливыми, я не знаю (я чувствую к тебе, хотя!)
Энди В.

Спасибо, @AndyW, за ссылку. Дело в том, но есть проблема: это из психологии. По этому вопросу есть гораздо больше хороших статей от психологов, которые имеют гораздо лучший статистический фон по сравнению с медицинскими рецензентами. Хотел бы я найти какое-нибудь руководство журнала на эту тему, это единственный острый меч, с которым я мог справиться.
Дитер Менн

Ответы:


17

Вы абсолютно правы в своем предположении, что полосы ошибок, представляющие стандартную ошибку среднего значения, совершенно не подходят для внутрисубъектных проектов. Однако вопрос о перекрывающихся панелях ошибок и их значимости - это еще одна тема, к которой я вернусь в конце этого прокомментированного списка литературы.

В «Психологии» имеется обширная литература о доверительных интервалах внутри объекта или полосах ошибок, которые делают именно то, что вы хотите. Справочная работа четко:

Loftus, GR & Masson, MEJ (1994). Использование доверительных интервалов в рамках проекта . Psychonomic Bulletin & Review , 1 (4), 476–490. DOI: 10,3758 / BF03210951

Однако их проблема заключается в том, что они используют один и тот же термин ошибки для всех уровней внутрисубъектного фактора. Это не кажется большой проблемой для вашего случая (2 уровня). Но есть более современные подходы к решению этой проблемы. Наиболее заметно:

Franz, V. & Loftus, G. (2012). Стандартные ошибки и доверительные интервалы в проектах внутри субъекта: Обобщение Лофтуса и Массона (1994) и избегание предвзятости альтернативных счетов . Psychonomic Bulletin & Review , 1–10. DOI: 10,3758 / s13423-012-0230-1

Baguley, T. (2011). Расчет и построение графиков доверительных интервалов для субъекта для ANOVA. Методы исследования поведения . doi: 10.3758 / s13428-011-0123-7 [ можно найти здесь ]

Дополнительные ссылки можно найти в последних двух статьях (которые, я думаю, стоит прочитать обе).


Как исследователи интерпретируют КИ? Плохо по следующей статье:

Belia S., Fidler F., Williams J. & Cumming G. (2005). Исследователи неправильно понимают доверительные интервалы и стандартные бары ошибок . Психологические методы , 10 (4), 389–396. DOI: 10,1037 / 1082-989X.10.4.389

Как мы должны интерпретировать перекрывающиеся и непересекающиеся КИ?

Камминг Г. и Финч С. (2005). Вывод на глаз: доверительные интервалы и как читать изображения данных . Американский психолог , 60 (2), 170–180. DOI: 10,1037 / 0003-066X.60.2.170


Одна заключительная мысль (хотя это не относится к вашему случаю): если у вас есть сплит-дизайн (то есть факторы внутри и между субъектами) на одном графике, вы можете забыть об ошибках вместе. Я бы (смиренно) рекомендовать свою raw.means.plotфункцию в пакете R plotrix.


2
Очень полезный список литературы. Камминг объединил многие свои идеи в amazon.com/Understanding-New-Statistics-Meta-Analysis-ebook/dp/… (Что бы вы ни хотели сказать о выражении «новая статистика», я, вероятно, согласен.)
Ник Кокс


@amoeba Бумага Baguley, которую я цитирую, использует технику бумаги Мори.
Хенрик,

10

Похоже, вопрос не столько в барах ошибок, сколько в лучших способах построения парных данных.

По сути, погрешности здесь - это не более чем способ суммирования неопределенности: они не делают и не могут сказать много о какой-либо тонкой структуре данных.

Параллельные координатные графики - иногда называемые профилями, термин, который означает разные вещи в разных областях - были упомянуты в этом вопросе. Базовые точечные диаграммы уже были предложены @Ray Koopman.

A-В(A+В)/2A+В

Другим источником этого сюжета является Нейман Дж., Скотт Э.Л. и Шейн, CD 1953. О пространственном распределении галактик: конкретная модель. Astrophysical Journal 117: 92–133.

В общих чертах такие графики напоминают идею построения графиков невязки по сравнению с подгонкой, которую также популяризировал Тьюки и его зять в квадрате Анскомб.

A-Взнак равно0Aзнак равноВAВ

Заброшенный дизайн - это параллельный график McNeil, DR 1992. На графике парных данных. Американский статистик 46: 307–310. Это также обсуждается в двух ссылках ниже.

Стата-связанные обзоры, с несколькими ссылками, находятся в

2004, Графическое соглашение и несогласие. Stata Journal 4: 329-349.

.pdf доступен по адресу http://www.stata-journal.com/sjpdf.html?articlenum=gr0005.

Парные, параллельные или профильные графики для изменений, корреляций и других сравнений. Stata Journal 9: 621-639.

.pdf доступен по адресу http://www.stata-journal.com/sjpdf.html?articlenum=gr0041.

Пользователи, не являющиеся членами Stata, должны иметь возможность пропустить и прогуляться по коду Stata, решая, как реализовать графики в своем любимом программном обеспечении.

AВ


4

Попробуйте точечный график отдельных (A, B) точек. Большинство из них должны лежать только на одной стороне диагонали (линия A = B). Есть два аналога погрешностей. Обычный, эквивалентный КИ для средней разницы, был бы доверительным интервалом для средней разницы. Полоса будет областью между двумя линиями, обе из которых параллельны диагонали. Парный t-критерий был бы значительным, если и только если бы оба края полосы находились на одной стороне диагонали.

Более консервативный аналог индикатора ошибок - это эллипс доверия для центроида.


1
смеTчасоdВсмеTчасоdA

Нет, кл. - :) Клиническая химия слишком сложна. Может быть, вы добавили какую-то ссылку в "там"; Я не уверен, о какой газете вы говорите.
Дитер Менне,

4

Предварительное резюме:

Массон / Лофтус очень исчерпывающий, и его нелегко читать моим коллегам-медикам, которые не приняли бы что-то вроде «взаимодействия». У них также есть некоторые предложения для множественных сравнений, которые показывают, что попарные доверительные интервалы трудно проиллюстрировать, когда не нужно сильно упрощать.

Массон Лофтус

Мне не нравится этот стиль: бары с ошибками выглядят в прошлом тысячелетии Excelish. Тем не менее, они также используют немного более элегантный стиль:

Массон Лофтус без решеток

Камминг / Финч и Белия и др. должны чтения. Первый - это идеальный выбор, чтобы дать своему другу, который вздрагивает, когда он видит слово « взаимодействие» . Я заказал книгу Камминга после прочтения этой статьи. Второй показывает тест, который я проведу в Shiny для следующего собрания медицинского следователя.

Камминг / Finch

Мне нравится этот график, даже если есть вторая ось, которую я никогда не использовал раньше; проверьте вклад Хенрика и некоторых других в StackOverflow для графического метода R-base, чтобы получить его. Я бы предпочел поместить вторую ось слева от разницы, чтобы было абсолютно ясно, что значения изменились, и, возможно, добавить ось p-значения.

Кто-нибудь из фракции решетки / ggplot делает снимок? Все поставляемые решения являются базовой графикой и не панализируются / не отображаются.

Однако: обратите внимание, что комментарии и статьи в основном из психологического отдела (и @cbeleites из хардкорной химии). Было бы хорошо получить комментарии от рецензентов медицинских журналов.


0

Почему бы просто не отобразить разницу * для каждого пациента? Затем вы можете использовать гистограмму, блочную диаграмму или диаграмму нормальной вероятности и наложить 95% доверительный интервал для разницы.

  • В некоторых сценариях это может быть разница логарифмов. См., Например, Patterson & Jones, «Биоэквивалентность и статистика в клинической фармакологии», Chapman, 2006.

Почему нет? Это может предоставить достоверную информацию, но графики с отдельными точками или парами не очень популярны в медицинских исследованиях. Вот почему параллельные сюжеты (которые предоставляют больше информации) настолько непопулярны. Медицинские исследователи хотят получить средние и "нормальные значения" (что бы это ни было).
Дитер Менне
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.