Как визуализировать два независимых t-критерия?


11

Каковы наиболее приемлемые способы визуализации результатов независимого двух-выборочного t-теста? Чаще всего используется числовая таблица или какой-то сюжет? Цель состоит в том, чтобы случайный наблюдатель посмотрел на фигуру и сразу увидел, что они, вероятно, из двух разных групп населения.


«Принято» кем, в каком контексте? «Чаще всего используется» где?
Glen_b

Ответы:


18

Стоит четко определить цель вашего сюжета. В целом, есть два разных типа целей: вы можете составить графики для себя, чтобы оценить сделанные вами предположения и руководить процессом анализа данных, или вы можете создать графики, чтобы сообщить результат другим. Это не одно и то же; например, многие зрители / читатели вашего сюжета / анализа могут быть статистически неискушенными и могут не знать, например, о равной дисперсии и ее роли в t-тесте. Вы хотите, чтобы ваш участок передавал важную информацию о ваших данных даже таким пользователям, как они. Они безоговорочно верят, что вы все сделали правильно. Из вашего вопроса настройки, я понимаю, вы после последнего типа.

В действительности, наиболее распространенным и приемлемым графиком для передачи результатов t-теста 1 другим (за исключением того, является ли он на самом деле наиболее подходящим) является гистограмма средних значений со стандартными столбцами ошибок. Это очень хорошо соответствует t-критерию, поскольку t-критерий сравнивает два средних с использованием их стандартных ошибок. Когда у вас есть две независимые группы, это даст интуитивную картину, даже для статистически неискушенных, и (с учетом данных) люди могут «сразу увидеть, что они, вероятно, из двух разных групп населения». Вот простой пример с использованием данных @Tim:

nonsmokers <- c(18,22,21,17,20,17,23,20,22,21)
smokers <- c(16,20,14,21,20,18,13,15,17,21)
m        = c(mean(nonsmokers), mean(smokers))
names(m) = c("nonsmokers", "smokers")
se       = c(sd(nonsmokers)/sqrt(length(nonsmokers)), 
             sd(smokers)/sqrt(length(smokers)))
windows()
  bp = barplot(m, ylim=c(16, 21), xpd=FALSE)
  box()
  arrows(x0=bp, y0=m-se, y1=m+se, code=3, angle=90)

введите описание изображения здесь

Тем не менее, специалисты по визуализации данных обычно презирают эти графики. Их часто выводят как «динамитные графики» (ср. « Почему динамитные графики плохие» ). В частности, если у вас есть только несколько данных, часто рекомендуется просто показать сами данные . Если точки перекрываются, вы можете дрожать по горизонтали (добавить небольшое количество случайного шума), чтобы они больше не перекрывались. Поскольку t-тест в основном касается средних и стандартных ошибок, лучше всего наложить средние и стандартные ошибки на такой график. Вот другая версия:

set.seed(4643)
plot(jitter(rep(c(0,1), each=10)), c(nonsmokers, smokers), axes=FALSE, 
     xlim=c(-.5, 1.5), xlab="", ylab="")
box()
axis(side=1, at=0:1, labels=c("nonsmokers", "smokers"))
axis(side=2, at=seq(14,22,2))
points(c(0,1), m, pch=15, col="red")
arrows(x0=c(0,1), y0=m-se, y1=m+se, code=3, angle=90, length=.15)

введите описание изображения здесь

Если у вас много данных, блочные диаграммы могут быть лучшим выбором для быстрого обзора дистрибутивов, и вы можете наложить на них средства и SE там же.

data(randu)
x1 = qnorm(randu[,1])
x2 = qnorm(randu[,2])
m  = c(mean(x1), mean(x2))
se = c(sd(x1)/sqrt(length(x1)), sd(x2)/sqrt(length(x2)))
boxplot(x1, x2)
points(c(1,2), m, pch=15, col="red")
arrows(x0=1:2, y0=m-(1.96*se), y1=m+(1.96*se), code=3, angle=90, length=.1)
# note that I plotted 95% CIs so that they will be easier to see

введите описание изображения здесь

Простые графики данных и блокпосты достаточно просты, чтобы большинство людей могли их понять, даже если они не очень разбираются в статистике. Имейте в виду, однако, что ни один из них не позволяет легко оценить обоснованность использования t-теста для сравнения ваших групп. Эти цели лучше всего обслуживать различные виды сюжетов.

1. Обратите внимание, что это обсуждение предполагает независимый выборочный t-критерий. Эти графики могут быть использованы с t-тестом зависимых выборок, но в этом контексте они также могут вводить в заблуждение (см. « Неправильно ли использование шкал ошибок для средних показателей в рамках исследования внутри субъекта» ).


Большая проблема с использованием графика bar + CI состоит в том, что иногда разница статистически значима, но CI перекрываются . Учитывая, что сюжет bar + CI пытается привлечь внимание широкой аудитории, мы действительно не хотим тратить время на объяснение этой дополнительной складки.
Гейзенберг

@ Heisenberg, я знаю об этом. Не существует единого, идеального сюжета на все случаи жизни. Я также не упомянул CI, только SE (хотя это было бы эквивалентно некоторому CI, в зависимости от df). Значение обычно упоминается в подписи к рисунку и обсуждается в тексте. Если вы хотите, чтобы он отображался однозначно в самом графике, вы можете добавить скобки и p-значения (например, здесь ).
gung - Восстановить Монику

Мои извинения, если тон звучит агрессивно. Я просто немного раздражен, что в конце концов все еще нет элегантного способа визуализировать t-тест для широкой аудитории без объяснения причин. Это может сводиться к построению графиков: 2 столбчатых графика, показывающих групповые значения с SE, и третий график, показывающий разницу и ее CI (как ваша ссылка ). Но такая визуализация показывает избыточную информацию (группы означает И различие в средствах), что также может запутать аудиторию.
Гейзенберг

@ Heisenberg, я бы не использовал график из моего другого ответа, если бы я не пытался показать t-тест внутри пациента. Я думаю, что, вероятно, часто хорошо представить 2 бара с SE для t-теста, с простой подписью к рисунку. Если вам нужна значимость в сюжете, вы можете добавить скобки или что-то в этом роде (я обычно нахожу это ненужным).
gung - Восстановить Монику

14

T

> nonsmokers <- c(18,22,21,17,20,17,23,20,22,21)
> smokers <- c(16,20,14,21,20,18,13,15,17,21)
> 
> t.test(nonsmokers, smokers)

    Welch Two Sample t-test

data:  nonsmokers and smokers
t = 2.2573, df = 16.376, p-value = 0.03798
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 0.1628205 5.0371795
sample estimates:
mean of x mean of y 
     20.1      17.5 

введите описание изображения здесь

Фактически, коробочные графики обычно используются для «неформального» тестирования гипотез, например, как описано Йоавом Бенджамини в статье 1988 года. Открытие коробки с коробкой» :

Обычный коробочный график дополняется приблизительным доверительным интервалом для медианы партии, показанным в виде пары клиньев, снятых с боков коробки. Эти доверительные интервалы построены таким образом, что, когда две метки разных коробочных диаграмм не перекрываются, их медианы значительно различаются. (...) Так как формула для доверительного интервала представляет собой постоянную, умноженную на интервал между четвертями, деленный на квадратный корень из размера партии, последний может быть воспринят по длине клиньев относительно длины коробки.

Смотрите также: T-тест с использованием только сводных данных на диаграмме

T

введите описание изображения здесь

TTTпротестировать в этой ситуации. Основным преимуществом такого графика является то, что он позволяет легко судить о величине разницы средних, глядя на наклон линии. Недостатком может быть то, что можно предположить, что существует некоторая «преемственность» между средствами (то есть, что у вас были парные образцы).

введите описание изображения здесь

T

Первое соображение - информационная ценность рисунка в тексте статьи, в которой он должен появиться. Если рисунок не добавляет существенного понимания документа или дублирует другие элементы документа, его не следует включать.


4
Это действительно часто встречается даже в текстах, в которых обсуждаются t-тесты и ANOVA, но, тем не менее, это исключительный выбор. На рамочном графике не показаны какие-либо величины, непосредственно участвующие в t-тесте. Как минимум, соответствующий график должен показывать средства и давать более подробную информацию о распределении, чем блок-график. Детали в хвостах часто имеют решающее значение при интерпретации теста.
Ник Кокс

ОК @NickCox, набор данных был выбран только для визуализации, но теперь я изменил его на более подходящий пример.
Тим

3
Гистограмма (также называемая «динамитная диаграмма») имеет чрезвычайно высокое соотношение чернил и информации.
Фрэнк Харрелл

Цитата из руководства APA (я не проверял контекст) - это хороший общий совет, но сам по себе он не является прямым аргументом для использования частично релевантного прямоугольника в этом контексте. Естественно, я согласен с тем, что боксплоты могут быть очень полезными и часто дополняющими, и что они очень часто используются, но мой первый пункт остается.
Ник Кокс

@NickCox Я не могу сказать, что я с вами согласен, но я все равно рассмотрел бы коробочный график, чтобы предоставить дополнительную информацию, а не дублировать результаты t-теста, даже если он не имеет прямого отношения к t-тесту. Это просто, понятно и информативно.
Тим

8

В основном это вариации на полезные ответы @Tim и @gung, но графики нельзя вписать в комментарий.

Небольшие, но, возможно, полезные моменты:

  1. Полосовой или точечный график, как показано @gung, нуждается в модификации, если есть связи, как в данных примера. Точки могут быть сложены или дрожать, или, как в примере ниже, вы можете использовать гибридный график квантильных коробок как предложено Эмануэлем Парценом (наиболее доступная ссылка, вероятно, 1979. Непараметрическое статистическое моделирование данных. Журнал, Американская статистическая ассоциация74: 105-121). Это также имеет и другие достоинства, подчеркивая, что если половина данных находится внутри блока, то половина тоже находится снаружи, и, по сути, показывает все детали распределения. Там, где есть только две группы, как в этом контексте, любой более традиционный вид рамочного графика может быть минимальным, по сути скелетным, отображением. Некоторые воспримут это как добродетель, но есть возможность показать больше деталей. Обратный аргумент заключается в том, что прямоугольник, помечающий конкретные точки, особенно те, которые больше 1,5 IQR от ближайшего квартиля, является четким предупреждением для пользователя: следите за ходом t-теста, так как в хвостах могут быть точки, которые вы должны беспокоюсь о.

  2. Вы можете естественным образом добавить указание средств на блок-график, что довольно часто делается. Добавление другого маркера или символа точки является распространенным явлением. Здесь мы выбираем опорные линии.

введите описание изображения здесь

Квадратные ящики для курящих и некурящих. Коробки показывают медианы и квартили. Горизонтальные линии синим цветом означают.

Запись. График был создан в Stata. Вот код для тех, кто заинтересован. stripplotдолжен быть установлен предварительно с ssc inst stripplot.

clear 
mat nonsmokers = (18,22,21,17,20,17,23,20,22,21)
mat smokers = (16,20,14,21,20,18,13,15,17,21)
local n = max(colsof(nonsmokers), colsof(smokers)) 
set obs `n' 
gen smokers = smokers[1, _n] 
gen nonsmokers = nonsmokers[1, _n] 
stripplot smokers nonsmokers, vertical cumul centre xla(, noticks) ///
xsc(ra(0.6 2.4)) refline(lcolor(blue)) height(0.5) box ///
ytitle(digit span score) yla(, ang(h)) mcolor(red) msize(medlarge) 

01+

введите описание изображения здесь


1
+1, я хотел дрожать данные, но я еще не смог добраться до них. Я также думал о добавлении более продвинутых графиков, в том числе квантильных коробок, скрипок и qq-графиков, но в конечном итоге я отказался от идеи перечислять еще больше графиков.
gung - Восстановить Монику

@ Достаточно справедливо; К сожалению или к счастью, поток может легко превратиться в сравнение двух распределений вообще. Для другого примера данных гистограммы могут быть серьезным конкурентом и т. Д.
Ник Кокс

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.