Как лучше всего отображать графически ошибку типа II (бета), мощность и размер выборки?


16

Меня просят написать введение в статистику, и я изо всех сил пытаюсь графически показать, как p-значение и мощность связаны между собой. Я придумал этот график:

Взаимодействие двух кривых Гаусса

Мой вопрос: есть ли лучший способ показать это?

Вот мой код R

x <- seq(-4, 4, length=1000)
hx <- dnorm(x, mean=0, sd=1)

plot(x, hx, type="n", xlim=c(-4, 8), ylim=c(0, 0.5), 
ylab = "",
xlab = "",
main= expression(paste("Type II (", beta, ") error")), axes=FALSE)
axis(1, at = c(-qnorm(.025), 0, -4), 
     labels = expression("p-value", 0, -infinity ))

shift = qnorm(1-0.025, mean=0, sd=1)*1.7
xfit2 <- x + shift
yfit2 <- dnorm(xfit2, mean=shift, sd=1)

# Print null hypothesis area
col_null = "#DDDDDD"
polygon(c(min(x), x,max(x)), c(0,hx,0), col=col_null)
lines(x, hx, lwd=2)

# The alternative hypothesis area

## The red - underpowered area
lb <- min(xfit2)
ub <- round(qnorm(.975),2)
col1 = "#CC2222"

i <- xfit2 >= lb & xfit2 <= ub
polygon(c(lb,xfit2[i],ub), c(0,yfit2[i],0), col=col1)

## The green area where the power is
col2 = "#22CC22"
i <- xfit2 >= ub
polygon(c(ub,xfit2[i],max(xfit2)), c(0,yfit2[i],0), col=col2)

# Outline the alternative hypothesis
lines(xfit2, yfit2, lwd=2)

axis(1, at = (c(ub, max(xfit2))), labels=c("", expression(infinity)), 
    col=col2, lwd=1, lwd.tick=FALSE)


legend("topright", inset=.05, title="Color",
   c("Null hypoteses","Type II error", "True"), fill=c(col_null, col1, col2), horiz=FALSE)

abline(v=ub, lwd=2, col="#000088", lty="dashed")

arrows(ub, 0.45, ub+1, 0.45, lwd=3, col="#008800")
arrows(ub, 0.45, ub-1, 0.45, lwd=3, col="#880000")

Обновить


Спасибо за потрясающие ответы. Я изменил часть кода:

# Print null hypothesis area
col_null = "#AAAAAA"
polygon(c(min(x), x,max(x)), c(0,hx,0), col=col_null, lwd=2, density=c(10, 40), angle=-45, border=0)
lines(x, hx, lwd=2, lty="dashed", col=col_null)

...
legend("topright", inset=.015, title="Color",
   c("Null hypoteses","Type II error", "True"), fill=c(col_null, col1, col2), 
       angle=-45,
       density=c(20, 1000, 1000), horiz=FALSE)

Мне нравится пунктирная, слегка расплывчатая картина нулевой гипотезы, потому что она сигнализирует о том, что ее нет на самом деле. Я думал о прозрачности и добавлении альфа, но я беспокоюсь о том, чтобы добавить слишком много информации в одну картинку, и поэтому решил не делать этого.

введите описание изображения здесь

Ограничения печатных статей не позволяют мне позволить читателям экспериментировать. Я выбрал ответ @Greg Snow с TeachingDemos в качестве ответа, так как мне нравится идея с двумя ошибками, не перекрывающимися.


4
Вы можете немного улучшить свой график, используя псевдопрозрачность. Что-то вроде в этом ответе .
Каракал

@caracal (+1) Я должен был добавить чертову фигуру (как и ты) для области, показывающей силу.
хл

Это хорошо, я видел подобные участки в другом месте. Но это не показывает фактические значения нескольких значений p и мощность при этих значениях p. Вы можете рассчитать мощность для различных значений p и размеров выборки, а затем поместить несколько линий на один график
Питер Флом - Восстановить Монику

1
Возможно, проверка того, как типы графиков генерирует программное обеспечение G * Power 3, была бы полезна для идей о том, что строить. Хотя по памяти они кажутся очень похожими на то, что уже представили chl и caracal (и не поможет вам, как это сделать в R).
Энди W

@ Andy G * Вдохновение, основанное на силе, в зависимости от размера эффекта или в зависимости от мощности в сравнении с альфа-графиком было бы действительно хорошим дополнением. В первом случае ответом может быть начало , которое должно быть легко адаптировано ко второму случаю.
Каракал

Ответы:


9

Я поиграл с подобными графиками и обнаружил, что он работает лучше, когда 2 кривые не блокируют друг друга, а скорее смещены по вертикали (но все еще на одной оси x). Это проясняет, что одна из кривых представляет нулевую гипотезу, а другая представляет заданное значение для среднего значения при альтернативной гипотезе. power.exampФункция в пакете TeachingDemos для R будет создавать эти участки и тому run.power.exampфункция ( тот же пакет) позволяет интерактивно изменять аргументы и обновить сюжет.


+1, более полная иллюстрация, чем моя. (На самом деле, я знал, что в TeachingDemosпакете что-то есть, но ленился искать его.)
chl

14

Несколько мыслей: (а) использовать прозрачность и (б) учесть некоторую интерактивность.

Вот мое мнение, во многом вдохновленное Java-апплетом об ошибках типа I и типа II - ошибки в системе правосудия . Поскольку это довольно чистый код для рисования, я вставил его как сущность # 1139310 .

Вот как это выглядит:

введите описание изображения здесь

ЧАС0


Это действительно круто, я никогда раньше не видел aplpack.
Кен Уильямс

1
@ Кен Спасибо. aplpackПакет также имеет некоторые хорошие дополнения для а именно данных. Тем не менее, rpanel , который также использует tcl / tk, вероятно, является лучшим вариантом для более сложных вещей. Теперь с RStudio и пакетом манипулирования также легко улучшить базовый сюжет в R.
chl

8

G Power 3 , бесплатное программное обеспечение, доступное на Mac и Windows, имеет несколько замечательных графических функций для анализа мощности. Основной график в целом соответствует вашему графику и показан как @chl. Он использует простую прямую линию для обозначения нулевой гипотезы и распределения статистики теста альтернативной гипотезы, а также цвета в бета и альфа в отдельных цветах.

Приятной особенностью G Power 3 является то, что он поддерживает большое количество распространенных сценариев анализа мощности, а графический интерфейс упрощает изучение студентами и прикладными исследователями.

Вот снимок экрана со слайдом (взятым из презентации, которую я дал по описательной статистике с разделом по анализу мощности ) с множеством таких графиков, показанных слева. Если вы выбрали вариант t-test с одним хвостом, то это было бы больше похоже на ваш пример.

g power 3 графика

Также возможно создать графики, которые показывают функциональную взаимосвязь между факторами, имеющими отношение к статистической мощности и проверке гипотез (например, альфа, размер эффекта, размер выборки, мощность и т. Д.). Я привожу несколько примеров таких графиков здесь . Вот один пример такого графика:

введите описание изображения здесь


Интересный пакет, я посмотрю его в будущем. Графики кажутся немного сложными для новичка в этой области. Моя аудитория - доктора медицины без каких-либо математических или статистических знаний. Благодарность!
Макс Гордон
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.