Какой способ (способы?) Можно визуально объяснить, что такое ANOVA?
Любые ссылки, ссылки (ы) (R пакеты?) Будут приветствоваться.
Какой способ (способы?) Можно визуально объяснить, что такое ANOVA?
Любые ссылки, ссылки (ы) (R пакеты?) Будут приветствоваться.
Ответы:
Лично мне нравится вводить линейную регрессию и ANOVA, показывая, что все это одно и то же, и что линейные модели составляют общее разделение: у нас есть некоторая разница в результате, которая может быть объяснена интересующими факторами плюс необъяснимые часть (называется «остаточный»). Я обычно использую следующую иллюстрацию (серая линия для общей изменчивости, черные линии для групповой или индивидуальной специфической изменчивости):
Я также как heplots R пакет, от Майкла дружественном и Джона Фокса, но также увидеть визуальные тесты гипотезы в многомерной линейной модели: heplots Комплект для R .
Стандартные способы объяснить, что на самом деле делает ANOVA, особенно в рамках линейной модели, действительно хорошо объяснены в ответах Plane на сложные вопросы Кристенсена, но иллюстраций очень мало. Статистические методы Савилла и Вуда . У геометрического подхода есть несколько примеров, но в основном по регрессии. В Монтгомери « Дизайн и анализ экспериментов» , который в основном сфокусирован на DoE, есть иллюстрации, которые мне нравятся, но смотрите ниже.
(это мои :-)
Но я думаю, что вам нужно искать учебники по линейным моделям, если вы хотите увидеть, как сумма квадратов, ошибок и т. Д. Преобразуется в векторное пространство, как показано в Википедии . Оценки и выводы в эконометрике Дэвидсона и Маккиннона, кажется, имеют хорошие иллюстрации (1-я глава фактически описывает геометрию OLS), но я только просматриваю французский перевод (доступен здесь ). Геометрия линейной регрессии также имеет несколько хороших иллюстраций.
Редактировать :
Ах, и я только помню эту статью Роберта Прузека, Новый рисунок для одностороннего ANOVA .
Редактировать 2
И теперь пакет granova (упомянутый @ gd047 и связанный с вышеупомянутым документом) был портирован на ggplot, см. GranovaGG с иллюстрацией для одностороннего ANOVA ниже.
Спасибо за ваш отличный ответ до сих пор. Хотя они были очень поучительными, я чувствовал, что использование их для курса, который я сейчас преподаю (ну, TA'ing), будет слишком много для моих учеников. (Я помогаю преподавать курс BioStatistics для студентов с учеными степенями в области медицинских наук)
Поэтому я закончил тем, что создал два изображения (оба основаны на моделировании), которые я считаю полезным примером для объяснения ANOVA.
Буду рад прочитать комментарии или предложения по их улучшению.
На первом изображении показано моделирование 30 точек данных, разделенных на 3 графика (показывающих, как MST = Var разделяется на данные, которые создают MSB и MSW:
Второе изображение показывает 4 графика, каждый для различной комбинации дисперсии и ожидания для групп, в то время как
Поскольку в этом посте мы собрали некоторые типы хороших графиков, вот еще один, который я недавно нашел и который может помочь вам понять, как работает ANOVA и как генерируется F-статистика. Графика была создана с использованием пакета granova в R.
Посмотрите презентацию Хэдли Уикхем ( pdf , зеркало ) на ggplot. Начиная со страниц 23-40 этого документа он описывает интересный подход к визуализации ANOVA.
* Ссылка взята с: http://had.co.nz/ggplot2/
Отличный вопрос Вы знаете, я очень долго пытался обернуть голову вокруг ANOVA. Я всегда возвращаюсь к интуиции «между противниками», и я всегда старался представить, как это будет выглядеть в моей голове. Я рад, что возник этот вопрос, и меня поразили различные подходы к этому в ответах выше.
Во всяком случае, долгое время (даже годы) я хотел собрать несколько участков в одном месте, где я мог видеть, что происходило одновременно, с разных сторон: 1) как далеко друг от друга население , 2) как далеко друг от друга данные являются, 3) насколько велики годами между по сравнению с внутри и 4 , как) сделать центральное против нецентральных распределений F сравнить?
В действительно великом мире я мог бы даже поиграть с ползунками, чтобы увидеть, как размер выборки меняет вещи.
Так что я играл с manipulate
командой в RStudio , и святая корова, это работает! Вот один из сюжетов, снимок, действительно:
Если у вас есть RStudio, вы можете получить код для создания вышеуказанного сюжета (ползунки и все)! на Github здесь .
Поработав с этим некоторое время, я удивляюсь, насколько хорошо F-статистика различает группы даже для умеренно небольших размеров выборки. Когда я смотрю на популяции, они на самом деле не так уж далеки друг от друга (на мой взгляд), но полоса «в пределах» последовательно затмевается полосой «между». Выучите что-нибудь каждый день, наверное.
Чтобы проиллюстрировать, что происходит с односторонним ANOVA, я иногда использовал апплет, предложенный авторами «Введение в практику статистики», который позволяет ученикам играть с отклонениями внутри и между ними и наблюдать их влияние на F-статистику. , Вот ссылка (апплет последний на странице). Пример снимка экрана:
Пользователь управляет верхним ползунком, варьируя вертикальные спреды трех групп данных. Красная точка внизу перемещается вдоль графика значений p, а отображаемая ниже F-статистика обновляется.
Кажется, корабль уже плыл с точки зрения ответа, но я думаю, что если это вводный курс, то большинство выставок, представленных здесь, будет слишком трудным для понимания начинающих студентов ... или, по крайней мере, слишком Трудно понять без вводного отображения, которое обеспечивает очень упрощенное объяснение дисперсии разделения. Покажите им, как общий SST увеличивается с количеством предметов. Затем, показав инфляцию для нескольких предметов (возможно, добавив по одному в каждую группу несколько раз), объясните, что SST = SSB + SSW (хотя я предпочитаю называть его SSE с самого начала, потому что это позволяет избежать путаницы при переходе к тесту IMO внутри субъекта). ). Затем покажите им визуальное представление разделения дисперсии, например, большой квадрат с цветной кодировкой, чтобы вы могли видеть, как SST сделан из SSB и SSW. Затем,