Должен ли я включить аргумент для запроса суммы квадратов типа III в eZANOVA?

16

Я разработал пакет ez для R как средство, помогающее людям переходить от пакетов статистики, таких как SPSS к R. Это (надеюсь) достигается путем упрощения спецификации различных разновидностей ANOVA и обеспечения вывода, подобного SPSS (включая размеры эффектов и допущения). тесты), среди других функций. ezANOVA()Функция главным образом служит в качестве обертки к car::Anova(), но текущая версия ezANOVA()реализует только типа II суммы квадратов, тогда как car::Anova()разрешения спецификации либо типа II или -III суммы квадратов. Как и следовало ожидать, несколько пользователей попросили меня предоставить аргумент вezANOVA()это позволяет пользователю запрашивать тип II или тип III. Я не хотел этого делать и изложил свои аргументы ниже, но я был бы признателен за вклад сообщества в мои или любые другие рассуждения, касающиеся этой проблемы.

Причины не включать аргумент "SS_type" в ezANOVA():

Разница между квадратами сумм типов I, II и III возникает только тогда, когда данные не сбалансированы, и в этом случае я бы сказал, что больше пользы от улучшения дисбаланса путем дальнейшего сбора данных, чем с вычислениями ANOVA.
Различие между типами II и III применяется к эффектам более низкого порядка, которые квалифицируются по эффектам более высокого порядка, и в этом случае я считаю эффекты более низкого порядка с научной точки зрения неинтересными. (Но см. Ниже для возможного усложнения аргумента)
Для тех редких обстоятельств, когда (1) и (2) не применяются (когда дальнейший сбор данных невозможен, и исследователь имеет действительный научный интерес к квалифицированному основному эффекту, который я не могу себе представить в настоящее время), можно относительно легко изменить ezANOVA()источник или нанимают car::Anova()себя для достижения типа III испытаний. Таким образом, я вижу дополнительные усилия / понимание, необходимые для получения тестов типа III, как средство, с помощью которого я могу гарантировать, что только те, кто действительно знает, что они делают, идут по этому пути.

Теперь самый последний запросчик типа III указал, что аргумент (2) подрывается рассмотрением обстоятельств, когда существующие, но «несущественные» эффекты более высокого порядка могут смещать вычисление сумм квадратов для эффектов более низкого порядка. В таких случаях можно себе представить, что исследователь будет обращать внимание на эффект более высокого порядка, и, видя, что он «несущественный», обратится к попытке интерпретации эффектов более низкого порядка, которые, без ведома исследователя, были скомпрометированы. Моя первоначальная реакция заключается в том, что это не проблема с суммами квадратов, а с p-значениями и традицией проверки нулевых гипотез. Я подозреваю, что более явная мера доказательств, такая как отношение правдоподобия, может с большей вероятностью дать менее двусмысленную картину поддерживаемых моделей в соответствии с данными. Тем не менее, я не

r anova sums-of-squares

— Майк Лоуренс
источник

2

В скором времени - да. Просто для обеспечения согласованности с другими пакетами (даже если результат был «неправильным» в некотором роде - в этом случае предупредительный массаж будет в порядке). И спасибо за ваш удивительный пакет!

— Тал Галили

Когда я писал «пакеты», я имел в виду другие статистические пакеты (такие как SPSS и SAS) - я рад, что другие продвинули этот вопрос дальше, чем я :)

— Tal Galili

2

Как многие уже знают, текущий пакет ez (версия 3) обновил ezANOVA, в котором есть аргументы для SS Type и return aov model.

— jiggysoo

9

Просто для усиления - я самый последний запросчик, я считаю.

В конкретном комментарии по пунктам Майка:

Совершенно очевидно, что различие I / II / III применимо только к коррелированным предикторам (из которых несбалансированные схемы являются наиболее распространенным примером, безусловно, для факторного ANOVA) - но мне кажется, что это аргумент, который отклоняет анализ несбалансированной ситуации (и, следовательно, любые дебаты типа I / II / III). Это может быть несовершенным, но именно так все и происходит (и во многих случаях затраты на дальнейший сбор данных перевешивают статистическую проблему, несмотря на предостережения).
Это совершенно справедливо и отражает суть большинства аргументов «II против III, одобряя II», с которыми я сталкивался. Лучшее резюме, с которым я столкнулся, это Langsrud (2003) «ANOVA для несбалансированных данных: используйте суммы квадратов типа III вместо сумм типа III», Статистика и вычисления 13: 163-167 (у меня есть PDF, если оригинал трудно найти ). Он утверждает (беря двухфакторный случай в качестве основного примера), что если есть взаимодействие, есть взаимодействие, поэтому рассмотрение основных эффектов обычно бессмысленно (очевидно, что это справедливо) - и если нет взаимодействия, анализ типа II Основные эффекты более мощные, чем Тип III (несомненно), поэтому вы всегда должны использовать Тип II. Я видел другие аргументы (например, Venables,
И я согласен с этим: если у вас есть взаимодействие, но у вас есть вопрос о главном эффекте, то вы, вероятно, на самостоятельной территории.

Очевидно, что есть те, кто просто хочет Тип III, потому что это делает SPSS, или какая-то другая ссылка на Высший орган статистики. Я не совсем против этой точки зрения, если речь идет о выборе большого количества людей, придерживающихся SPSS (против чего у меня есть некоторые вещи, а именно, времени, денег и условий истечения лицензии) и типа III SS, или большого количества люди переходят на R и тип III СС. Тем не менее, этот аргумент является явно неудачным статистически.

Тем не менее, аргумент, который я нашел более существенным в пользу типа III, заключается в том, что он был независимо представлен Myers & Well (2003 г., «Дизайн исследования и статистический анализ», стр. 323, 626-629) и Maxwell & Delaney (2004 г.). Проектирование экспериментов и анализ данных: перспектива сравнения моделей », с. 324-328, 332-335). Это следующим образом:

если есть взаимодействие, все методы дают один и тот же результат для суммы квадратов взаимодействия
Тип II предполагает отсутствие взаимодействия для проверки основных эффектов; тип III не
Некоторые (например, Лангсруд) утверждают, что если взаимодействие не имеет существенного значения, то вы вправе полагать, что его нет, и смотреть на (более мощные) основные эффекты типа II.
Но если тест взаимодействия недостаточно силен, но взаимодействие есть, взаимодействие может выйти «несущественным», но все же привести к нарушению допущений теста основных эффектов типа II, смещая эти тесты как слишком либеральные. ,
Myers & Well цитирует Аппельбаума / Крамера в качестве основных сторонников подхода типа II и продолжает [p323]: «... Можно использовать более консервативные критерии для незначительности взаимодействия, такие как требование, чтобы взаимодействие не было значимым при уровень .25, но нет достаточного понимания последствий даже такого подхода. Как правило, суммы площадей типа II не следует рассчитывать, если только нет веской априорной причины предполагать отсутствие эффектов взаимодействия и явно незначительное взаимодействие сумма площадей." В целом, они цитируют [p629] Lee & Hornick 1981 как демонстрацию того, что взаимодействия, которые не достигают значимости, могут смещать тесты основных эффектов. Максвелл и Делани [p334] поддерживают подход типа II, если взаимодействие населения равно нулю, для власти, и подход типа III, если это не так [для интерпретации средств, полученных из этого подхода]. Они также рекомендуют использовать Тип III в реальной ситуации (когда вы делаете выводы о наличии взаимодействия из данных) из-за проблемы с ошибкой типа 2 [недостаточной силы] в тесте взаимодействия и, таким образом, случайным нарушением. предположения о подходе типа II SS; Затем они обращают внимание на Myers & Well и отмечают длительные дебаты по этому вопросу! сделать выводы о наличии взаимодействия из данных) из-за проблемы с ошибкой типа 2 [недостаточной мощности] в тесте взаимодействия и, таким образом, случайно нарушающей предположения подхода SS типа II; Затем они обращают внимание на Myers & Well и отмечают длительные дебаты по этому вопросу! сделать выводы о наличии взаимодействия из данных) из-за проблемы с ошибкой типа 2 [недостаточной мощности] в тесте взаимодействия и, таким образом, случайно нарушающей предположения подхода SS типа II; Затем они обращают внимание на Myers & Well и отмечают длительные дебаты по этому вопросу!

Итак, моя интерпретация (и я не эксперт!) Заключается в том, что по обеим сторонам аргумента есть много Высших Статистических Органов; что выдвигаемые обычные аргументы не относятся к обычной ситуации, которая может вызвать проблемы (эта ситуация является общей для интерпретации основных эффектов при незначительном взаимодействии); и что есть веские причины для беспокойства в связи с подходом типа II в этой ситуации (и все сводится к проблеме власти и потенциального чрезмерного либерализма).

Для меня этого достаточно, чтобы пожелать использовать опцию Type III в ezANOVA, а также Type II, потому что (за мои деньги) это превосходный интерфейс для систем ANOVA от R. На мой взгляд, R - это не простой способ для новичков, а пакет «ez» с ezANOVA и довольно приятными функциями построения графиков делает долгий путь к тому, чтобы сделать R доступным для более широкой исследовательской аудитории. Некоторые из моих мыслей в процессе (и неприятный взлом для ezANOVA) находятся на http://www.psychol.cam.ac.uk/statistics/R/anova.html .

Было бы интересно услышать все мысли!

— Рудольф Кардинал
источник

Ах, я не осознавал, что различие типа II / III возникает всякий раз, когда предикторы коррелируют, из которых несбалансированный дизайн является лишь одним примером. Это, безусловно, еще больше подрывает мой первый аргумент «просто собрать больше данных».

— Майк Лоуренс

2

Я довольно убежден вашим аргументом, что R получит больше конверсий SPSS, если им будут предоставлены простые средства для проведения знакомых анализов, даже если эти анализы требуют более детального рассмотрения, чем обычно применяется. Затем, как только мы подключим их к R, мы можем попытаться убедить их, что знакомый подход не всегда является подходящим подходом. Я думаю, что я все еще помещу значение по умолчанию как type = 2 с большим предупреждением в документации, что это значение по умолчанию может дать результаты, которые отличаются от SPSS, и ссылки делают документацию по различию типа II / III.

— Майк Лоуренс

Другие вариации коррелированных предикторов обычно бывают с непрерывными предикторами, но да, это общая проблема. // Это звучит здорово для меня! Иногда эти сдвиги происходят медленно; я думаю, что использование исправлений сферичности (а не игнорирование проблемы) является прогрессом в нейробиологии. Были случаи, когда любое упоминание об этом (особенно если вы сообщали о исправленном, нецелом df) заставляло судей думать, что вы лаете.

— Рудольф Кардинал

Я хотел бы добавить, что аргументы типа III все о консервативных или либеральных проверках гипотез, а не о значении компонентов. Основной эффект в Типе III просто не имеет смысла, поскольку он включает взаимодействие с отсутствующими основными эффектами. Независимо от консервативных или либеральных проблем тестирования базовая согласованность модели требует Тип II, потому что основной эффект Типа II имеет смысл. Тем не менее, EZANOVA должен иметь тип III по другим причинам.

— Джон

7

Предостережение: чисто нестатистический ответ. Я предпочитаю работать с одной функцией (или хотя бы с одним пакетом) при выполнении одного и того же типа анализа (например, ANOVA). До сих пор я последовательно использую, Anova()так как предпочитаю использовать его синтаксис для определения моделей с повторяющимися измерениями - по сравнению с ними aov()и теряю немного (SS type I) с повторяющимися измерениями. ezANOVA()хорошо для дополнительной выгоды от размеров эффекта. Но что мне не особенно нравится, так это то, что мне приходится иметь дело с 3 разными функциями, чтобы выполнять по сути один и тот же тип анализа, просто потому, что одна из них реализует функцию X (но не Y), а другая Y (но не X).

Для ANOVA, я могу выбрать между oneway(), lm(), aov(), Anova(), ezANOVA(), и , возможно , другие. При обучении R уже трудно объяснять различные варианты, как они связаны друг с другом ( aov()является оберткой lm()), и какая функция делает что:

oneway()только для однофакторных конструкций, но с опцией var.equal=FALSE. Нет такой возможности в aov()других и других, но эти функции также для многофакторных проектов.
синтаксис для повторных измерений немного сложнее aov(), лучше вAnova()
удобный SS типа я только в aov(), а не вAnova()
удобные SS типа II и III только в Anova(), а не вaov()
удобное измерение размера эффекта в ezANOVA(), а не в других

Было бы неплохо научить только одной функции с одним последовательным синтаксисом, который делает все это. Без удобного SS тип III,ezANOVA() для меня не может быть такой функции, потому что я знаю, что студентов попросят использовать их в какой-то момент («просто перепроверьте эти результаты, которые получил Джон Доу с помощью SPSS»). Я чувствую, что лучше иметь возможность сделать выбор самостоятельно, не изучая еще один синтаксис для определения моделей. Отношение «я знаю, что лучше для вас» может иметь свои достоинства, но может быть чрезмерно защитным.

— каракал
источник

1

Чтобы добавить еще одно требование: было бы замечательно, если бы функция также могла запускать все виды контрастов из этого ANOVA, например, используя multcompпакет (который, насколько я помню, требует aovобъектов). В противном случае, я согласен полностью и обычно использовать ezдля моей ежедневной обязанности, потому что это так легко ...

— Хенрик

1

добавление аргумента «method» (с возможными значениями как «oneway», «aov» и «Anova» и с аргументом «...» для передачи var.eq = FALSE в oneeway и type = 2 для Anova) интригующая идея, и, конечно, кажется, что ее было бы достаточно легко включить. Спасибо за предложение.

— Майк Лоуренс

@Henrik: Я должен быть честным, что мое понимание контрастов очень ограничено, и я никогда не использую их в своих исследованиях, поэтому я не расставил приоритеты по включению контрастов в ez.

— Майк Лоуренс

@Mike Если вы можете добавить аргумент метода и ваша функция сможет вернуть aovэлемент, который был бы великолепен. Пока мне обычно лень создавать свой собственный aovэлемент и использовать тебя ezANOVAвместо этого с t.tests ...

— Хенрик

@ Майк, я не осмелился предложить что-то подобное, потому что ты вкладываешь свою работу. Спасибо за это! ezПакет имеет некоторый большой потенциал: в психологии, это уже было рекомендовано довольно часто (ср немецкой книги «R für Einsteiger» по Лумана). Конечно, мы будем признательны за то, чтобы сделать его еще более гибким.

— Каракал

2

R-мир не очень любит Type 3 SS.

Одна из обычно цитируемых ссылок - «Exegeses on Linear Models» Билла Венейблса (2000) .

Я надеюсь, что не осуждаю его, но я думаю, что его главный аргумент в том, что Тип 3 SS нарушает принцип маржинальности линейных моделей и поэтому не является разумным.

— Хенрик
источник

0

Для меня это была открывающая дискуссия по вопросу типа II / III. Спасибо всем за усилия по обеспечению обсуждения. Я бы пришел к выводу о необходимости последовательно продвигать II тип по сравнению с III типом, но имел слабое понимание аргумента - я просто полагался на совет из регрессионной книги Джона Фокса (автомобиль), согласно которому тесты III типа редко даются. интерпретируемый (ну, я думаю, что он сказал, что ...).

В любом случае eZANOVA действительно полезен для разрешения доступа к функциональности R, которая в противном случае была бы невозможна для студентов, которых я преподаю в области психологии. Я предоставляю онлайн-модули R, один из которых содержит ezANOVA для демонстрации смешанного дизайна ANOVA (хотя кажется, что предварительная версия 3 могла содержать ошибки ... дох!)

Попробуйте это здесь:

http://www.wessa.net/rwasp_Mixed%20Model%20ANOVA.wasp

после загрузки модуля (~ 10 с) найдите кнопку вычисления (наполовину вниз по странице), и он запустит ezANOVA и связанные таблицы и графики.

Ян

Когда вы говорите, что в ez были ошибки в смешанных проектах ANOVA, вы основываете это на моем недавнем объявлении о версии 3.0, в котором я отмечаю, что в коде ezMixed () была ошибка? Если так, то я думаю, что вы неверно истолковали эту записку. ezMixed () не имеет отношения к ezANOVA (). ezMixed () служит для оценки влияния фиксированных эффектов в контексте моделирования смешанных эффектов.

— Майк Лоуренс

Привет, Майк - ты совершенно прав - это была твоя заметка о ezMixed (). Я прочитал и неверно истолковал это для ezANOVA ().