Просто для усиления - я самый последний запросчик, я считаю.
В конкретном комментарии по пунктам Майка:
Совершенно очевидно, что различие I / II / III применимо только к коррелированным предикторам (из которых несбалансированные схемы являются наиболее распространенным примером, безусловно, для факторного ANOVA) - но мне кажется, что это аргумент, который отклоняет анализ несбалансированной ситуации (и, следовательно, любые дебаты типа I / II / III). Это может быть несовершенным, но именно так все и происходит (и во многих случаях затраты на дальнейший сбор данных перевешивают статистическую проблему, несмотря на предостережения).
Это совершенно справедливо и отражает суть большинства аргументов «II против III, одобряя II», с которыми я сталкивался. Лучшее резюме, с которым я столкнулся, это Langsrud (2003) «ANOVA для несбалансированных данных: используйте суммы квадратов типа III вместо сумм типа III», Статистика и вычисления 13: 163-167 (у меня есть PDF, если оригинал трудно найти ). Он утверждает (беря двухфакторный случай в качестве основного примера), что если есть взаимодействие, есть взаимодействие, поэтому рассмотрение основных эффектов обычно бессмысленно (очевидно, что это справедливо) - и если нет взаимодействия, анализ типа II Основные эффекты более мощные, чем Тип III (несомненно), поэтому вы всегда должны использовать Тип II. Я видел другие аргументы (например, Venables,
И я согласен с этим: если у вас есть взаимодействие, но у вас есть вопрос о главном эффекте, то вы, вероятно, на самостоятельной территории.
Очевидно, что есть те, кто просто хочет Тип III, потому что это делает SPSS, или какая-то другая ссылка на Высший орган статистики. Я не совсем против этой точки зрения, если речь идет о выборе большого количества людей, придерживающихся SPSS (против чего у меня есть некоторые вещи, а именно, времени, денег и условий истечения лицензии) и типа III SS, или большого количества люди переходят на R и тип III СС. Тем не менее, этот аргумент является явно неудачным статистически.
Тем не менее, аргумент, который я нашел более существенным в пользу типа III, заключается в том, что он был независимо представлен Myers & Well (2003 г., «Дизайн исследования и статистический анализ», стр. 323, 626-629) и Maxwell & Delaney (2004 г.). Проектирование экспериментов и анализ данных: перспектива сравнения моделей », с. 324-328, 332-335). Это следующим образом:
- если есть взаимодействие, все методы дают один и тот же результат для суммы квадратов взаимодействия
- Тип II предполагает отсутствие взаимодействия для проверки основных эффектов; тип III не
- Некоторые (например, Лангсруд) утверждают, что если взаимодействие не имеет существенного значения, то вы вправе полагать, что его нет, и смотреть на (более мощные) основные эффекты типа II.
- Но если тест взаимодействия недостаточно силен, но взаимодействие есть, взаимодействие может выйти «несущественным», но все же привести к нарушению допущений теста основных эффектов типа II, смещая эти тесты как слишком либеральные. ,
- Myers & Well цитирует Аппельбаума / Крамера в качестве основных сторонников подхода типа II и продолжает [p323]: «... Можно использовать более консервативные критерии для незначительности взаимодействия, такие как требование, чтобы взаимодействие не было значимым при уровень .25, но нет достаточного понимания последствий даже такого подхода. Как правило, суммы площадей типа II не следует рассчитывать, если только нет веской априорной причины предполагать отсутствие эффектов взаимодействия и явно незначительное взаимодействие сумма площадей." В целом, они цитируют [p629] Lee & Hornick 1981 как демонстрацию того, что взаимодействия, которые не достигают значимости, могут смещать тесты основных эффектов. Максвелл и Делани [p334] поддерживают подход типа II, если взаимодействие населения равно нулю, для власти, и подход типа III, если это не так [для интерпретации средств, полученных из этого подхода]. Они также рекомендуют использовать Тип III в реальной ситуации (когда вы делаете выводы о наличии взаимодействия из данных) из-за проблемы с ошибкой типа 2 [недостаточной силы] в тесте взаимодействия и, таким образом, случайным нарушением. предположения о подходе типа II SS; Затем они обращают внимание на Myers & Well и отмечают длительные дебаты по этому вопросу! сделать выводы о наличии взаимодействия из данных) из-за проблемы с ошибкой типа 2 [недостаточной мощности] в тесте взаимодействия и, таким образом, случайно нарушающей предположения подхода SS типа II; Затем они обращают внимание на Myers & Well и отмечают длительные дебаты по этому вопросу! сделать выводы о наличии взаимодействия из данных) из-за проблемы с ошибкой типа 2 [недостаточной мощности] в тесте взаимодействия и, таким образом, случайно нарушающей предположения подхода SS типа II; Затем они обращают внимание на Myers & Well и отмечают длительные дебаты по этому вопросу!
Итак, моя интерпретация (и я не эксперт!) Заключается в том, что по обеим сторонам аргумента есть много Высших Статистических Органов; что выдвигаемые обычные аргументы не относятся к обычной ситуации, которая может вызвать проблемы (эта ситуация является общей для интерпретации основных эффектов при незначительном взаимодействии); и что есть веские причины для беспокойства в связи с подходом типа II в этой ситуации (и все сводится к проблеме власти и потенциального чрезмерного либерализма).
Для меня этого достаточно, чтобы пожелать использовать опцию Type III в ezANOVA, а также Type II, потому что (за мои деньги) это превосходный интерфейс для систем ANOVA от R. На мой взгляд, R - это не простой способ для новичков, а пакет «ez» с ezANOVA и довольно приятными функциями построения графиков делает долгий путь к тому, чтобы сделать R доступным для более широкой исследовательской аудитории. Некоторые из моих мыслей в процессе (и неприятный взлом для ezANOVA) находятся на http://www.psychol.cam.ac.uk/statistics/R/anova.html .
Было бы интересно услышать все мысли!