Правильно ли я рассчитал эти вероятностные отношения?


18

Я являюсь автором пакета ez для R, и я работаю над обновлением для включения автоматического вычисления отношений правдоподобия (LR) в выходные данные ANOVA. Идея состоит в том, чтобы предоставить LR для каждого эффекта, аналогичного тесту того эффекта, которого достигает ANOVA. Например, LR для основного эффекта представляет сравнение нулевой модели с моделью, которая включает в себя основной эффект, LR для взаимодействия представляет сравнение модели, которая включает оба основных эффекта компонента, с моделью, которая включает в себя как основные эффекты, так и их взаимодействие и т. д.

Теперь мое понимание вычислений LR исходит от Гловера и Диксона ( PDF ), который охватывает основные вычисления, а также поправки к сложности, и приложения к Бортолусси и Диксону ( приложение PDF ), которое охватывает вычисления с использованием переменных с повторными измерениями. Чтобы проверить мое понимание, я разработал эту электронную таблицу , которая берет dfs & SSs из примера ANOVA (сгенерированного из схемы 2 * 2 * 3 * 4 с использованием поддельных данных) и выполняет вычисления LR для каждого эффекта.

Я был бы очень признателен, если бы кто-то с немного большей уверенностью в таких вычислениях смог взглянуть и убедиться, что я все сделал правильно. Для тех, кто предпочитает абстрактный код, вот код R, реализующий обновление для ezANOVA () (см. Особенно строки 15-95).

Ответы:


3

Хотя рассуждения о расчете LR по значениям SS вполне справедливы, метод наименьших квадратов эквивалентен, но не совпадает с оценкой вероятности. (Различие может быть проиллюстрировано, например, в вычислении se, которое делится на (n-1) в методе наименьших квадратов и делится на n при максимальном правдоподобии. Таким образом, оценка максимального правдоподобия является последовательной, но слегка смещенной ).

Это имеет некоторые последствия: вы можете рассчитать LR, так как вероятность пропорциональна , но это не дает вам вероятности самой вашей модели ановы. Это просто говорит вам кое-что о соотношении. Поскольку AIC классически определяется с точки зрения вероятности, я не уверен, что вы можете использовать AIC по своему усмотрению.1s

Я посмотрел на электронную таблицу, но значения для «неоткорректированного LR внутри» (я также не совсем понимаю, что именно вы пытаетесь там вычислить) мне кажутся крайне маловероятными.

Кроме того, мощь тестирования LR заключается в том, что вы можете просто сопоставить модели, которые вам нужны, вам не нужно делать это для всех них (что снижает ошибку мультитестинга). Если вы делаете это для каждого термина, ваш LR полностью эквивалентен F-тесту, а в случае наименьших квадратов, насколько я знаю, даже в числовом отношении примерно так же.

Ваша миля может варьироваться, но я никогда не был уверен, смешивая концепции двух разных структур (то есть наименьших квадратов против максимальной вероятности). Лично я бы сообщил F статистику и реализовал LR в функции, которая позволяет сравнивать модели (например, функция anova для моделей Ime, которая делает именно это).

Мои 2 цента.

PS: я посмотрел ваш код, но не смог разобраться во всех переменных. Если вы будете комментировать свой код с помощью комментариев, это снова сделает жизнь немного проще. Лист EXCEL также не самый простой для понимания. Я еще раз проверю, смогу ли я что-нибудь из этого сделать.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.