Нужно ли корректировать нулевой отсчет для проверки отношения правдоподобия пуассоново-логлинейных моделей?


9

Если в таблице сопряженности есть 0, и мы подгоняем вложенные модели Пуассона / логлинеарности (используя glmфункцию R ) для теста отношения правдоподобия, нужно ли корректировать данные до подбора моделей glm (например, добавить 1/2 ко всем на счет)? Очевидно, что некоторые параметры не могут быть оценены без некоторой корректировки, но как регулировка / отсутствие регулировки влияет на тест LR?


предположительно glmрутина рухнула бы, если бы она не могла справиться с нулями. ты пробовал это?
Шаббычеф

1
да, это не дает сбоя, но в зависимости от формулы (например, в насыщенной модели), некоторые параметры могут иметь практически бесконечные стандартные ошибки. Мой вопрос заключается в том, является ли это проблемой при проведении теста отношения правдоподобия. Вы все еще можете рассчитать вероятность, даже если некоторые параметры не оценены, эти параметры просто не повлияют на вероятность. Какая стандартная практика и почему?
BR1

Ответы:


7

Как правило, одна из возможностей регрессионного моделирования заключается в том, что вы можете сгладить области, в которых нет данных, хотя, как вы заметили, иногда возникают проблемы с оценкой параметров. Я бы сказал, что если вы получаете такие вещи, как бесконечные стандартные ошибки, самое время пересмотреть свой подход к моделированию.

Одно конкретное предостережение: существует разница между «отсутствием счета» в определенных слоях и невозможностью учета количества в этих слоях. Например, представьте, что вы работаете над исследованием психологических расстройств военно-морского флота США, скажем, в период с 2000 по 2009 год, и у вас есть бинарные регрессионные термины как «Является женщиной», так и «Служит на подводной лодке». Модель регрессии может быть в состоянии оценить эффекты, где обе переменные = 1, несмотря на то, что счетчик нулей, где оба = 1. Однако этот вывод не будет действительным - такое обстоятельство невозможно. Эта проблема называется «непозитивностью» и иногда является проблемой в сильно стратифицированных моделях.


@ skyguy94 Как ни странно, я не знаю - я знал это, я просто забыл отметить использование ретроспективного набора данных>. <. Отредактировано, чтобы отразить это.
Fomite

Re: «Модель регрессии может быть в состоянии оценить эффекты, где обе переменные = 1, или взаимодействия между ними » - я не думаю, что это правда. Если у вас есть два двоичных предиктора, которые никогда не равны «1», то взаимодействие является постоянным (оно всегда «0»), поэтому его влияние не идентифицируется.
Макро

@Macro Вы правы, я немного редактирую. Я думал о терминах, где они не являются бинарными индикаторами.
Fomite

1
(+1) Итак, проблемы с неправдоподобностью случая, когда оба = 1 в стороне, основанная на модели оценка будет просто суммой двух предельных эффектов, которые, как мы знаем, сами по себе могут вводить в заблуждение :)
Макро
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.