Это большой вопрос.
Мы знаем, что такие модели, как логистика, Пуассон и т. Д. Подпадают под действие обобщенных линейных моделей.
Ну да и нет. Учитывая контекст вопроса, мы должны быть очень осторожны, чтобы уточнить, о чем мы говорим - и одних только «логистики» и «Пуассона» недостаточно, чтобы описать то, что предполагается.
(i) «Пуассон» является распределением. Как описание условного распределения, оно не является линейным (и, следовательно, не GLM), если вы не укажете линейную (в параметрах) модель для описания условного среднего (то есть недостаточно просто сказать «Пуассон»). Когда люди указывают «регрессию Пуассона», они почти всегда стремятся к модели, которая является линейной по параметрам и, следовательно, представляет собой GLM. Но один «Пуассон» может быть любым количеством вещей *.
(ii) «Логистика», с другой стороны, относится к описанию среднего (то, что среднее является логистическим в предикторах). Это не GLM, если вы не объедините его с условным распределением, которое входит в экспоненциальное семейство. Когда люди говорят « логистическая регрессия », с другой стороны, они почти всегда имеют в виду биномиальную модель с логит-связью - это означает, что она логична в предикторах, модель линейна по параметрам и находится в экспоненциальном семействе, как и GLM.
Модель включает в себя нелинейные функции параметров,
Ну опять же да и нет.
η=g(μ)η=Xβ
который, в свою очередь, может быть смоделирован с использованием структуры линейной модели с использованием соответствующей функции связи.
Правильный
Мне интересно, если вы рассматриваете (учите?) Такие ситуации, как логистическая регрессия, как:
(Я изменяю порядок вашего вопроса здесь)
Линейная модель, так как ссылка превращает нас в структуру линейной модели
Именно по этой причине принято называть GLM «линейным». Действительно, довольно ясно, что это соглашение, потому что оно прямо там, в названии .
Нелинейная модель, заданная в виде параметров
Здесь мы должны быть очень осторожны, потому что «нелинейный» обычно относится к модели, нелинейной по параметрам. Контрастная нелинейная регрессия с обобщенными линейными моделями.
Поэтому, если вы хотите использовать термин «нелинейный» для описания GLM, важно тщательно указать, что вы имеете в виду - обычно, что среднее значение нелинейно связано с предикторами.
В самом деле, если вы используете «нелинейный» для обозначения GLM, вы столкнетесь с трудностями не только с соглашением (и, следовательно, с большой вероятностью его неправильно поймут), но и с попытками говорить об обобщенных нелинейных моделях . Трудно объяснить разницу, если вы уже охарактеризовали GLM как «нелинейные модели»!
g(μ)
Y∼Poisson(μx)
xYxμxx
μx=α+exp(βx).
xα
Здесь первый член представляет постоянную смертность от (скажем) несчастных случаев (или других эффектов, не очень связанных с возрастом), в то время как второй термин имеет увеличивающуюся смертность от возраста Такая модель, возможно, иногда может быть осуществима на коротких промежутках позднего взрослого, но не старческого возраста; по сути, это закон Макхема (там он представлен как функция риска, но для него годовая ставка будет разумным приближением).
Это обобщенная нелинейная модель.