Сплайны в GLM и GAM


12

Неправильно ли, что сплайны доступны только в GAM-моделях, а не в GLM-моделях? Я слышал это некоторое время назад, и удивляюсь, является ли это просто заблуждением, или в этом есть доля правды. Вот иллюстрация: http://www.stats.uwo.ca/faculty/bellhouse/glm%20and%20gam.pdf

Ответы:


18

Вы ошибаетесь. Сплайны имеют линейное представление с использованием производных ковариат. Например, квадратичный тренд нелинейный, но его можно смоделировать в линейной модели, взяв: , поэтому X и его квадрат вводятся в линейную модель.E[Y|X]=β0+β1X+β2X2X

Сплайн можно просто рассматривать как сложную параметризацию одного или нескольких непрерывно или псевдонепрерывно значимых ковариат.


Спасибо за ответ! Говоря, что я ошибаюсь, вы имеете в виду, что сплайны могут быть использованы в GLM, верно? Не совсем понял.
HeyJane

Да, конечно. В R импортируйте пакет splines, и запуск bs(...)позволяет создать линейное представление сплайна с заданной пользователем степенью полинома и точками узлов.
AdamO

7
Я много писал об этом вопросе здесь: madrury.github.io/jekyll/update/statistics/2017/08/04/…
Мэтью Друри,

Большое спасибо вам обоим! Теперь я вижу это, АдамО! Отличная страница, Мэтью, я все это прочитаю! :)
HeyJane

12

@ AdamO ответ правильный, так как сплайновые подгонки, безусловно, могут быть выполнены в стандартной среде GLM. Это не значит, что GAM - это особый случай GLM! Хотя существует ряд моделей, которые точно идентичны и могут быть представлены как GAM или как GLM со сплайновым расширением ковариат, есть некоторые модели GAM, которые недоступны в стандартной структуре GLM.

Например, можно подобрать модель GAM, используя сглаживающий сплайн для каждого из ковариат. Это в основном приводит к сплайн-разложению переменных, но со штрафом на вторые производные. В результате получается модель, которая немного выходит за рамки стандартной среды GLM.

Кроме того, она часто считается стандартной процедурой и встроена в большинство библиотек GAM для соответствия параметрам сглаживания (т. Е. Степеням свободы сплайна и т. Д.) За счет оптимизации различных показателей ошибок выборки, тогда как в формулировке GLM обычно учитывается ковариатное пространство. фиксированный.


Хотел бы я проголосовать за тебя, но мне не хватает очков. Спасибо за помощь. Я не уверен, что понимаю ваш второй абзац: вы говорите, что сглаживание сплайнов подходит только для GAM? Не могли бы вы уточнить, в чем именно заключается разница между регулярным кубическим сплайном и сглаживающим кубическим сплайном? Я понимаю, это много, чтобы спросить.
HeyJane

@HeyJane: если вы посмотрите на страницу википедии, вы заметите, что эти сплайны наказываются их второй производной. Это позволяет контролировать плавность с помощью непрерывного штрафа, а не целых степеней свободы. Таким образом, это наказанная проблема максимального правдоподобия, а не стандартная проблема максимального правдоподобия. Это означает, что вы не можете подгонять их напрямую с помощью glmфункции R , в отличие от использования стандартных кубических сплайнов с glm.
Клифф AB

2
Ага! Я понял! Таким образом, вместо правильного кубического сплайна, говоря, что мы просто хотим, чтобы вторые производные были равны в узлах, мы хотим навязать некоторое свойство второй производной, то есть вторая производная не является высокой, отсюда и штрафной член?
HeyJane

@HeyJane: да, я бы сказал, что это хорошее резюме.
Клифф AB
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.