У меня нет конкретного примера или задачи. Я просто новичок в использовании b-сплайнов, и я хотел лучше понять эту функцию в контексте регрессии.
Давайте предположим, что мы хотим оценить взаимосвязь между переменной ответа и некоторыми предикторами . Предикторы включают некоторые числовые переменные, а также некоторые категориальные.
Предположим, что после подбора регрессионной модели значима одна из числовых переменных, например, . Логическим шагом после этого является оценка того , требуются ли полиномы более высокого порядка, например: и x_1 ^ 3 , чтобы адекватно объяснить взаимосвязь без переобучения.
Мои вопросы:
В какой момент вы выбираете между b-сплайнами или простым полиномом более высокого порядка. например, в R:
y ~ poly(x1,3) + x2 + x3
против
y ~ bs(x1,3) + x2 + x3
Как вы можете использовать графики, чтобы сообщить свой выбор между этими двумя и что произойдет, если это не совсем понятно из графиков (например: из-за огромного количества точек данных)
Как бы вы оценили условия двустороннего взаимодействия между и, скажем,
Как вышеперечисленные изменения для разных типов моделей
Считаете ли вы, что никогда не используйте многочлены высокого порядка и всегда подбираете b-сплайны и наказываете высокую гибкость?
mgcv
, почему бы не использовать (обобщенные) аддитивные модели. Выбор гладкости автоматический, а логические методы хорошо разработаны.