Есть ли причина не использовать ортогональные многочлены при подборе регрессий?


13

В общем, мне интересно, если там когда-либо лучше не использовать ортогональные полиномы при подборе регрессии с переменными более высокого порядка. В частности, мне интересно с использованием R:

Если poly()с raw = FALSEпроизводит то же значение, что и подогнанного poly()с raw = TRUE, и polyс raw = FALSEрешаете некоторые из проблем , связанных с полиномиальными регрессиями, то следует poly()с raw = FALSE всегда можно использовать для установки полиномиальных регрессий? При каких обстоятельствах было бы лучше не использовать poly()?

Ответы:


16

Есть ли причина? Конечно; скорее всего несколько.

Рассмотрим, например, где меня интересуют значения необработанных коэффициентов (скажем, для сравнения их с гипотетическими значениями), и коллинеарность не представляет особой проблемы. Это в значительной степени та же самая причина, почему я часто не имею в виду центр в обычной линейной регрессии (которая является линейным ортогональным полиномом)

Это не вещи, с которыми вы не можете справиться с помощью ортогональных полиномов; это скорее вопрос удобства, но удобство - большая причина, почему я делаю много вещей.

Тем не менее, я склоняюсь к ортогональным многочленам во многих случаях при подгонке многочленов, поскольку они имеют некоторые явные преимущества.


Можно ли сравнить коэффициенты, полученные в результате ортогональной полиномиальной регрессии, с предполагаемыми значениями?
user2374133

2
Да. Например, вы можете преобразовать их обратно в подразумеваемые коэффициенты и стандартные ошибки из «сырых» полиномов.
Glen_b

2
Чаще всего преобразование из ортогонального полиномиального базиса в мономиальный базис является плохо обусловленным процессом (для высоких степеней; преобразование низкой степени не так уж плохо), поэтому, если кто- то априори интересуется мономиальными базисными коэффициентами, любой числовая стабильность, которую вы получили благодаря использованию ортогональных многочленов, выбрасывается в окно при преобразовании, так что вы могли бы также использовать одночлены с самого начала. Будьте бдительны , конечно.
JM не является статистиком

1
@JM Спасибо, это отличный момент. К счастью, в наши дни в статистических приложениях было бы очень редко соответствовать более чем полиному низкого порядка (я обычно советую, что если нет веских теоретических оснований для того, чтобы идти выше третьей или четвертой степени, следует взглянуть на разные подходы - какие альтернативные может быть лучше всего зависит от обстоятельств, но такие вещи, как сплайны, например, могут быть подходящими для некоторых ситуаций.).
Glen_b

13

Потому что, если ваша модель покидает R, когда вырастет, вы должны помнить, чтобы упаковать ее константы центрирования и нормализации, а затем она должна тащить их все время. Представьте себе, что однажды столкнетесь с этим в SQL, и ужас, осознавая, что он их потерял!

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.