Регрессия взвешенных наименьших квадратов (WLS) не является трансформированной моделью. Вместо этого, вы просто обрабатывать каждое наблюдение как более или менее информативные подстилающие отношения между и Y . Те пункты, которые являются более информативными, получают больший «вес», а те, которые менее информативны, получают меньший вес. Вы правы в том, что регрессия взвешенных наименьших квадратов (WLS) технически действительна, только если веса известны априори. XY
Xситуация. В результате вы можете попытаться оценить функцию, связывающую дисперсию невязок с уровнями переменных-предикторов.
Есть несколько вопросов, касающихся того, как такая оценка должна быть сделана:
Помните, что веса должны быть обратной величиной дисперсии (или того, что вы используете).
XX
Xplot(model, which=2)
XМедиана абсолютного отклонения от медианы .
XX
Получение весов от остатков регрессии OLS является разумным, потому что OLS является беспристрастным, даже при наличии гетероскедастичности. Тем не менее, эти веса зависят от исходной модели и могут изменить соответствие последующей модели WLS. Таким образом, вы должны проверить свои результаты, сравнивая предполагаемые бета-версии двух регрессий. Если они очень похожи, вы в порядке. Если коэффициенты WLS отличаются от коэффициентов OLS, вы должны использовать оценки WLS для вычисления остатков вручную (в отчетных остатках из соответствия WLS будут учитываться весовые коэффициенты). Вычислив новый набор остатков, снова определите веса и используйте новые веса во второй регрессии WLS. Этот процесс следует повторять до тех пор, пока два набора предполагаемых бета-версий не станут достаточно похожими (хотя даже сделать это один раз редко).
Если этот процесс делает вас несколько неудобным, потому что весовые коэффициенты оцениваются, и потому что они зависят от более ранней, неправильной модели, другой вариант заключается в использовании сэндвич-оценки Хьюбера-Уайта . Это согласуется даже при наличии гетероскедастичности, какой бы серьезной она ни была, и это не зависит от модели. Это также потенциально меньше хлопот.
В моем ответе я продемонстрирую простую версию взвешенных наименьших квадратов и использование сэндвичевых SE: альтернативы одностороннему ANOVA для гетероскедастических данных .