Что такое допущение статистической процедуры?
Я не статистик, и это может быть неправильно, но я думаю, что слово «допущение» часто используется довольно неформально и может относиться к различным вещам. Для меня «предположение», строго говоря, является чем-то, что может иметь только теоретический результат (теорема).
Когда люди говорят о допущениях о линейной регрессии ( см. Подробное обсуждение здесь), они обычно ссылаются на теорему Гаусса-Маркова, которая гласит, что при допущениях о некоррелированных ошибках с равным отклонением и средним значением оценка OLS является СИНИЙ , т. е. несмещен и имеет минимальную дисперсию. Вне контекста теоремы Гаусса-Маркова мне не ясно, что бы вообще означало «предположение о регрессии».
Точно так же предположения, скажем, t-критерия с одной выборкой относятся к предположениям, согласно которым -статистика -распределена и, следовательно, вывод является действительным. Это не называется «теорема», но это четкий математический результат: если выборок нормально распределены, то -статистика будет следовать распределению Стьюдента с степенями свободы.т н т т н - 1ttnttn−1
Допущения о наказанных методах регрессии
Теперь рассмотрим любую методику регуляризованной регрессии: регрессию гребня, лассо, эластичную сетку, регрессию главных компонентов, регрессию частичных наименьших квадратов и т. Д. И т. Д. Весь смысл этих методов заключается в том, чтобы сделать предвзятую оценку параметров регрессии и надеяться на снижение ожидаемой потери путем использования компромисса смещения дисперсии.
Все эти методы включают один или несколько параметров регуляризации, и ни один из них не имеет определенного правила для выбора значений этого параметра. Оптимальное значение обычно определяется с помощью какой-либо процедуры перекрестной проверки, но существуют различные методы перекрестной проверки, и они могут давать несколько разные результаты. Более того, в дополнение к перекрестной проверке нередко вызывают некоторые дополнительные практические правила. В результате фактический результат любого из этих методов наказанной регрессии фактически не полностью определен этим методом, но может зависеть от выбора аналитика.β^
Поэтому мне не ясно, каким образом может быть какое-либо теоретическое утверждение оптимальности относительно , и поэтому я не уверен, что говорить о «допущениях» (наличии или отсутствии таковых) оштрафованных методов, таких как регрессия гребня, вообще имеет смысл ,β^
Но как насчет математического результата, что регрессия гребня всегда побеждает OLS?
Hoerl & Kennard (1970) в Ridge Regression: Смещенная оценка для неортогональных задач доказали, что всегда существует значение параметра регуляризации такое, что оценка регрессии гребня имеет строго меньшие ожидаемые потери, чем оценка OLS. Это удивительный результат - посмотрите здесь для некоторого обсуждения, но это только доказывает существование такой , которая будет зависеть от набора данных.β λλβλ
Этот результат на самом деле не требует каких-либо допущений и всегда верен, но было бы странно утверждать, что регрессия гребня не имеет никаких допущений.
Хорошо, но как мне узнать, могу ли я применить регрессию гребня или нет?
Я бы сказал, что даже если мы не можем говорить о предположениях, мы можем говорить о правилах большого пальца . Хорошо известно, что регрессия гребня имеет тенденцию быть наиболее полезной в случае множественной регрессии с коррелированными предикторами. Хорошо известно, что он имеет тенденцию превосходить OLS, часто с большим отрывом. Это будет иметь тенденцию превосходить его даже в случае гетероскедастичности, коррелированных ошибок или чего-либо еще. Таким образом, простое практическое правило гласит, что если у вас есть мультиколлинеарные данные, регрессия гребня и перекрестная проверка - это хорошая идея.
Возможно, есть и другие полезные практические правила (например, что делать с грубыми выбросами). Но они не являются предположениями.
Обратите внимание, что для регрессии OLS необходимы некоторые допущения для хранения значений. Напротив, сложно получить в регрессии гребня. Если это вообще делается, это делается с помощью начальной загрузки или с помощью какого-то подобного подхода, и опять же, здесь будет сложно указать конкретные предположения, поскольку нет математических гарантий.рpp