Пожалуйста, смотрите редактировать.
Когда у вас есть данные с тяжелыми хвостами, выполнение регрессии с ошибками Student-T кажется интуитивно понятным. Исследуя эту возможность, я наткнулся на эту статью:
Breusch, TS, Robertson, JC, & Welsh, AH (01 ноября 1997 г.). Новая одежда императора: критика многомерной регрессионной модели. Statistica Neerlandica, 51, 3.) ( ссылка , pdf )
Который утверждает, что параметр масштаба и параметр степеней свободы не могут быть идентифицированы относительно друг друга в некотором смысле, и что из-за этого выполнение регрессии с ошибками t не делает ничего, кроме того, что делает стандартная линейная регрессия.
Zellner (1976) предложил регрессионную модель, в которой вектор данных (или вектор ошибок) представлен как реализация из многомерного распределения Стьюдента. Эта модель привлекла значительное внимание, потому что она, кажется, расширяет обычное гауссовское допущение, чтобы учесть более грубые распределения ошибок. Ряд результатов в литературе указывает на то, что стандартные процедуры вывода для гауссовой модели остаются подходящими при более широком распределении, что приводит к утверждениям об устойчивости стандартных методов. Мы показываем, что, хотя математически эти две модели различны, для целей статистического вывода они неразличимы. Эмпирические следствия многомерной t-модели точно такие же, как и у гауссовой модели. Следовательно, предложение о более широком распределенном представлении данных является ложным, а утверждения об устойчивости вводят в заблуждение. Эти выводы сделаны как с точки зрения частоты, так и байеса.
Это удивляет меня.
У меня нет математической сложности для правильной оценки их аргументов, поэтому у меня есть пара вопросов: правда ли, что выполнение регрессий с t-ошибками, как правило, бесполезно? Если они иногда полезны, я неправильно понял статью или она вводит в заблуждение? Если они бесполезны, это хорошо известный факт? Существуют ли другие способы учета данных с тяжелыми хвостами?
Редактировать : После более внимательного прочтения параграфа 3 и раздела 4, похоже, что в приведенной ниже статье не говорится о том, что я рассматривал как регрессию Стьюдента (ошибки - это независимые одномерные t-распределения). Ошибки вместо этого взяты из одного распределения и не являются независимыми. Если я правильно понимаю, это отсутствие независимости именно то, что объясняет, почему вы не можете оценить масштабы и степени свободы независимо.
Я предполагаю, что эта статья предоставляет список статей, чтобы избежать чтения.