Я смотрю на некоторые проблемы, а в некоторых, чтобы проверить коэффициенты, иногда я вижу людей, использующих распределение Стьюдента, а иногда я вижу Нормальное распределение. Какое правило?
Я смотрю на некоторые проблемы, а в некоторых, чтобы проверить коэффициенты, иногда я вижу людей, использующих распределение Стьюдента, а иногда я вижу Нормальное распределение. Какое правило?
Ответы:
Нормальное распределение - это большое выборочное распределение во многих значимых статистических задачах, которые включают в себя некоторую версию центральной предельной теоремы: у вас есть (приблизительно) независимые фрагменты информации, которые добавляются для получения ответа. Если оценки параметров асимптотически нормальны, их функции также будут асимптотически нормальными (в обычных случаях).
С другой стороны, студенческий распределение происходит при более жестких условиях н.о.р. нормальных ошибок регрессии. Если вы можете купить это предположение, вы можете купить t- распределение, используемое для проверки гипотезы в линейной регрессии. Использование этого распределения обеспечивает более широкие доверительные интервалы, чем использование нормального распределения. Смысл этого в том, что в небольших выборках вам необходимо оценить меру неопределенности, среднеквадратичную ошибку регрессии или стандартное отклонение невязок, σ . (В больших выборках у вас есть столько информации, сколько вы знаете, поэтому t- распределение вырождается в нормальное распределение.)
Есть несколько случаев линейной регрессии, даже с конечными выборками, когда распределение Стьюдента не может быть оправдано. Они связаны с нарушениями условий второго порядка по ошибкам регрессии; а именно, что они (1) постоянная дисперсия и (2) независимы. Если эти предположения нарушаются, и вы исправляете свои стандартные ошибки, используя оценку Eicker / White для гетероскедастических, но независимых остатков; или оценка Ньюи-Уэста для последовательно коррелированных ошибок или кластерных стандартных ошибокдля кластерно-коррелированных данных невозможно найти разумное обоснование для распределения учеников. Однако, используя подходящую версию аргумента асимптотической нормальности (трингулярные массивы и т. Д.), Вы можете обосновать нормальное приближение (хотя вы должны иметь в виду, что ваши доверительные интервалы, скорее всего, будут слишком узкими).
Мне нравится представление t-распределения Стьюдента в виде смеси нормального распределения и гамма-распределения:
Обратите внимание, что среднее значение гамма-распределения равно и дисперсия этого распределения равна V [ ρ | ν ] = 2 . Таким образом, мы можем рассматривать t-распределение как обобщающее предположение о постоянной дисперсии к «похожему» предположению о дисперсии. ν основном контролирует, насколько схожим мы допускаем отклонения. Вы также рассматриваете это как «случайную взвешенную» регрессию, поскольку мы можем использовать вышеуказанный интеграл как представление «скрытой переменной» следующим образом:
Где и ρ i ∼ G a m m a ( ν
. Следовательно, этому наблюдению будет уделяться больше внимания в регрессии. Это соответствует тому, что можно было бы интуитивно сделать с выбросом или хорошей точкой данных.
Обратите внимание, что не существует «правила» для решения этих вопросов, хотя мой и другие ответы на этот вопрос могут быть полезны для нахождения некоторых тестов, которые вы можете выполнить по конечному пути дисперсии (студент t - бесконечная дисперсия для степеней свободы, меньших или равных до двух).