Проверка значимости или перекрестная проверка?

20

Два общих подхода к выбору коррелированных переменных - это тесты значимости и перекрестная проверка. Какую проблему каждый пытается решить, и когда я предпочел бы одну над другой?

cross-validation feature-selection

— JohnRos
источник

22

Во-первых, давайте будем явными и поместим вопрос в контекст множественной линейной регрессии, где мы регрессируем переменную ответа на несколько различных переменных (коррелированных или нет) с вектором параметров и функция регрессии $y$ $x_1, \ldots, x_p$ $\beta = (\beta_0, \beta_1, \ldots, \beta_p)$
которая может быть моделью среднего значения переменной отклика для данного наблюдения .

е ({Икс}_{1}, ..., {Икс}_{п}) знак равно β_{0} + β_{1} {Икс}_{1} + ... + β_{п} {Икс}_{п},

$f(x_1, \ldots, x_p) = \beta_0 + \beta_1 x_1 + \ldots + \beta_p x_p,$

x_{1}, \dots, x_{p}

$x_1, \ldots, x_p$

Вопрос в том, как выбрать подмножество , чтобы оно было ненулевым, и, в частности, сравнение тестирования значимости с перекрестной проверкой . $\beta_i$

Чтобы быть предельно ясным в отношении терминологии, проверка значимости является общей концепцией, которая проводится по-разному в разных контекстах. Это зависит, например, от выбора тестовой статистики. Перекрестная проверка действительно является алгоритмом для оценки ожидаемой ошибки обобщения , которая является важной общей концепцией и которая зависит от выбора функции потерь.

Ожидаются ошибка обобщения немного техническая формально определить, но на словах это ожидается потеря подобранной модели , когда используются для прогнозирования на независимом множество данных , где математическое ожидание по данным , используемых для оценки, а также независимых данных набор используется для прогноза.

$\beta_1$

$\beta_1 = 0$ $p$ $\beta_1 = 0$ $p$
$\beta_1 = 0$ $\beta_1 = 0$ $\beta_1$ также может отличаться от 0, и тогда мы можем сравнить две оцененные ошибки. Какая из наименьших соответствует выбранной нами модели.

$\beta_1 \neq 0$

$\beta_1$ $\beta_1$ $-$

$p$ $p$

$p$ $p$ $\beta_1$ $\beta_1$

— NRH
источник

17

Простое использование тестов значимости и пошаговой процедуры для выбора модели может привести вас к убеждению, что у вас очень сильная модель со значительными предикторами, а на самом деле это не так; Вы можете случайно получить сильные корреляции, и эти корреляции, по-видимому, могут быть улучшены при удалении других ненужных предикторов.

Процедура выбора, конечно, сохраняет только те переменные, которые имеют самые сильные корреляции с результатом, и, по мере продвижения пошаговой процедуры, вероятность совершения ошибки типа I становится больше, чем вы могли бы себе представить. Это связано с тем, что стандартные ошибки (и, следовательно, p-значения) не корректируются для учета того факта, что переменные не были выбраны для случайного включения в модель, и для выбора этого набора были проведены множественные проверки гипотез.

У Дэвида Фридмана есть симпатичная статья, в которой он демонстрирует эти пункты под названием « Заметка по проверке уравнений регрессии ». Аннотация:

$R^2$ $R^2$

Как вы упомянули, одним из возможных решений этой проблемы является использование варианта перекрестной проверки. Когда у меня нет веской экономической (моей области исследований) или статистической причины полагать, что моя модель, это мой предпочтительный подход к выбору подходящей модели и выполнению вывода.

Другие респонденты могут упомянуть, что пошаговые процедуры с использованием AIC или BIC асимптотически эквивалентны перекрестной проверке. Однако это работает только тогда, когда количество наблюдений относительно количества предикторов становится большим. В контексте наличия множества переменных относительно количества наблюдений (Фридман говорит, что 1 переменная на 10 или меньше наблюдений), выбор таким образом может демонстрировать плохие свойства, обсужденные выше.

В эпоху мощных компьютеров я не вижу причин, чтобы не использовать перекрестную проверку в качестве процедуры выбора модели вместо пошагового выбора.

— Чарли
источник

Не могли бы вы дать ссылку на пошаговые процедуры с использованием AIC или BIC, которые асимптотически эквивалентны перекрестной проверке ? Я читал об эквивалентности AIC / BIC для перекрестной проверки, но не в пошаговом режиме.

— Ричард Харди