Я обнаружил, возможно, противоречивые определения для статистики перекрестной проверки (CV) и для статистики обобщенной перекрестной проверки (GCV), связанной с линейной моделью (с нормальным гомоскедастическим вектором ошибок ).ε
С одной стороны, Голуб, Хит и Вахба определяют оценку GCV как (стр. 216)
минимизатор заданный где A \ left (\ lambda \ right) = X \ left (X ^ TX + n \ lambda I \ right) ^ {- 1} X ^ TA(λ)=X(XTX+nλI)-1XT
С другой стороны, Эфрон определяет ту же концепцию, что и (с. 24), однако он приписывает введение этой концепции Craven & Wahba, где ее определение (с. 377) по существу такое же как упомянутое выше определение Голуба, Хита и Вахбы.
Означает ли это, что минимизирует ?
Точно так же Голуб, Хит и Вахба определяют оценку CV (стр. 217) как минимизатор
где - оценка
of с опущенной й точкой данных .
Авторы связывают введение оценки CV (также называемой оценкой PRESS) с Алленом («ПРЕССА Аллена», там же). Однако в статье Аллена оценка PRESS определяется (стр. 126) как (в статье Эфрона он определен как (стр. 24)).
Опять же, означает ли это, что минимизирует ?
Аллен, Дэвид М. Взаимосвязь между выбором переменных и агрегацией данных и метод прогнозирования. Technometrics, Vol. 16, № 1 (февраль 1974 г.), с. 125-127.
Крейвен, Питер и Вахба, Грейс. Сглаживание зашумленных данных с помощью сплайн-функций. Numerische Mathematik 31, (1979), с. 377-403
Эфрон, Брэдли. Насколько смещен коэффициент явной ошибки логистической регрессии? Технический отчет № 232. Статистический факультет Стэнфордского университета (апрель 1985 года)
Голуб, Джин Х., Хит и Грейс Вахба. Обобщенная перекрестная проверка как метод выбора хорошего хребта. Technometrics, Vol. 21, № 2 (май 1979 г.), с. 215-223.