Есть ли какая-то разница между складным ножом и перекрестной проверкой? Процедура кажется идентичной, я что-то упустил?
Есть ли какая-то разница между складным ножом и перекрестной проверкой? Процедура кажется идентичной, я что-то упустил?
Ответы:
При перекрестной проверке вы вычисляете статистику по исключенным выборкам. Чаще всего вы прогнозируете пропущенные выборки по модели, построенной на сохраненных выборках. В джекнифинге вы вычисляете статистику только из сохраненных образцов.
Джекниф часто ссылается на 2 связанных, но разных процесса, оба из которых основаны на подходе «один-один-один-один», что приводит к этой путанице.
В одном контексте складной нож можно использовать для оценки параметров популяции и их стандартных ошибок. Например, чтобы использовать подход складного ножа для оценки наклона и пересечения простой регрессионной модели, можно:
Псевдо-значения и оценки коэффициентов со складным ножом также могут использоваться для определения стандартных ошибок и, таким образом, доверительных интервалов. Обычно этот подход дает более широкие доверительные интервалы для коэффициентов, потому что это лучший, более консервативный показатель неопределенности. Кроме того, этот подход также может быть использован для получения оценки смещения складного ножа для коэффициентов.
В другом контексте складной нож используется для оценки производительности модели. В этом случае складной нож = перекрестная валидация. Оба относятся к тому, чтобы исключить одно наблюдение из набора калибровочных данных, откалибровать модель и предсказать пропущенное наблюдение. По сути, каждое наблюдение прогнозируется с использованием его «частичных оценок» предикторов.
Вот небольшая заметка о складном ноже, которую я нашел в Интернете: https://www.utdallas.edu/~herve/abdi-Jackknife2010-pretty.pdf