Я видел много мест, где у них есть наборы данных ввода / вывода, где они сначала создают линию линейной регрессии, исправляют смещение, а затем используют эти данные только для своей модели. Я не понял, что это за коррекция смещения?
Я видел много мест, где у них есть наборы данных ввода / вывода, где они сначала создают линию линейной регрессии, исправляют смещение, а затем используют эти данные только для своей модели. Я не понял, что это за коррекция смещения?
Ответы:
Хотя формулировка проблемы не является достаточно точной, чтобы точно знать, к какому типу коррекции смещения вы обращаетесь, я думаю, что могу говорить об этом в общем виде. Иногда оценка может быть предвзятой. Это просто означает, что, хотя он может быть хорошим оценщиком, его ожидаемое или среднее значение не совсем равно параметру. Разница между средним значением оценки и истинным значением параметра называется смещением. Когда известно, что оценщик смещен, иногда можно с помощью других средств оценить смещение, а затем изменить оценщик путем вычитания оценочного смещения из исходной оценки. Эта процедура называется коррекцией смещения. Это делается с целью улучшения оценки. Хотя это уменьшит смещение, оно также увеличит дисперсию.
Хорошим примером успешной коррекции смещения являются начальные оценки коррекции смещения коэффициента ошибок классификации. Оценка повторного замещения частоты ошибок имеет большой оптимистический уклон при небольшом размере выборки. Начальная загрузка используется для оценки смещения оценки повторного замещения, и, поскольку оценка повторного замещения недооценивает частоту ошибок, оценка смещения добавляется к оценке повторного замещения для получения скорректированной оценки начальной ошибки смещения ошибки. Когда размер выборки не превышает 30 или менее, объединяя оба класса в задаче о двух классах, определенные формы оценки начальной загрузки (в частности, оценка 632) обеспечивают более точные оценки частоты ошибок, чем перекрестная проверка с пропуском (что очень почти непредвзятая оценка частоты ошибок).