Этот вопрос ссылается на статью Галита Шмуэли «Объяснить или предсказать» .
В частности, в разделе 1.5 «Объяснения и предсказания различны» профессор Шмуэли пишет:
При объяснительном моделировании основное внимание уделяется минимизации смещения для получения наиболее точного представления основной теории.
Это озадачивало меня каждый раз, когда я читал газету. В каком смысле минимизация смещения в оценках дает наиболее точное представление об основной теории?
Я также смотрел выступление профессора Шмуэли здесь , выступившее на JMP Discovery Summit 2017, и она заявляет:
... такие вещи, как модели усадки, ансамбли, вы никогда их не увидите. Потому что эти модели по своей конструкции вводят смещение, чтобы уменьшить общее смещение / дисперсию. Вот почему их там не будет, это не имеет никакого теоретического смысла. Почему вы сделали свою модель преднамеренно предвзятой?
Это на самом деле не проливает свет на мой вопрос, просто повторяет утверждение, которое я не понимаю.
Если в теории много параметров, и у нас мало данных для их оценки, в погрешности оценки будет преобладать дисперсия. Почему в этой ситуации было бы неуместно использовать процедуру предвзятого оценивания, такую как регрессия гребня (что приводит к предвзятым оценкам более низкой дисперсии)?