Я слышал следующее выражение раньше:
«Оптимизация - корень зла в статистике».
Например, верхний ответ в этой теме делает это утверждение в связи с опасностью слишком агрессивной оптимизации во время выбора модели.
Мой первый вопрос заключается в следующем: относится ли эта цитата к какому-либо конкретному лицу? (например, в статистической литературе)
Из того, что я понимаю, в заявлении говорится о рисках переоснащения. Традиционная мудрость гласит, что правильная перекрестная проверка уже борется с этой проблемой, но, похоже, в этой проблеме есть нечто большее.
Должны ли статистики и специалисты по ОД опасаться чрезмерной оптимизации своих моделей даже при соблюдении строгих протоколов перекрестной проверки (например, 100-кратное 10-кратное резюме)? Если так, как мы узнаем, когда прекратить искать «лучшую» модель?