Предпосылки: Здесь есть несколько замечательных вопросов / ответов о том, как калибровать модели, которые предсказывают вероятности того или иного исхода. Например
- Оценка Бриера и ее разложение на разрешение, неопределенность и надежность .
- Калибровочные графики и изотоническая регрессия .
Эти методы часто требуют использования метода биннинга для прогнозируемых вероятностей, так что поведение результата (0, 1) сглаживается по бин, принимая средний результат.
Проблема: Тем не менее, я не могу найти ничего, что объясняет мне, как выбрать ширину корзины.
Вопрос: Как выбрать оптимальную ширину корзины?
Попытка: две широко используемые ширины бункера выглядят так:
- Биннинг одинаковой ширины, например, 10 бинов, каждый из которых покрывает 10% интервала [0, 1].
- Метод биннинга Тьюки обсуждается здесь .
Но являются ли эти варианты бинов наиболее оптимальными, если бы кто-то был заинтересован в поиске интервалов в предсказанных вероятностях, которые являются наиболее ошибочно откалиброванными?