Я прочитал статью Александра Никулеску-Мизила и Рича Каруаны « Получение калиброванных вероятностей от повышения » и обсуждение в этой теме. Тем не менее, у меня все еще возникают проблемы с пониманием и реализацией логистики или масштабирования Платта, чтобы откалибровать вывод моего многоклассового повышающего классификатора (осторожное повышение с помощью пней решений).
Я немного знаком с обобщенными линейными моделями, и мне кажется, что я понимаю, как методы логистики и калибровки Платта работают в двоичном случае, но я не уверен, что знаю, как расширить метод, описанный в статье, для случая с несколькими классами.
Классификатор, который я использую, выводит следующее:
- = количество голосов, которые классификатор подает за класс j для выборки i , которая классифицируется
- = предполагаемый класс
На данный момент у меня есть следующие вопросы:
Q1: мне нужно использовать полиномиальный логит для оценки вероятностей? или я все еще могу сделать это с помощью логистической регрессии (например, по принципу « 1 против всех» )?
Q2: Как я должен определить промежуточные целевые переменные (например, как в масштабировании Платта) для случая мультикласса?
Q3: я понимаю, что это может быть много, но кто-нибудь захочет набросать псевдокод для этой проблемы? (на более практическом уровне меня интересует решение в Matlab).