Сравнение MaxEnt, ML, Bayes и других методов статистического вывода


21

Я никоим образом не статистик (у меня был курс математической статистики, но не более того), и недавно, изучая теорию информации и статистическую механику, я встретил то, что называется «мера неопределенности» / «энтропия». Я прочитал вывод Хинчина как меру неопределенности, и это имело смысл для меня. Другой вещью, которая имела смысл, было описание Джейнсом MaxEnt для получения статистики, когда вы знаете среднее арифметическое значение одной или нескольких функций в выборке (при условии, что вы принимаете в качестве меры неопределенности, конечно). -Σпяперпя

Поэтому я искал в сети, чтобы найти связь с другими методами статистического вывода, и Бог был в замешательстве. Например это статья предполагает, предполагая, что я правильно понял, что вы просто получаете оценку ML при соответствующей переформулировке проблемы; МакКей в своей книге говорит, что MaxEnt может дать вам странные вещи, и вы не должны использовать это даже для начальной оценки в байесовском выводе; и т.д .. У меня проблемы с поиском хороших сравнений.

Мой вопрос: не могли бы вы дать объяснение и / или хорошее объяснение слабых и сильных сторон MaxEnt как метода статистического вывода с количественным сравнением с другими методами (например, применительно к игрушечным моделям)?

Ответы:


19

Методы MaxEnt и байесовского вывода соответствуют различным способам включения информации в процедуру моделирования. И то, и другое можно поставить на аксиоматическую почву ( «Аксиомы максимальной энтропии» Джона Скиллинга и «Алгебра вероятного вывода» Кокса ).

Байесовский подход прост в применении, если ваши предыдущие знания приходят в форме измеримой действительной функции в пространстве ваших гипотез, так называемый «предыдущий». MaxEnt прост, когда информация представляет собой набор жестких ограничений в пространстве ваших гипотез. В реальной жизни знания не приходят ни в «предыдущей» форме, ни в форме «ограничений», поэтому успех вашего метода зависит от вашей способности представлять свои знания в соответствующей форме.

Что касается игрушечной задачи, то усреднение по байесовской модели даст вам наименьшую среднюю потерю в журнале (усредненную по многим отрисовкам модели), когда предыдущая соответствует истинному распределению гипотез. Подход MaxEnt даст вам наименьшую потерю журнала в худшем случае, когда его ограничения будут выполнены (наихудшее из всех возможных априоров)

ETJaynes, считающийся отцом методов "MaxEnt", также полагался на байесовские методы. На странице 1412 своей книги он приводит пример, где байесовский подход привел к хорошему решению, а затем пример, когда подход MaxEnt является более естественным.

Максимальное правдоподобие сводит модель к тому, что она лежит внутри некоторого заранее определенного пространства модели и пытается подогнать ее «настолько жестко, насколько возможно», в том смысле, что она будет иметь самую высокую чувствительность к данным из всех методов выбора модели, ограниченных такой моделью. Космос. В то время как MaxEnt и Bayesian - это фреймворки, ML - это метод подбора конкретной модели, и для некоторых конкретных вариантов проектирования ML может в конечном итоге использовать метод, основанный на байесовском или MaxEnt-подходе. Например, MaxEnt с ограничениями равенства эквивалентен подгонке по методу максимального правдоподобия некоторого экспоненциального семейства. Аналогично, приближение к байесовскому выводу может привести к регуляризованному решению с максимальным правдоподобием. Если вы выбираете свой предварительный вариант, чтобы сделать свои выводы максимально чувствительными к данным, результат байесовского вывода будет соответствовать подгонке по методу максимального правдоподобия. Например,ппо испытаниям Бернулли, таким предварительным было бы предельное распределение бета (0,0)

Реальные успехи машинного обучения часто представляют собой смесь различных философий. Например, «Случайные поля» были получены из принципов MaxEnt. Самая популярная реализация идеи, регуляризованная CRF, предполагает добавление «априора» к параметрам. В результате метод не является на самом деле MaxEnt или Bayesian, но под влиянием обеих школ мысли.

Я собрал несколько ссылок на философские основы подходов Байеса и MaxEnt здесь и здесь .

Примечание по терминологии: иногда люди называют свой метод байесовским просто, если в какой-то момент он использует правило Байеса. Аналогично, «MaxEnt» иногда используется для некоторого метода, который предпочитает решения с высокой энтропией. Это не то же самое, что «вывод MaxEnt» или «байесовский вывод», как описано выше


1
Спасибо. Я не думал, что «Логика науки» тоже говорил об этом, я определенно собираюсь прочитать эту книгу.
Франческо

19

Для занимательной критики методов максимальной энтропии я бы порекомендовал прочитать некоторые старые посты группы новостей на sci.stat.math и sci.stat.consult, особенно те, которые написал Рэдфорд Нил:

Я не знаю каких-либо сравнений между maxent и другими методами: кажется, что часть проблемы заключается в том, что maxent - это не каркас, а неоднозначная директива («когда сталкиваешься с неизвестным, просто максимизируй энтропию»), что по-разному интерпретируются разными людьми.


4
(+1) Эта тема 2002 года - адский обмен идеями.
whuber

1
Обратите внимание, что «вывод Уоллиса» максимума, данный Эдвином Джейнсом в «Теории вероятностей: логика науки», дает «экспериментальное» обоснование максимизации энтропии. В дискретных распределениях, если мы начинаем с принципа безразличия (PID), а затем в основном выполняем выборку отклонения по вероятностям, используя ограничения для принятия или отклонения случайных равномерных выборок. Результирующая вероятность тогда произвольно близка к (дискретному) распределению максимума.
вероятностная

3

Это правда, что в прошлом MaxEnt и Bayes имели дело с различными типами или формами информации. Я бы сказал, что Байес также использует «жесткие» ограничения, вероятность.

В любом случае, это больше не проблема, поскольку Байесовское правило (не правило продукта) можно получить из максимальной относительной энтропии (MrE), а не двусмысленным образом:

Это новый мир ...

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.