(Чтобы понять, почему я написал это, проверьте комментарии ниже моего ответа на этот вопрос .)
Ошибки типа III и теория статистических решений
Правильный ответ на неправильный вопрос иногда называют ошибкой типа III. Теория статистических решений - это формализация принятия решений в условиях неопределенности; это обеспечивает концептуальную структуру, которая может помочь избежать ошибок типа III. Ключевой элемент структуры называется функцией потерь . Он принимает два аргумента: первый - (соответствующее подмножество) истинного состояния мира (например, в задачах оценки параметров - истинное значение параметра ); второй является элементом в наборе возможных действий (например, в задачах оценки параметров, оценка, Выходные данные моделируют потери, связанные с каждым возможным действием в отношении каждого возможного истинного состояния мира. Например, в задачах оценки параметров некоторые хорошо известные функции потерь:
- абсолютная ошибка потери
- квадратичная потеря ошибок
- Потеря LINEX Хэла Вариана
Изучая ответ, чтобы найти вопрос
Есть случай, когда можно попытаться сделать так, чтобы ошибок типа III можно было избежать, сосредоточившись на формулировании правильной функции потерь и продолжении остального теоретического подхода (не детализированного здесь). Это не мое резюме - в конце концов, статистики хорошо оснащены многими методами и методами, которые работают хорошо, даже если они не являются производными от такого подхода. Но конечный результат, как мне кажется, заключается в том, что подавляющее большинство статистиков не знают и не заботятся о теории статистических решений, и я думаю, что они упускают из виду. Для этих статистиков я бы сказал, что причина, по которой они могут посчитать статистическую теорию принятия решений ценной с точки зрения избежания ошибки Типа III, заключается в том, что она обеспечивает структуру, в которой можно запрашивать любую предлагаемую процедуру анализа данных:с какой функцией потерь (если есть) процедура справляется оптимально? То есть, в какой ситуации принятия решений она дает наилучший ответ?
Задняя ожидаемая потеря
С байесовской точки зрения функция потерь - это все, что нам нужно. Мы можем в значительной степени пропустить остальную часть теории принятия решений - почти по определению, лучшее, что можно сделать, это минимизировать последующую ожидаемую потерю, то есть найти действие которое минимизирует \ tilde {L} (a) = \ int _ {\ Тета} L (\ theta, a) p (\ theta | D) d \ theta .~ L ( ) = ∫ & thetas ; L ( & thetas ; , ) р ( & thetas ; | D ) d & thetas ;
(А что касается небайесовских перспектив? Что ж, это теорема теории принятия частых решений, в частности, полной теоремы Уолда о том, что оптимальным действием всегда будет минимизация байесовской апостериорной ожидаемой потери по отношению к некоторым (возможно, неправильным) сложность этого результата заключается в том, что эта теорема существования не дает указаний относительно того, какой из них использовать до этого, но она плодотворно ограничивает класс процедур, которые мы можем «инвертировать», чтобы точно определить, какой именно вопрос заключается в том, что мы В частности, первый шаг в инверсии любой не байесовской процедуры - выяснить, какую (если она есть) байесовскую процедуру она копирует или аппроксимирует.)
Эй, Сайан, ты знаешь, что это сайт вопросов и ответов, верно?
Что подводит меня - наконец - к статистическому вопросу. В байесовской статистике при предоставлении интервальных оценок для одномерных параметров используются две общие процедуры вероятного интервала: основанный на квантиле доверительный интервал и доверительный интервал с наибольшей апостериорной плотностью. Какие функции потери стоят за этими процедурами?