Вы применяете относительно узкое определение частоты и MLE - если мы немного более щедры и определяем
Частота: цель согласованности, (асимптотической) оптимальности, непредвзятости и контролируемой частоты ошибок при повторной выборке, независимо от истинных параметров
MLE = точечная оценка + доверительные интервалы (ДИ)
тогда кажется довольно ясным, что MLE удовлетворяет всем идеалам частых людей. В частности, CI в MLE, как p-значения, контролируют частоту ошибок при многократной выборке и не дают 95% -ную область вероятности для истинного значения параметра, как думают многие люди - следовательно, они насквозь и часто используются.
Не все эти идеи уже присутствовали в основополагающей статье Фишера 1922 года «О математических основах теоретической статистики» , но идея оптимальности и беспристрастности есть, и Нейман последний добавил идею построения КИ с фиксированной частотой ошибок. Эфрон, 2013 год, «250-летний аргумент: вера, поведение и самозагрузка» , подводит итог своей очень читаемой истории дебатов Байеса и частых:
В начале 1900-х годов популярность побочных эффектов действительно началась. Рональд Фишер разработал теорию оптимальной оценки максимального правдоподобия, продемонстрировав наилучшее возможное поведение для оценки, а Ежи Нейман сделал то же самое для доверительных интервалов и тестов. Процедуры Фишера и Неймана почти идеально соответствовали научным потребностям и вычислительным пределам науки двадцатого века, бросая байесианство в теневое существование.
Относительно вашего более узкого определения - я, мягко говоря, не согласен с вашей предпосылкой, что минимизация риска частых случаев (FR) является основным критерием, чтобы решить, следует ли метод философии частот. Я бы сказал, что тот факт, что минимизация FR является желательным свойством, следует из философии часто, а не предшествует ей. Следовательно, правило принятия решения / оценка не должны минимизировать FR, чтобы быть частым, и минимизация FR также не обязательно говорит о том, что метод является частым, но сомневающийся в частом предпочтении предпочтет минимизацию FR.
Если мы посмотрим на MLE конкретно: Фишер показал, что MLE асимптотически оптимален (в целом эквивалентен минимизации FR), и это, безусловно, было одной из причин продвижения MLE. Тем не менее, он знал, что оптимальность не имеет места для конечного размера выборки. Тем не менее, он был доволен этой оценкой из-за других желательных свойств, таких как согласованность, асимптотическая нормальность, инвариантность при преобразованиях параметров, и давайте не будем забывать: простота вычисления. В частности, инвариантность особенно подчеркивается в статье 1922 года - из моего прочтения я бы сказал, что поддержание инвариантности при преобразовании параметров и способность избавляться от априорных значений в целом были одной из его основных мотивов при выборе MLE. Если вы хотите лучше понять его рассуждения, я действительно рекомендую статью 1922 года: