На основании нескольких статей, книг и статей, которые я прочитал, у меня сложилось впечатление, что рекомендуемый способ подбора распределения вероятностей для набора данных - использование оценки максимального правдоподобия (MLE). Тем не менее, как физик, более интуитивный способ состоит в том, чтобы просто подогнать PDF модели к эмпирическому PDF данных, используя наименьшие квадраты. Почему тогда MLE лучше, чем наименьшие квадраты в подходящих распределениях вероятностей? Может ли кто-нибудь указать мне научную статью / книгу, которая отвечает на этот вопрос?
Я догадываюсь, что MLE не предполагает модель шума, а «шум» в эмпирическом файле PDF является гетероскедастичным и ненормальным.