Если вы точно знаете, что лежит в основе дистрибутива, вам не нужно его изучать. Иногда в естествознании вы точно знаете распределение.
Если вы знаете тип распределения, тогда вам нужно только оценить его параметры и изучить его в том смысле, который вы имели в виду. Например, иногда вы априори знаете, что базовый дистрибутив нормален. В некоторых случаях вы даже знаете, что это значит. Таким образом, для нормального, единственное, что осталось выяснить, это стандартное отклонение. Вы получаете образец стандартного отклонения от образца, и вуаля, вы получаете распределение для изучения.
Если вы не знаете, что такое дистрибутив, но думаете, что он один из нескольких в списке, то вы можете попытаться приспособить этот дистрибутив к данным и выбрать тот, который подходит лучше всего. Затем вы изучаете это распределение.
И, наконец, часто вы не знаете тип дистрибуции, с которой имеете дело. И у вас нет причин полагать, что он принадлежит к одному из 20 дистрибутивов, которым R может соответствовать ваши данные. Чем ты планируешь заняться? Хорошо, вы смотрите на среднее и стандартные отклонения, хорошо. Но что, если это очень искажено? Что если его эксцесс очень велик? и так далее. Вам действительно нужно знать все моменты распространения, чтобы знать и изучать это. Таким образом, в этом случае удобна непараметрическая начальная загрузка. Вы не берете много, а просто берете из него образец, затем изучаете его моменты и другие свойства.
Хотя непараметрическая начальная загрузка не является волшебным инструментом, у нее есть проблемы. Например, это может быть предвзятым. Я думаю, что параметрическая начальная загрузка беспристрастна