Я узнаю об эмпирической функции кумулятивного распределения. Но я все еще не понимаю
Почему это называется «Эмпирический»?
Есть ли разница между Эмпирическим CDF и CDF?
Я узнаю об эмпирической функции кумулятивного распределения. Но я все еще не понимаю
Почему это называется «Эмпирический»?
Есть ли разница между Эмпирическим CDF и CDF?
Ответы:
Пусть - случайная величина.
Различие заключается в том, какая мера вероятности используется. Для эмпирического CDF вы используете меру вероятности, определенную частотой в эмпирической выборке.
Пусть - случайная величина, обозначающая результат броска одной монеты, где обозначает головы, а обозначает хвосты.
CDF для честной монеты определяется как:
Если бы вы перевернули 2 головы и 1 хвост, эмпирический CDF будет:
Эмпирический CDF будет отражать , что в вашей выборке, ваших перестроек были головами.
Пусть - нормально распределенная случайная величина со средним значением и стандартным отклонением .
CDF предоставляется:
При достаточном количестве розыгрышей IID (и соблюдении определенных условий регулярности) эмпирический CDF будет сходиться к базовому CDF популяции.
Есть ли разница между Эмпирическим CDF и CDF?
Да, они разные. Эмпирический cdf - это правильный cdf, но эмпирические cdf всегда будут дискретными, даже если они не взяты из дискретного распределения, в то время как cdf распределения может быть другим, помимо дискретного.
Если вы рассматриваете выборку так, как если бы она была совокупностью значений, каждая из которых одинаково вероятна (т. Е. Поместите вероятность 1 / n в каждое наблюдение), тогда cdf этого распределения будет ECDF данных.
Почему это называется «Эмпирический»?
Это оценка численности населения в формате cdf на основе выборки; в частности, если вы относитесь к пропорциям выборки при каждом отдельном значении данных и относитесь к нему как к вероятности в популяции, вы получаете ECDF.
Эмпирическое имеет значение что-то вроде «наблюдением, а не теорией», и это именно то, что оно означает в данном случае ... использование наблюдений для определения функции распределения.
Эмпирический CDF построен на основе фактического набора данных (на графике ниже я использовал 100 выборок из стандартного нормального распределения). CDF - это теоретическая конструкция - это то, что вы бы увидели, если бы могли брать бесконечно много сэмплов.
Эмпирический CDF обычно очень хорошо аппроксимирует CDF, особенно для больших выборок (на самом деле существуют теоремы о том, как быстро он сходится к CDF при увеличении размера выборки).
Эмпирический это то, что вы строите из данных и наблюдений. Например, предположим, что вы хотите знать о распределении роста людей в стране. Вы начинаете с измерения людей и получаете гистограмму, которая может быть приближена к распределению. Затем вы рассчитываете эмпирический CDF.
Если вы используете статистическое распределение (детерминированная формула, которая дает точно такой же результат с теми же параметрами), вы также можете рассчитать его CDF.
Вы можете сказать: «Рост людей в этой стране распределен аналогично нормальному распределению со средним 1,75 м и стандартным отклонением 0,1 м. Тогда вы можете использовать CDF ~ вместо построенного CDF эмпирического распределения.
Согласно Dictionary.com , определения «эмпирические» включают в себя:
получены или руководствуются опытом или экспериментом.
Следовательно, Empirical CDF - это CDF, который вы получаете из ваших данных. Это контрастирует с теоретическим CDF (часто называемым просто «CDF»), который получается из статистической или вероятностной модели, такой как нормальное распределение.