Какие именно моменты? Как они получены?


19

Мы, как правило, знакомимся с методом оценки моментов, «приравнивая моменты совокупности к их выборочному аналогу», пока не оценим все параметры совокупности; так что в случае нормального распределения нам понадобятся только первый и второй моменты, потому что они полностью описывают это распределение.

E(Икс)знак равноμΣязнак равно1NИкся/Nзнак равноИкс¯

Е(Икс2)знак равноμ2+σ2Σязнак равно1NИкся2/N

И мы можем теоретически вычислить до N дополнительных моментов как:

E(Xr)i=1nXir/n

Как я могу построить интуицию для того, что на самом деле моменты? Я знаю, что они существуют как понятия в физике и в математике, но я не нахожу ни одно из них, особенно потому, что не знаю, как сделать абстракцию от концепции массы до точки данных. Термин, кажется, используется в статистике особым образом, который отличается от использования в других дисциплинах.

Какая характеристика моих данных определяет, сколько ( r ) моментов существует в целом?


7
Термин означает то же самое, что и в физике, применительно к распределению вероятностей. Смотрите здесь , у которого есть уравнение , «где ρ - распределение плотности заряда, массы или любой другой рассматриваемой величины». Когда «рассматриваемая вещь» является плотностью вероятности, у вас есть соответствующий момент вероятности. Это грубые моменты (моменты о происхождении). Для сравнения ... (ctd)μn=rnρ(r)drρ
Glen_b

2
Моменты - это параметризованные особенности распределения случайных величин, например квантилей. Моменты параметризуются натуральными числами и полностью характеризуют распределение (см. Функцию, генерирующую моменты ). Это не исключает, что для некоторых распределений может существовать идеальная функциональная зависимость между моментами, поэтому не все моменты всегда требуются для характеристики распределения. (1/2)
чакраварти

Моменты функционально зависят от первых двух для нормального распределения, поэтому первых двух достаточно для характеристики распределения, включая среднее значение и дисперсию. (2/2)3
чакраварти

5
(ctd) ... моменты в математике одинаковы ( ), за исключением примерно c, а не 0 (т. е. просто обобщенной формы физики - но поскольку они одинаковы с простым изменением происхождения, физик справедливо сказал бы: «Чем это отличается?»). Они такиеже,как и в вероятности, когда f - плотность. Для меня все трое говорят об одном и том же, когда говорят «моменты», а не разные вещи. μn=(xc)nf(x)dxcf
Glen_b

3
Я уверен, что вы можете найти ответы во многих темах, которые были опубликованы о моментах и ​​интуиции . Статистика использует моменты точно так же, как они используются в физике и математике - это одно и то же понятие с одинаковым определением во всех трех областях.
whuber

Ответы:


17

Прошло много времени с тех пор, как я посещал урок физики, поэтому дайте мне знать, если что-то из этого неверно.

Общее описание моментов с физическими аналогами

Возьмите случайную переменную, . П -й момент X вокруг с составляет: м п ( с ) = Е [ ( X - с ) п ] Это в точности соответствует физическому смыслу мгновения. Представьте X как набор точек вдоль реальной линии с плотностью, заданной в PDF. Поместите точку опоры под этой линией в точке c и начните вычислять моменты относительно этой точки, и вычисления будут точно соответствовать статистическим моментам.ИксNИксс

мN(с)знак равноЕ[(Икс-с)N]
Иксс

Большая часть времени, то -го момент X относится к моменту вокруг 0 (моментов , когда точка опоры находится в точке 0): м п = E [ X п ] п -го центральный момент X является: м п = m n ( m 1 ) = E [ ( X - m 1 ) n ]NИкс

мNзнак равноЕ[ИксN]
NИкс
м^Nзнак равномN(м1)знак равноЕ[(Икс-м1)N]
Это соответствует моментам, когда точка опоры находится в центре масс, поэтому распределение сбалансировано. Это позволяет легче интерпретировать моменты, как мы увидим ниже. Первый центральный момент всегда будет нулевым, потому что распределение сбалансировано.

-го стандартизированы момент X является: ~ т п = т пNИкс

м~Nзнак равном^N(м^2)Nзнак равноЕ[(Икс-м1)N](Е[(Икс-м1)2])N

Обычно используемые моменты

Для любого распределения существует потенциально бесконечное количество моментов. Достаточные моменты почти всегда будут полностью характеризовать и распределять (получение необходимых условий для того, чтобы быть уверенным, является частью проблемы моментов ). В статистике часто говорят о четырех моментах:

  1. Среднее значение - 1-й момент (с центром около нуля). Это центр масс распределения, или, альтернативно, он пропорционален моменту крутящего момента распределения относительно точки опоры в 0.
  2. Икс
  3. Асимметрия - 3-й центральный момент (иногда стандартизированный). Мера перекоса распределения в том или ином направлении. Относительно нормального распределения (у которого нет перекоса), распределение с положительным перекосом имеет низкую вероятность чрезвычайно высоких результатов, а распределение с отрицательным перекосом имеет небольшую вероятность крайне низких результатов. Физические аналоги сложны, но слабо измеряют асимметрию распределения. В качестве примера, рисунок ниже взят из Википедии . Skewness, взято из Википедии
  4. ИксКуртоз, также из Википедии

Мы редко говорим о моментах, не связанных с куртозом, именно потому, что у них очень мало интуиции. Это похоже на остановку физиков после второго момента.


6

Это немного старая тема, но я хотел бы исправить искажение в комментарии Фг Ну, который написал: «Моменты параметризованы натуральными числами и полностью характеризуют распределение».

Моменты НЕ полностью характеризуют распределение. В частности, знание всего бесконечного числа моментов, даже если они существуют, не обязательно однозначно определяет распределение.

Согласно моей любимой книге по вероятности, Феллер «Введение в теорию вероятностей и ее приложения, том II» (см. Мой ответ на реальных примерах общих распределений ), раздел VII.3, пример на стр. 227-228, логнормальное не определено его моментами, что означает, что существуют другие распределения, имеющие все бесконечное число моментов, такие же, как у логнормального, но разные функции распределения. Как широко известно, функция генерирования моментов не существует для логнормального значения, как и для других распределений, обладающих такими же моментами.

Как указано на с. 228, по существу ненулевая случайная величинаИкс определяется его моментами, если они все существуют и

ΣNзнак равно1(Е[Икс2N])-1/(2N)

расходится. Обратите внимание, что это не тогда и только тогда. Это условие не выполняется для Логнормального и действительно не определяется его моментами.

С другой стороны, распределения (случайные величины), которые разделяют все бесконечное число моментов, могут сильно отличаться только из-за неравенств, которые могут быть получены из их моментов.


Это значительно упрощается, когда распределение ограничено, и в этом случае моменты всегда определяют распределение полностью (однозначно).
Алекс Р.

@ Алекс Это прямое следствие результата, приведенного в Феллер.
whuber

Не совсем правильно утверждать, что функция, генерирующая момент, не существует для логнормального значения. Наиболее полезные теоремы о mgf предполагают, что он существует в открытом интервале, содержащем ноль, и в строгом смысле этого слова не существует. Но он существует в луче, исходящем от нуля !, и это также дает полезную информацию.
kjetil b halvorsen

@ kjetil b halvorsen, можете ли вы описать (некоторые из) полезную информацию, которую вы получили бы от существования MGF логнормального луча, исходящего от нуля? Какой это будет луч?
Марк Л. Стоун

Удар вышеупомянутого комментария как вопрос к @kjetil b halvorsen ..
Марк Л. Стоун

2

Следствие замечаний Глен_б состоит в том, что первый момент, среднее значение, соответствует центру тяжести физического объекта, а второй момент вокруг среднего, дисперсия, соответствует моменту его инерции. После этого ты сам по себе.


3
Мне нравится отношение первого момента и среднего значения ... но второй момент - это не дисперсия ... дисперсия - это центрированный второй момент ...Е[Икс2]знак равноИкс2е(Икс)dИкс vaр[Икс]знак равноЕ[(Икс-Е[Икс])2]знак равно(Икс-Е[Икс])2е(Икс)dИкс,
Захари Блюменфельд

0

Биномиальное дерево имеет две ветви, каждая с вероятностью 0,5. На самом деле р = 0,5, а q = 1-0,5 = 0,5. Это создает нормальное распределение с равномерно распределенной вероятностной массой.

На самом деле, мы должны предположить, что каждый уровень в дереве завершен. Когда мы разбиваем данные на бункеры, мы получаем реальное число от деления, но мы округляем. Ну, это уровень, который не является полным, поэтому мы не получаем гистограмму, приближающуюся к нормали.

Измените вероятности ветвления на p = 0,9999 и q = 0,0001, и это приведет нас к искаженной норме. Масса вероятности сместилась. Это объясняет асимметрию.

Наличие неполных ярусов или бинов меньше 2 ^ n порождает биномиальные деревья с областями, которые не имеют вероятностной массы. Это дает нам эксцесс.


Ответ на комментарий:

Когда я говорил об определении количества бинов, округлим до следующего целого числа.

Машины Quincunx сбрасывают шары, которые в конечном итоге приближаются к нормальному распределению через бином. Такая машина делает несколько предположений: 1) число бинов конечно, 2) базовое дерево двоично и 3) вероятности фиксированы. Машина Quincunx в Музее математики в Нью-Йорке позволяет пользователю динамически изменять вероятности. Вероятности могут измениться в любое время, даже до завершения текущего слоя. Отсюда и идея о том, что контейнеры не заполнены.

В отличие от того, что я сказал в своем первоначальном ответе, когда у вас есть пустота в дереве, распределение демонстрирует эксцесс.

Я смотрю на это с точки зрения генеративных систем. Я использую треугольник, чтобы суммировать деревья решений. Когда новое решение принято, добавляется больше корзин в основании треугольника, а с точки зрения распределения - в хвостах. Обрезка поддеревьев из дерева оставит пустоты в массе вероятности распределения.

Я только ответил, чтобы дать вам интуитивное чувство. Этикетки? Я использовал Excel и поиграл с вероятностями в бином, и сгенерировал ожидаемые перекосы. Я не сделал этого с куртозом, это не помогает, что мы вынуждены думать о вероятностной массе как о статичной, используя язык, предлагающий движение. Основные данные или шары вызывают куртоз. Затем мы анализируем его по-разному и приписываем ему в форме описательных терминов, таких как центр, плечо и хвост. Единственное, с чем мы должны работать - это мусорные ведра. Бункеры живут динамической жизнью, даже если данные не могут.


2
Это интригующе, но ужасно схематично. Какие метки на вашем биномиальном дереве, например? Лучше быть бесконечным деревом, если вы хотите получить нормальное распределение, но тогда очевидные метки (с использованием случайного блуждания или использования двоичных представлений действительных чисел) вообще не приводят к нормальному распределению. Без этих деталей слишком много осталось для воображения читателей. Не могли бы вы остановиться на них?
whuber
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.