Почему распределение Коши не имеет значения?


109

Из функции плотности распределения мы можем определить среднее значение (= 0) для распределения Коши, как показано на графике ниже. Но почему мы говорим, что распределение Коши не имеет значения?

введите описание изображения здесь


2
Я рекомендую ссылку Cabeza G., UA. (2013). Медиа де ла дистрибуция Коши. В блоге Apoyo en Matemáticas о среднем распределении Коши.

Вот мой ответ здесь: stats.stackexchange.com/questions/94402/…
kjetil b halvorsen

Ответы:


99

Вы можете механически проверить, что ожидаемое значение не существует, но это должно быть физически интуитивно понятно, по крайней мере, если вы примете принцип Гюйгенса и закон больших чисел . Заключение закона больших чисел не подходит для распределения Коши, поэтому оно не может иметь среднего значения. Если вы усредните независимых случайных величин Коши, результат не сходится к при с вероятностью . Это остается распределением Коши того же самого размера. Это важно в оптике.0 п 1n0n1

Распределение Коши - нормализованная интенсивность света на линии от точечного источника. Принцип Гюйгенса гласит, что вы можете определить интенсивность, предполагая, что свет переизлучается из любой линии между источником и целью. Таким образом, интенсивность света на линии метра может быть определена, если предположить, что свет сначала попадает на линию на расстоянии метра и переизлучается под любым прямым углом. Интенсивность света на линию метры может быть выражена как - кратное свертка распределения света на линии метр. Таким образом, сумма независимых распределений Коши является распределением Коши, масштабированным с коэффициентом .1 n n 1 n n21nn1nn

Если бы распределение Коши имело среднее значение, то й процентиль кратной свертки, деленный на должен был бы сходиться к по закону больших чисел. Вместо этого он остается постоянным. Если вы отметите й процентиль на (прозрачной) линии на расстоянии метра, метра и т. Д., То эти точки образуют прямую линию под градусов. Они не наклоняются к .n n 0 25 1 2 45 025nn02512450

Это говорит вам о распределении Коши, в частности, но вы должны знать интегральный тест, потому что есть другие распределения без значения, которые не имеют четкой физической интерпретации.


39
+1 Теперь есть светлый ответ :-) (извините). Кстати, принцип назван по имени Христиана Гюйгенса, а не Гюйгена. Гюйгенс был первым, кто оценил новые разработки в области вероятности, опубликованные в 1650-х годах Паскалем (на основе его писем с Ферма): это был рассказ Гюйгенса об этих идеях (1657), в том числе об ожидании, который первоначально получил теорию вероятностей на подготовил почву для оригинального (посмертного) трактата Якоба Бернулли ( Ars Conjectandi , 1713).
whuber

4
Распространяются амплитуды, а не интенсивности.
Дору Константин

2
Это отличный ответ, но я нахожу конец непонятным: «... отметьте 25-й процентиль на ... прямой линии под углом 45 градусов. Они не наклоняются к нулю». Само утверждение верно (как следствие принципа Гюйгенса-Френеля), но это до "делится на ". При делении на 2 на 2 метра, на 3 на 3 метра, ..., прозрачная линия является вертикальной (перпендикулярной экрану, который захватывает свет). Линия квантиля 45 градусов относится к сумме Коши и не помогает с аргументом (пока). n
Ли Дэвид Чунг Лин

40

Ответ добавлен в ответ на комментарий @ whuber к ответу Майкла Черникса (и полностью переписан, чтобы устранить ошибку, указанную whuber.)

Считается, что значение интеграла для ожидаемого значения случайной величины Коши не определено, поскольку это значение может быть «сделано» так, как ему угодно. Интеграл (интерпретируемый в смысле интеграла Римана) - это то, что обычно называют неправильный интеграл и его значение должны быть вычислены как предельное значение: или

xπ(1+x2)dx
xπ(1+x2)dx=limT1limT2+T1T2xπ(1+x2)dx
xπ(1+x2)dx=limT2+limT1T1T2xπ(1+x2)dx
и, конечно же, обе оценки должны давать одно и то же конечное значение. Если нет, то интеграл называется неопределенным. Это сразу показывает, почему среднее значение случайной величины Коши называется неопределенным: предельное значение во внутреннем пределе расходится.

Главное значение Коши получается в виде одного предела: вместо двойного лимита выше. Главное значение интеграла ожидания легко видеть , чтобы быть , поскольку limitand имеет ценность для всех . Но это нельзя использовать, чтобы сказать, что среднее значение случайной величины Коши равно . То есть среднее значение определяется как значение интеграла в обычном смысле, а не в смысле основного значения.

limTTTxπ(1+x2)dx
00T0

Для вместо этого рассмотрим интеграл который приближается к предельному значению как . Когда , мы получаем главное значение рассмотренное выше. Таким образом, мы не можем придать однозначное значение выражениюα>0

TαTxπ(1+x2)dx=TTxπ(1+x2)dx+TαTxπ(1+x2)dx=0+ln(1+x2)2π|TαT=12πln(1+α2T21+T2)=12πln(α2+T21+T2)
Tα=10- xln(α)πTα=10
0
xπ(1+x2)dx
без указания подхода к двум бесконечностям, и игнорирование этой точки приводит ко всем осложнения и неправильные результаты, потому что вещи не всегда такие, какими они кажутся, когда молоко основной ценности маскируется как крем ценности. Вот почему среднее значение случайной величины Коши называется неопределенным, а не имеет значение , главное значение интеграла.0

Если кто-то использует теоретико-мерный подход к вероятности, а ожидаемый интеграл значений определяется в смысле интеграла Лебега, то проблема проще. существует только тогда, когда конечно, и поэтому не определено для случайной величины Коши поскольку не является конечной.gE [ X ] X E [ | X | ]|g|E[X]XE[|X|]


9
Оценка среднего интеграла неверна: это ноль, а не логарифм. Проблема на самом деле заключается в оценке двух пределов, неявных в бесконечных интегралах.
whuber

@whuber Спасибо за указание на ошибку. Я полностью переписал свой ответ, и ваш комментарий больше не применяется.
Дилип Сарват

Я не понимаю, почему ожидание соотношения не существует. Если и совместно нормально распределены со средним, отличным от нуля, то среднее значение задается как , что мне не хватает? Y Z = XXYxZ=XYxyp(x,y)dxdy
Рой

@Drazick Я не упомянул соотношение двух нормальных случайных величин в моем ответе. Пожалуйста, спросите кого-то, кто поднял эту проблему в отношении случайных величин Коши.
Дилип Сарватэ

2
@Drazick Посмотрите, существует ли ваш интеграл вообще. В общем случае, если плотность непрерывна в окрестности , E [X ^ {- 1}] $ не существует. X0
Дилип Сарвейт

33

Хотя приведенные выше ответы являются достоверным объяснением того, почему распределение Коши не имеет ожиданий, я нахожу тот факт, что отношение двух независимых нормальных вариаций является Коши таким же осветительным: на самом деле, мы есть а второе ожидание - .X1/X2N(0,1)

E[|X1||X2|]=E[|X1|]×E[1|X2|]
+

1
Является ли'сложенная' случайная величина Коши, когда я знаю, что является стандартной Коши? Как найти распределение? |X1X2|X1X2|X1X2|
StubbornAtom

1
Да, это абсолютное значение переменной Коши, которая имеет плотность над положительными действительными числами. f(x)+f(x)
Сиань

Если вы сложите нормальное распределение, тоэто не бесконечность? E1/|X2|
Альберт Чен

Это бесконечность.
Сиань

22

Коши не имеет значения, потому что точка, которую вы выбираете (0), не является средней. Это медиана и мода . Среднее для абсолютно непрерывного распределения определяется как где - функция плотности, а интеграл берется по области (которая в случае Коши равна to ). Для плотности Коши этот интеграл просто не конечен (половина от до - а половина от до - ).е е - - 0 - 0 xf(x)dxff00


9
Я не критикую тебя, @Dilip: Я усиливаю твои наблюдения. Что очень интересно, так это то, что существование нулевого главного значения может побудить нас определить среднее значение распределения Коши (или среднее значение любого RV) в качестве основного значения интеграла. Это гораздо глубже исследует природу этого вопроса, который заглушается заявлением о том, что интеграл либо бесконечен, либо неопределен: а именно, почему главная ценность не работает ? Почему не было бы законно использовать это как средство?
whuber

5
@whuber Интересно также, что если вы усекаете интеграл в -a и + a для любого a> 0, вы получаете 0. Таким образом, взятие предела при приближении к ∞ симметричного интеграла дает 0. Еще одна причина спросить, почему нет 0 значит.
Майкл Черник

10
@whuber: я принимаю ваш последний вопрос в вашем предпоследнем замечании как риторический; во всяком случае, мы хотим абсолютной конвергенции, и «моя» причина в том, что мы хотим, чтобы вещи вели себя как области. В частности, нам нужно уметь разбивать предметы (функции) на части и переставлять их по желанию, не нарушая полученного нами ответа. Мы не можем делать это прерывание и перестановку для линейной функции с распределением Коши, поэтому мы должны настаивать на том, что ее среднее значение не существует.
кардинал

9
@Cardinal, это хороший ответ! Я был не просто риторическим, потому что сам вопрос спрашивает: «Почему мы говорим, что распределение Коши не имеет смысла?» Утверждение о том, что ожидание не определено, может удовлетворить несомненных, но вероятность того, что разумное альтернативное определение интеграла может существовать - и дает интуитивно правильный ответ! - должна беспокоить людей. Ваш ответ близок к тому, что я имел в виду, но он все еще неполон. Я думаю, что удовлетворительный ответ определил бы важные теоремы статистической теории, которые не работают, когда мы работаем с условно сходящимися интегралами.
whuber

7
@Dilip Я тоже так думал, но, подумав, нашел, что это немного сложнее, чем кажется. Например, нет никакой проблемы с центральной предельной теоремой: требование разницы автоматически гарантирует ожидание, конечно. И многие теоремы доказаны с помощью неравенства Чебышева, где мы еще раз гарантируем среднее. Поэтому мне действительно любопытно: какие большие теоремы используются в практике статистики, когда мы действительно должны осознавать проблемы с условно сходящимися, но не сходящимися ожиданиями?
whuber

16

Распределение Коши лучше всего рассматривать как равномерное распределение на единичном круге, поэтому было бы удивительно, если бы усреднение имело смысл. Предположим, что - это некая «функция усреднения». То есть предположим, что для каждого конечного подмножества единичного круга была точкой единичного круга. Понятно, что должно быть «неестественным». Точнее, не может быть эквивариантным относительно вращений. Чтобы получить распределение Коши в его более обычной, но менее показательной форме, спроецируйте единичную окружность на ось х из (0,1) и используйте эту проекцию для переноса равномерного распределения по окружности на ось х.X f ( X ) f ffXf(X)ff

Чтобы понять, почему среднее значение не существует, подумайте о х как о функции на единичном круге. Довольно просто найти бесконечное количество непересекающихся дуг на единичной окружности, так что если одна из дуг имеет длину d, то x> 1 / 4d на этой дуге. Таким образом, каждая из этих непересекающихся дуг составляет более 1/4 от среднего значения, а суммарный вклад этих дуг бесконечен. Мы можем сделать то же самое снова, но с x <-1 / 4d, с общим вкладом минус бесконечность. Эти интервалы могут отображаться в виде диаграммы, но можно ли составить диаграммы для перекрестной проверки?


1
Добро пожаловать на сайт, @DavidEpstein. Вы можете создавать изображения с предпочитаемым программным обеспечением и загружать их в свой ответ, щелкнув маленький значок с изображением (чтобы запустить мастер) над полем ответа. К сожалению, однако, вам нужно> = 10 повторений, чтобы сделать это. Я уверен, что вы это скоро получите; тем временем, если вы можете опубликовать изображение где-либо еще в Интернете и опубликовать ссылку на него в своем ответе, пользователь с более высоким репутацией может получить его и опубликовать для вас.
gung

3
Я не знал, что Коши интерпретируют как форму на кружке, но это, безусловно, имеет смысл. Топологический аргумент показывает, что на окружности не может быть непрерывной функции, обладающей свойствами усредняющей функции.
Джонни

@DavidEpstein Я также прочитал ваш ответ в другом посте . Стереографическая проекция действительно хороша. Для сравнения, не могли бы вы прокомментировать, почему одинаково правильная радиальная проекция полукруга не означает, что значение должно быть четко определено? А именно, , тогда является стандартным Коши. Геометрически это основной факт, что вписанный угол всегда равен половине его соответствующего центрального угла. X tan ( π ( U - 1UUnif[0,1]Xtan(π(U12))
Ли Дэвид Чунг Лин

На самом деле, с точки зрения физической модели источника света, изображение полукруга является более подходящим, поскольку не сразу понятно, почему принцип Гюйгенса дает вам стереографическую проекцию.
Ли Дэвид Чунг Лин

10

Среднее или ожидаемое значение некоторой случайной величины представляет собой интеграл Лебега, определенный по некоторой вероятностной мере : P E X = X d PXP

EX=XdP

Отсутствие среднего значения случайной величины Коши просто означает, что интеграл Коши rv не существует. Это связано с тем, что хвосты распределения Коши являются тяжелыми хвостами (сравните с хвостами нормального распределения). Однако отсутствие ожидаемого значения не запрещает существование других функций случайной величины Коши.


5
Хвосты являются «тяжелыми» в том смысле, что они не распадаются достаточно быстро в обоих направлениях, чтобы заставить интеграл сходиться. Эта концепция не имеет ничего общего с нормальным распределением (или любым ссылочным распределением).
whuber

4
Да, спасибо за это исправление. Я не собирался подразумевать какую-либо строгую связь между тяжелыми хвостами и нормальным распределением. Тем не менее, я думаю, что сравнение нормального распределения (с легкими хвостами) и распределения с тяжелыми хвостами визуально делает (не всегда) немного легче понять концепцию "тяжелых" хвостов.
Томас

5

Вот больше визуального объяснения. (Для тех из нас, кто бросает вызов математике.). Возьмите генератор случайных чисел с распределением Коши и попробуйте усреднить полученные значения. Вот хорошая страница о функции для этого. https://math.stackexchange.com/questions/484395/how-to-generate-a-cauchy-random-variable Вы обнаружите, что «остроконечность» случайных значений приводит к тому, что оно становится больше, чем вы, а не меньше , Следовательно, это не имеет никакого значения.


4

Просто чтобы добавить к отличным ответам, я сделаю несколько комментариев о том, почему не сходимость интеграла важна для статистической практики. Как уже упоминали другие, если мы допустили, чтобы основным значением было «среднее», то slln больше не действительны! Помимо этого, подумайте о последствиях того факта, что на практике все модели являются приближенными. В частности, распределение Коши является моделью для неограниченной случайной величины. На практике случайные переменные ограничены, но границы часто являются неопределенными и неопределенными. Использование неограниченных моделей является способом облегчения этого, что делает ненужным введение неуверенных (и часто неестественных) границ в модели. Но для того, чтобы это имело смысл, важные аспекты проблемы не должны затрагиваться. Это означает, что если бы мы вводили границы, это не должно существенно изменить модель. Но когда интеграл не сходится, этого не происходит! Модель нестабильна в том смысле, что ожидание RV будет зависеть от в основном произвольных границ. (В приложениях не обязательно есть причина делать границы симметричными!)

По этой причине лучше сказать, что интеграл расходится, чем сказать, что он «бесконечен», причем последний близок к тому, чтобы подразумевать какое-то определенное значение, когда его не существует! Более подробное обсуждение здесь .


-4

Я хотел быть немного придирчивым на секунду. Изображение вверху неверно. Ось X находится в стандартных отклонениях, чего не существует для распределения Коши. Я привередлив, потому что я использую распределение Коши каждый день своей работы. Существует практический случай, когда путаница может вызвать эмпирическую ошибку. T-распределение студента с 1 степенью свободы является стандартным Коши. Обычно в нем указываются различные сигмы, необходимые для значимости. Эти сигмы НЕ являются стандартными отклонениями, они являются вероятными ошибками и являются модой.

Если вы хотите правильно выполнить приведенную выше графику, либо ось X является необработанными данными, либо если вы хотите, чтобы они имели ошибки эквивалентного размера, вы бы дали им равные вероятные ошибки. Одна вероятная ошибка - 0,67 стандартных отклонений в размерах при нормальном распределении. В обоих случаях это полу-межквартильный размах.

Теперь, что касается ответа на ваш вопрос, все, что все написали выше, является правильным, и это математическая причина для этого. Тем не менее, я подозреваю, что вы - студент и новичок в этой теме, и поэтому нелогичные математические решения визуально очевидного могут не показаться правдой.

У меня есть два почти идентичных образца реального мира, взятых из распределения Коши, оба имеют одинаковый режим и одну и ту же вероятную ошибку. Один имеет среднее значение 1,27, а средний - 1,33. У одного со средним значением 1,27 стандартное отклонение составляет 400, у среднего со значением 1,33 стандартное отклонение составляет 5,15. Вероятная ошибка для обоих составляет 0,32, а для режима - 1. Это означает, что для симметричных данных среднее значение не находится в центральных 50%. Требуется ОДНО дополнительное наблюдение, чтобы вытолкнуть среднее значение и / или дисперсию за пределы значимости для любого теста. Причина в том, что среднее значение и дисперсия не являются параметрами, а среднее значение выборки и дисперсия выборки сами по себе являются случайными числами.

Самый простой ответ заключается в том, что параметры распределения Коши не включают в себя среднее и, следовательно, не имеют дисперсии относительно среднего.

Вполне вероятно, что в вашей прошлой педагогике значение среднего значения заключалось в том, что оно обычно является достаточной статистикой. В долгосрочной статистике, основанной на частотах, распределение Коши не имеет достаточной статистики. Это правда, что медиана выборки для распределения Коши с поддержкой по всем реалам является достаточной статистикой, но это потому, что она наследует ее от статистики порядка. Этого достаточно по совпадению, без простого способа думать об этом. Теперь в байесовской статистике имеется достаточная статистика для параметров распределения Коши, и если вы используете униформу до этого, то она также несмещена. Я говорю об этом, потому что, если вам приходится использовать их ежедневно, вы узнали обо всех возможных способах их оценки.

Нет действительной статистики по порядку, которую можно использовать в качестве оценщиков для усеченных распределений Коши, с которыми вы, вероятно, столкнетесь в реальном мире, и поэтому для большинства, но не во всех реальных приложениях, не существует достаточной статистики в частотных методах. ,

Что я предлагаю, так это мысленно отойти от подлости как от чего-то реального. Это инструмент, похожий на молоток, который в целом полезен и обычно может использоваться. Иногда этот инструмент не работает.

Математическая заметка о нормальном и распределении Коши. Когда данные получены в виде временного ряда, то нормальное распределение происходит только тогда, когда ошибки сходятся к нулю, когда t стремится к бесконечности. Когда данные получены в виде временного ряда, распределение Коши происходит, когда ошибки расходятся в бесконечность. Один из-за сходящегося ряда, другой из-за расходящегося ряда. Распределения Коши никогда не достигают определенной точки на пределе, они перемещаются назад и вперед через фиксированную точку, так что пятьдесят процентов времени они находятся на одной стороне и пятьдесят процентов времени на другой. Срединного реверсии нет.


9
В этом ответе есть некоторая путаница! Например, он говорит: «Теперь в байесовской статистике есть достаточная статистика для параметров распределения Коши, и если вы используете униформу до этого, она также будет беспристрастной». Трудно понять это! Во-первых, понятия достаточности по Фрекалисту и Байесу очень близки (и я полагаю, что они могут различаться только в некоторых странных, бесконечно тусклых выборочных пространствах, поэтому для реальной линии они одинаковы). Для модели Коши фиксированной размерности нет достаточной статистики просто (полных данных, очевидно, достаточно).
kjetil b halvorsen

-6

Проще говоря, область под кривой приближается к бесконечности при уменьшении масштаба. Если вы выбрали конечный регион, вы можете найти среднее значение для этого региона. Однако для бесконечности нет смысла.


8
Площадь под PDF равна , по определению, поэтому вы должны подразумевать что-то еще под «кривой». Что это такое? 1
whuber
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.