Из функции плотности распределения мы можем определить среднее значение (= 0) для распределения Коши, как показано на графике ниже. Но почему мы говорим, что распределение Коши не имеет значения?
Из функции плотности распределения мы можем определить среднее значение (= 0) для распределения Коши, как показано на графике ниже. Но почему мы говорим, что распределение Коши не имеет значения?
Ответы:
Вы можете механически проверить, что ожидаемое значение не существует, но это должно быть физически интуитивно понятно, по крайней мере, если вы примете принцип Гюйгенса и закон больших чисел . Заключение закона больших чисел не подходит для распределения Коши, поэтому оно не может иметь среднего значения. Если вы усредните независимых случайных величин Коши, результат не сходится к при с вероятностью . Это остается распределением Коши того же самого размера. Это важно в оптике.0 п → ∞ 1
Распределение Коши - нормализованная интенсивность света на линии от точечного источника. Принцип Гюйгенса гласит, что вы можете определить интенсивность, предполагая, что свет переизлучается из любой линии между источником и целью. Таким образом, интенсивность света на линии метра может быть определена, если предположить, что свет сначала попадает на линию на расстоянии метра и переизлучается под любым прямым углом. Интенсивность света на линию метры может быть выражена как - кратное свертка распределения света на линии метр. Таким образом, сумма независимых распределений Коши является распределением Коши, масштабированным с коэффициентом .1 n n 1 n n
Если бы распределение Коши имело среднее значение, то й процентиль кратной свертки, деленный на должен был бы сходиться к по закону больших чисел. Вместо этого он остается постоянным. Если вы отметите й процентиль на (прозрачной) линии на расстоянии метра, метра и т. Д., То эти точки образуют прямую линию под градусов. Они не наклоняются к .n n 0 25 1 2 45 0
Это говорит вам о распределении Коши, в частности, но вы должны знать интегральный тест, потому что есть другие распределения без значения, которые не имеют четкой физической интерпретации.
Ответ добавлен в ответ на комментарий @ whuber к ответу Майкла Черникса (и полностью переписан, чтобы устранить ошибку, указанную whuber.)
Считается, что значение интеграла для ожидаемого значения случайной величины Коши не определено, поскольку это значение может быть «сделано» так, как ему угодно. Интеграл (интерпретируемый в смысле интеграла Римана) - это то, что обычно называют неправильный интеграл и его значение должны быть вычислены как предельное значение: или
Главное значение Коши получается в виде одного предела: вместо двойного лимита выше. Главное значение интеграла ожидания легко видеть , чтобы быть , поскольку limitand имеет ценность для всех . Но это нельзя использовать, чтобы сказать, что среднее значение случайной величины Коши равно . То есть среднее значение определяется как значение интеграла в обычном смысле, а не в смысле основного значения.
Для вместо этого рассмотрим интеграл который приближается к предельному значению как . Когда , мы получаем главное значение рассмотренное выше. Таким образом, мы не можем придать однозначное значение выражению
Если кто-то использует теоретико-мерный подход к вероятности, а ожидаемый интеграл значений определяется в смысле интеграла Лебега, то проблема проще. существует только тогда, когда конечно, и поэтому не определено для случайной величины Коши поскольку не является конечной.E [ X ] X E [ | X | ]
Хотя приведенные выше ответы являются достоверным объяснением того, почему распределение Коши не имеет ожиданий, я нахожу тот факт, что отношение двух независимых нормальных вариаций является Коши таким же осветительным: на самом деле, мы есть а второе ожидание - .
Коши не имеет значения, потому что точка, которую вы выбираете (0), не является средней. Это медиана и мода . Среднее для абсолютно непрерывного распределения определяется как где - функция плотности, а интеграл берется по области (которая в случае Коши равна to ). Для плотности Коши этот интеграл просто не конечен (половина от до - а половина от до - ).е е - ∞ ∞ - ∞ 0 - ∞ 0 ∞ ∞
Распределение Коши лучше всего рассматривать как равномерное распределение на единичном круге, поэтому было бы удивительно, если бы усреднение имело смысл. Предположим, что - это некая «функция усреднения». То есть предположим, что для каждого конечного подмножества единичного круга была точкой единичного круга. Понятно, что должно быть «неестественным». Точнее, не может быть эквивариантным относительно вращений. Чтобы получить распределение Коши в его более обычной, но менее показательной форме, спроецируйте единичную окружность на ось х из (0,1) и используйте эту проекцию для переноса равномерного распределения по окружности на ось х.X f ( X ) f f
Чтобы понять, почему среднее значение не существует, подумайте о х как о функции на единичном круге. Довольно просто найти бесконечное количество непересекающихся дуг на единичной окружности, так что если одна из дуг имеет длину d, то x> 1 / 4d на этой дуге. Таким образом, каждая из этих непересекающихся дуг составляет более 1/4 от среднего значения, а суммарный вклад этих дуг бесконечен. Мы можем сделать то же самое снова, но с x <-1 / 4d, с общим вкладом минус бесконечность. Эти интервалы могут отображаться в виде диаграммы, но можно ли составить диаграммы для перекрестной проверки?
Среднее или ожидаемое значение некоторой случайной величины представляет собой интеграл Лебега, определенный по некоторой вероятностной мере : P E X = ∫ X d P
Отсутствие среднего значения случайной величины Коши просто означает, что интеграл Коши rv не существует. Это связано с тем, что хвосты распределения Коши являются тяжелыми хвостами (сравните с хвостами нормального распределения). Однако отсутствие ожидаемого значения не запрещает существование других функций случайной величины Коши.
Вот больше визуального объяснения. (Для тех из нас, кто бросает вызов математике.). Возьмите генератор случайных чисел с распределением Коши и попробуйте усреднить полученные значения. Вот хорошая страница о функции для этого. https://math.stackexchange.com/questions/484395/how-to-generate-a-cauchy-random-variable Вы обнаружите, что «остроконечность» случайных значений приводит к тому, что оно становится больше, чем вы, а не меньше , Следовательно, это не имеет никакого значения.
Просто чтобы добавить к отличным ответам, я сделаю несколько комментариев о том, почему не сходимость интеграла важна для статистической практики. Как уже упоминали другие, если мы допустили, чтобы основным значением было «среднее», то slln больше не действительны! Помимо этого, подумайте о последствиях того факта, что на практике все модели являются приближенными. В частности, распределение Коши является моделью для неограниченной случайной величины. На практике случайные переменные ограничены, но границы часто являются неопределенными и неопределенными. Использование неограниченных моделей является способом облегчения этого, что делает ненужным введение неуверенных (и часто неестественных) границ в модели. Но для того, чтобы это имело смысл, важные аспекты проблемы не должны затрагиваться. Это означает, что если бы мы вводили границы, это не должно существенно изменить модель. Но когда интеграл не сходится, этого не происходит! Модель нестабильна в том смысле, что ожидание RV будет зависеть от в основном произвольных границ. (В приложениях не обязательно есть причина делать границы симметричными!)
По этой причине лучше сказать, что интеграл расходится, чем сказать, что он «бесконечен», причем последний близок к тому, чтобы подразумевать какое-то определенное значение, когда его не существует! Более подробное обсуждение здесь .
Я хотел быть немного придирчивым на секунду. Изображение вверху неверно. Ось X находится в стандартных отклонениях, чего не существует для распределения Коши. Я привередлив, потому что я использую распределение Коши каждый день своей работы. Существует практический случай, когда путаница может вызвать эмпирическую ошибку. T-распределение студента с 1 степенью свободы является стандартным Коши. Обычно в нем указываются различные сигмы, необходимые для значимости. Эти сигмы НЕ являются стандартными отклонениями, они являются вероятными ошибками и являются модой.
Если вы хотите правильно выполнить приведенную выше графику, либо ось X является необработанными данными, либо если вы хотите, чтобы они имели ошибки эквивалентного размера, вы бы дали им равные вероятные ошибки. Одна вероятная ошибка - 0,67 стандартных отклонений в размерах при нормальном распределении. В обоих случаях это полу-межквартильный размах.
Теперь, что касается ответа на ваш вопрос, все, что все написали выше, является правильным, и это математическая причина для этого. Тем не менее, я подозреваю, что вы - студент и новичок в этой теме, и поэтому нелогичные математические решения визуально очевидного могут не показаться правдой.
У меня есть два почти идентичных образца реального мира, взятых из распределения Коши, оба имеют одинаковый режим и одну и ту же вероятную ошибку. Один имеет среднее значение 1,27, а средний - 1,33. У одного со средним значением 1,27 стандартное отклонение составляет 400, у среднего со значением 1,33 стандартное отклонение составляет 5,15. Вероятная ошибка для обоих составляет 0,32, а для режима - 1. Это означает, что для симметричных данных среднее значение не находится в центральных 50%. Требуется ОДНО дополнительное наблюдение, чтобы вытолкнуть среднее значение и / или дисперсию за пределы значимости для любого теста. Причина в том, что среднее значение и дисперсия не являются параметрами, а среднее значение выборки и дисперсия выборки сами по себе являются случайными числами.
Самый простой ответ заключается в том, что параметры распределения Коши не включают в себя среднее и, следовательно, не имеют дисперсии относительно среднего.
Вполне вероятно, что в вашей прошлой педагогике значение среднего значения заключалось в том, что оно обычно является достаточной статистикой. В долгосрочной статистике, основанной на частотах, распределение Коши не имеет достаточной статистики. Это правда, что медиана выборки для распределения Коши с поддержкой по всем реалам является достаточной статистикой, но это потому, что она наследует ее от статистики порядка. Этого достаточно по совпадению, без простого способа думать об этом. Теперь в байесовской статистике имеется достаточная статистика для параметров распределения Коши, и если вы используете униформу до этого, то она также несмещена. Я говорю об этом, потому что, если вам приходится использовать их ежедневно, вы узнали обо всех возможных способах их оценки.
Нет действительной статистики по порядку, которую можно использовать в качестве оценщиков для усеченных распределений Коши, с которыми вы, вероятно, столкнетесь в реальном мире, и поэтому для большинства, но не во всех реальных приложениях, не существует достаточной статистики в частотных методах. ,
Что я предлагаю, так это мысленно отойти от подлости как от чего-то реального. Это инструмент, похожий на молоток, который в целом полезен и обычно может использоваться. Иногда этот инструмент не работает.
Математическая заметка о нормальном и распределении Коши. Когда данные получены в виде временного ряда, то нормальное распределение происходит только тогда, когда ошибки сходятся к нулю, когда t стремится к бесконечности. Когда данные получены в виде временного ряда, распределение Коши происходит, когда ошибки расходятся в бесконечность. Один из-за сходящегося ряда, другой из-за расходящегося ряда. Распределения Коши никогда не достигают определенной точки на пределе, они перемещаются назад и вперед через фиксированную точку, так что пятьдесят процентов времени они находятся на одной стороне и пятьдесят процентов времени на другой. Срединного реверсии нет.
Проще говоря, область под кривой приближается к бесконечности при уменьшении масштаба. Если вы выбрали конечный регион, вы можете найти среднее значение для этого региона. Однако для бесконечности нет смысла.