Если вы использовали возврат журналов, вы допустили небольшую ошибку смещения, но если вы использовали будущее значение, деленное на текущее значение, то ваша вероятность неверна. На самом деле, ваша вероятность неверна в любом случае. Это достаточно неправильно, чтобы иметь значение.
Учтите, что статистика - это любая функция данных. Возвращает не данные, а преобразования данных. Это будущая стоимость, деленная на текущую стоимость. Цены являются данными. Цены должны иметь функцию распределения, но функция распределения для возвратов должна зависеть исключительно от характера цен.
пTпт + 1
пт + 1пT- 1
1πσσ2+ ( у- β1Икс1- β2Икс2⋯ - βNИксN- а )2,
OLS обеспечивает наилучшее соответствие наблюдаемым данным, даже если это неправильное решение. Байесовские методы пытаются найти функцию генерирования данных по вероятности. Вы ошиблись вероятностью, поэтому не смогли ее найти.
У меня есть бумага по этому вопросу, если вам нужна дополнительная информация.
РЕДАКТИРОВАТЬ
Я думаю, что вы не поняли. Если вы преобразуете вероятность в функцию плотности и возьмете ожидание, вы обнаружите, что оно не имеет ничего. Доказательством Августина Коши в 1852 или, может быть, 1851 года, любая форма решения методом наименьших квадратов является совершенно неточной. Это всегда будет неудачей. Дело не в том, что вы должны использовать стандартную регрессию, потому что байесовский метод чувствителен к вероятности, а в том, что байесовский метод является единственным доступным решением, которое допустимо, за некоторыми исключениями для некоторых необычных особых случаев.
Выполняя эмпирическое тестирование по этому вопросу, и до того, как я прочитал достаточно математики, я наивно думал, что байесовское и частотное решения должны совпадать. Примерно существует теорема, которая гласит, что по мере того, как выборка становится достаточно большой, они будут сходиться. Я использовал все сделки на конец дня во вселенной CRSP с 1925 по 2013 годы, чтобы проверить это. Это не то, что говорится в теореме. Я неправильно понял правила.
Я также пробовал проблему в журналах, и она все еще не совпадает. Итак, я что-то понял, все распределения являются формами, и поэтому я построил геометрическое решение, чтобы определить, какое решение было правильным. Я рассматривал это как чисто геометрическую задачу, чтобы определить, какой алгебраический ответ соответствует данным.
Байесовский совпадает. Это привело меня к очень математическому пути, потому что я не мог понять, почему непредвзятая оценка была настолько неправильной. Для справки: используя дезагрегированные доходы за период 1925-2013 гг. И исключив подставные компании, закрытые фонды и т. Д., Расхождение между центром размещения составляет 2%, а показатель риска занижен на 4% для годовых доходов. , Это несоответствие имеет место при преобразовании журнала, но по другой причине. Может быть различным для отдельных индексов или подмножеств данных.
Причина расхождения двоякая. Во-первых, в распределениях отсутствует достаточная статистика. Для определенных типов проблем это не имеет значения. Однако для проективных целей, таких как прогнозирование или распределение, они имеют большое значение. Вторая причина заключается в том, что непредвзятая оценка всегда является версией среднего значения, но распределение не имеет значения.
Приведенная выше плотность не является членом экспоненциального семейства, как нормальное или гамма-распределение. По теореме Питмана – Купмана – Дармуа для параметров не существует достаточной точечной статистики. Это подразумевает, что любая попытка создать точечную оценку должна отбрасывать информацию. Это не проблема для байесовских решений, потому что апостериор представляет собой целую плотность, и если вам нужна точная оценка, вы можете найти прогнозную плотность и минимизировать функцию стоимости над ней, чтобы уменьшить ее до единой точки. Байесовская вероятность всегда минимально достаточна.
Минимальная дисперсия несмещенной оценки для вышеупомянутой функции должна сохранять центральные 24,6% данных, находить их усеченное среднее и отбрасывать оставшиеся данные. Это означает, что более 75% данных удаляются, а информация теряется. Просто примечание, это может быть 24,8%, так как я работаю по памяти. Вы можете найти статью Ротенберга по адресу:
Ротенберг, TJ и FM Фишер, и CB Tilanus, записка об оценке по выборке Коши, журнал Американской статистической ассоциации, 1964, том 59 (306), с. 460-463
Второй выпуск меня удивил. Пока я не проработал геометрию, я не понимал, в чем причина. Возврат привязан снизу на уровне -100%. Это смещает медиану на 2%, а межквартильный диапазон смещается на 4%, хотя полумасса остается в тех же точках. Полумаса - это правильная мера масштаба, а полуширина - нет. Если бы не было усечения, то полуширина и полумасса были бы в одинаковых точках. Точно так же медиана и мода останутся в одной точке. Медиана - это доход для среднего актера или, по крайней мере, средняя сделка. Таким образом, это всегда местоположение MVUE и среднее значение журнала.
Правильное понимание теоремы состоит в том, что все байесовские оценки являются допустимыми оценками. Оценки частых являются допустимыми оценками, если выполняется одно из двух условий. Первое состоит в том, что в каждом образце частотное и байесовское решения идентичны. Во-вторых, если предельное решение метода Байеса соответствует решению Frequentist, то решение Frequentist является допустимым.
Все допустимые оценки сходятся к одному решению, если размер выборки достаточно велик. Оценщик Frequentist предполагает, что его модель является истинной моделью, а данные случайными. Байесовский предполагает, что данные верны, но модель случайная. Если у вас было бесконечное количество данных, то субъективная модель должна сходиться к реальности. Если у вас было бесконечное количество данных, но неправильная модель, то модель Frequentist будет сходиться к реальности с вероятностью ноль.
В этом случае байесовское решение при разумных априорах всегда будет стохастически доминировать над любой оценщиком Frequentist из-за усечения и потери информации для создания оценщика.
В логах функция правдоподобия является гиперболическим секущим распределением. У него конечная дисперсия, но нет ковариации. Ковариационная матрица, найденная с использованием OLS, является артефактом данных и не указывает на параметр, который существует в базовых данных. Как и в необработанной форме, ничто в логарифмической форме не является коварией, но и ничто не является независимым. Вместо этого существуют гораздо более сложные отношения, которые нарушают определение ковариации, но в которых они могут сочетаться.
Марковиц и Усман почти нашли его в своей работе над распределениями, но гиперболическое распределение секущих не относится к семейству Пирсонов, и они неверно истолковали данные, не заметив, что при изменении распределения с необработанных данных на данные журнала вы также меняете его статистические свойства , Они в основном узнали это, но пропустили, потому что у них не было причин искать это, и они не осознавали непреднамеренных последствий использования журналов.
У меня нет Марковица и Усмана, где я нахожусь, но они проделали одну из немногих очень хороших работ по оценке распределения, которое там есть.
В любом случае я не использую JAGS. Я понятия не имею, как это сделать. Я кодирую всю свою работу MCMC вручную.
У меня есть более полная и точная статья по этой теме:
Harris, DE (2017) Распределение доходов. Журнал математических финансов, 7, 769-804.
Он предоставит вам метод построения распределений для любого актива или класса ответственности, а также учетные коэффициенты.
Я был многословен, но я мог видеть, что вы неправильно понимаете связь между методами Байеса и Пирсона-Неймана. Вы их перевернули. Байес всегда работает, но вы попали в ловушку с прежней плотностью, которая нарушит ваше решение. При надлежащем предварительном прогнозе вам гарантирована предвзятая оценка, и для этого типа функции правдоподобия я считаю, что вы должны использовать надлежащий предварительный расчет, чтобы гарантировать интегрируемость в единое целое. Частые методы быстры и обычно работают. Они беспристрастны, но могут быть недействительными.