«Предсказание» и «оценка» действительно иногда взаимозаменяемо используются в нетехнических письмах, и они, похоже, функционируют аналогично, но между ними есть четкое различие в стандартной модели статистической проблемы. An оценили данные используют угадать параметр в то время как предиктор использует данные угадать в каком - то случайном значении , которое не является частью набора данных. Для тех, кто не знает, что означает «параметр» и «случайное значение» в статистике, ниже приводится подробное объяснение.
В этой стандартной модели предполагается, что данные составляют (возможно, многомерное) наблюдение случайной величины , распределение которой, как известно, находится только в пределах определенного набора возможных распределений, «состояний природы». Оценка представляет собой математическую процедуру , которая присваивает каждому возможному значению некоторой собственности состояния природы , такие как его средних . Таким образом , оценка - это предположение об истинном состоянии природы. Мы можем сказать, насколько хороша оценка, сравнивая с . X t x t ( x ) θ μ ( θ ) t ( x ) μ ( θ )xX txt(x)θμ(θ)t(x)μ(θ)
Предиктор относится к независимому наблюдению другого случайной величины , распределение которой имеет отношение к истинному состоянию природы. Прогноз - это предположение о другом случайном значении. Мы можем сказать , насколько хорошо конкретный прогноз только путем сравнения до значения , реализуемого . Мы надеемся, что в среднем соглашение будет хорошим (в смысле усреднения по всем возможным результатам и одновременно по всем возможным значениям ).Z p ( x ) Z x Zp(x)Zp(x)Zx Z
Обычные наименьшие квадраты дают стандартный пример. Данные состоят из пар связывающих значения зависимой переменной со значениями независимой переменной. Состояние природы определяется тремя параметрами , и : в нем говорится, что каждый подобен независимому отрисовке из нормального распределения со средним значением и стандартным отклонением . , и - это параметры (числа), которые считаются фиксированными и неизменными. Интерес сосредоточен нау я х я & alpha ; & beta ; сг у я & alpha ; + & beta ; х я сг & alpha ; & beta ; сг & alpha ; & beta ; ( & alpha ; , & beta ; ) & alpha ; & alpha ; & beta ; & beta ; & alpha ; & beta ;(xi,yi)yixiαβσyiα+βxiσαβσα (перехват) и (наклон). МНК оценки, написанный , хорошо в том смысле , что стремится быть ближе к и , как правило, близко к , независимо от того, какими могут быть истинные (но неизвестные) значения и .β(α^,β^)α^αβ^βαβ
Прогноз OLS состоит из наблюдения нового значения зависимой переменной, связанной с некоторым значением независимой переменной. может или не может быть среди в наборе данных; это несущественно. Одно интуитивно хорошее предсказание заключается в том, что это новое значение, вероятно, будет близко к . Лучшие прогнозы говорят, насколько близко может быть новое значение (они называются интервалами прогнозирования ). Они объясняют тот факт, что и являются неопределенными (потому что они математически зависят от случайных значенийх х х я & alpha ; + & beta ; х & alpha ; & beta ; ( у я ) сг У ( х ) сг & alpha ; + & beta ; хZ=Y(x)xxxiα^+β^xα^β^(yi) ), что точно не известно (и поэтому должно быть оценено), а также предположение, что имеет нормальное распределение со стандартным отклонением и средним значением ( обратите внимание на отсутствие каких-либо шляп!).σY(x)σα+βx
Особо отметим, что этот прогноз имеет два отдельных источника неопределенности: неопределенность в данных приводит к неопределенности в оценочном наклоне, пересечении и остаточном стандартном отклонении ( ); Кроме того, существует неопределенность в отношении того, какое значение будет иметь место. Эта дополнительная неопределенность - поскольку является случайной - характеризует предсказания. Прогноз может выглядеть как оценка (в конце концов, оценки :-) и может даже иметь ту же математическую формулу ( иногда может совпадать с(xi,yi)σY(x)Y(x)α^+β^x α+βxp(x)t(x)), но это будет сопровождаться большей неопределенностью, чем оценка.
Здесь, тогда, в примере OLS, мы ясно видим различие: оценка угадывает параметры (которые являются фиксированными, но неизвестными числами), в то время как предсказание угадывает значение случайной величины. Источником потенциальной путаницы является то, что прогноз обычно основывается на оценочных параметрах и может даже иметь ту же формулу, что и оценщик.
На практике вы можете отличить оценки от предикторов двумя способами:
цель : оценщик стремится узнать свойство истинного состояния природы, а прогноз - угадать результат случайной величины; а также
неопределенность : предсказатель обычно имеет большую неопределенность, чем связанная оценка, из-за дополнительной неопределенности в результате этой случайной переменной. Поэтому хорошо документированные и описанные предикторы обычно имеют полосы неопределенности - интервалы прогнозирования - которые шире полос неопределенности оценок, известных как доверительные интервалы. Характерной особенностью интервалов прогнозирования является то, что они могут (гипотетически) сокращаться по мере роста набора данных, но они не будут уменьшаться до нулевой ширины - неопределенность в случайном результате является «несводимой», тогда как ширина доверительных интервалов будет иметь тенденцию к уменьшению уменьшить до нуля, что соответствует нашей интуиции, что точность оценки может стать сколь угодно хорошей с достаточным количеством данных.
При применении этого для оценки потенциальной потери инвестиций, рассмотрим сначала цель: вы хотите знать , сколько вы могли бы на самом деле потерять на этой инвестиции (или этой конкретной корзины инвестиций) в течение определенного периода, или вы действительно просто угадать , что это ожидаемая потеря (возможно, из-за большого количества инвестиций)? Первый - это прогноз, второй - оценка. Тогда рассмотрите неопределенность. Как изменится ваш ответ, если у вас будет почти бесконечное количество ресурсов для сбора данных и анализа? Если это станет очень точным, вы, вероятно, оцените ожидаемую отдачу от инвестиций, в то время как если вы не уверены в своем ответе, вы делаете прогноз.
Таким образом, если вы все еще не уверены, с каким животным вы имеете дело, спросите об этом своего оценщика / предиктора: насколько он ошибочен и почему? С помощью обоих критериев (1) и (2) вы будете знать, что у вас есть.