Предсказание когда переменная ответа


7

Моя оценочная модель

ln^(yt)=9.8730.472ln(xt2)0.01xt3

Меня просят найти прогнозирующий КИ с доверительной вероятностью 95% для среднего значения , когда и . Мы предполагаем, что , где .y0x02=250x03=8s2x0(XTX)1x0T=0.000243952x0=(250,8)

У меня есть решение предыдущего года, которое выглядит так:

Я нахожу CI вида , где - верхний квантиль распределения для и . Это дает мне .CI(E[ln(y0)|x0])=[ln^(yt)tα/2sE,ln^(yt)+tα/2sE]tα/2t(nk)sE=0.000243952[7.1563,7.2175]

Тогда автор делает .CI(E[y0|x0])=[e7.1563,e7.2175]=[1282.158,1363.077]

Я не согласен с этим последним шагом (из-за неравенства Дженсена мы будем недооценивать). В «Введении в эконометрику» Вулдриджа на странице 212 он утверждает, что если мы уверены, что условия ошибок нормальные, то непротиворечивая оценка:

E^[y0|x0]=es2/2eln^(y0)

Итак, я думал о том, чтобы делать

CI(E[y0|x0])=[es2/21282.158,es2/21363.077]=[1282.314,1363.243]

Это правильно?

Кроме того, в решении этого упражнения указано, что , что далеко от любого решения, которое я получил.CI(E[y0|x0])=[624.020,663.519]

Любая помощь будет оценена.

PS: Я также читал, что коррекция не должна использоваться для CI, а только для оценки точкиE^[y0|x0]

Ответы:


3

Вы не найдете тот же ответ из-за того, что я подозреваю, что это опечатка, которая, таким образом, будет главной причиной вашей проблемы: для будет установлено значение , а не . Другая возможность, если оставить , это ошибка во втором оценочном коэффициенте, скажем, вместо .x03808x03=8β^2=0.10.01

В любом случае, одна из этих модификаций решает все проблемы и дает тот же результат, что и решение этого упражнения.

Учитывая это изменение, при можно получитьtα/2=1.96476138969835

Способ 1

CI(E[y0|x0])=[e6.43618291164626,e6.49755798189177]=[624.020307335178,663.519326788772] (данное решение этого упражнения)

или

Способ 2

(как указано в «Введении Эконометрики Вулдриджа» на стр. 212), если мы уверены, что условия ошибок нормальны (и одному из них чрезвычайно повезло)

CI(E[y0|x0])=[es2/2624.0203,es2/2663.5193]=[624.0960,663.6002]

Однако

метод 2 очень вряд ли будет правильным, так как вы уже в вашем вопросе [...] (занижение) коррекция не должна использоваться для CI , но только для оценки точки.

Почему ? Я бы сказал, что из-за зависимости между двумя терминами, знание ожиданий с одной стороны и с другой стороны не означает, что кто-то знает .es2/2y0^es22+ln(y0)^


2

Точечный прогноз и КИ разные.

Для точного прогнозирования нам лучше исправлять предвзятость, насколько это возможно. Для CI с самого начала требуется, чтобы вероятность составляла . Например, когда является 95% -ным доверительным интервалом для , , безусловно, является 95% -ным доверительным интервалом для потому что . Так что ваш , безусловно, является действительным CI.100(1α)%[a,b]ln(y0)[ea,eb]y0P(alnXb)=P(eaXeb)[e7.1563,e7.2175]

Но центр этого CI не является ни наивным предиктором (exp [предсказатель ]), ни исправленным предиктором (поправочный коэффициент, умноженный на наивный предиктор) из-за неравенства Дженсена, но это не имеет большого значения. В некоторых случаях (не всегда) вы можете изменить CI на для некоторых и так, чтобы вероятность оставалась 95%, а его центр был смещением. исправил предиктор, но я не вижу в этом смысла.lny0y0[eap,ebq]pq

То, что вы предложили, т. Е. , не является 95% -ным доверительным интервалом. Чтобы понять почему, пусть поправочный коэффициент равен (неслучайный и совершенно известный для простоты), поэтому предиктором с поправкой на смещение является , где - непредвзятый предиктор ( в вашем примере). Это « » может быть оценено, , но, хотя последнее является случайным, предполагается неслучайным, чтобы упростить его. Пусть будет 95% -ным доверительным интервалом для , т.[es2/2ea,es2/2eb]hheθθlny0β^0+β^2lnx2+β^3x3hes2/2h[a,b]lny0P(alny0b)=0.95, Тогда что не равно если распределение является равномерным, что обычно не является.

P(heay0heb)=P(lnh+alny0lnh+b),
P(alny0b)=0.95lny0

РЕДАКТИРОВАТЬ

Выше речь идет о CI , а не . Оригинальный вопрос о CI для . Пусть , что оценивается как . В этом случае, я думаю, что метод Дельта является полезным вариантом (см. Ответ Лучоначо).y0E(y|X=x0)E(y|X=x0)E(y|X=x0)=hexp(x0β)h^exp(x0β^)

Чтобы быть строгими, нам нужно совместное распределение и , или, если быть точным, асимптотическое распределение вектора . Затем предельное распределение получается с использованием метода Delta, а затем CI для можно построить.h^β^n[(β^β),h^h]n[h^exp(x0β^)hexp(x0β)]hexp(x0β)


Спасибо за ответ Чен. Кстати, в этом упражнении оценка точки для или равна. Полученная оценка находится вне CI для но внутри CI для . Разве они не должны быть внутри своего КИ? y0E(y|X0)E(y|X0)y0
Старик в море.

Да, это помогает Не могли бы вы проверить этот мой вопрос. Это связано с этим. economics.stackexchange.com/questions/16891/…
Старик в море.

В комментарии, которые я сделал и удалил, я допустил ошибку. конечно, отличается от как ответ Алекоса Пападопулоса на ваш вопрос гласит. Большое спасибо @Anoldmaninthesea, и извините за это. Возможно, я думал, что достаточно близок к , а это не то, что вы подняли. Хм, в таком случае ваше замечание еще интереснее. E(y|X=x0)exp{E(logy|X=x0)}exp(x0β^)exp(x0β)
chan1142

1
Я никогда не думал об этой проблеме. Я буду сейчас. Так что речь идет о CI для . Метод Дельта, объясненный luchonacho, выглядит полезным в этом случае. Спасибо @Anoldmaninthesea за то, что подняли его. E(y|X=x0)
chan1142

Чен, я связал еще один мой вопрос с этим. Там вы найдете ответ, который я написал, который может показаться вам интересным.
Старик в море.

1

Используйте Дельта-метод . Скажем, в больших выборках асимптотическое распределение одного параметра :β

β^aN(β,Var(β^)n)

(при условии, что ваша оценка соответствует)

Кроме того, вас интересует функция , скажем, . Тогда аппроксимация Тейлора первого порядка из приведенного выше приводит к следующему асимптотическому распределению:β^F(β^)

F(β^)aN(F(β),(F(β^)β^)2Var(β^)n)

В вашем случае, - это . Отсюда вы можете построить CI как обычно.F(β^)eβ^

Источник и более подробная информация в связанном документе.


Лучо, я не могу использовать метод Delta для этого ... но все равно спасибо. ;)
Старик в море.

: o а почему бы и нет? Любое предположение я неправильно понял или не высказал?
Лучоначо

1
Дело не в этом. Мне действительно интересно знать, какой из методов правильный. Кроме того, ваш метод дает приблизительное распределение, тогда как в упражнении им нужен точный CI.
Старик в море.
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.