Возможный диапазон


10

Предположим, есть три временных ряда, X1 , X2 и Y

Запуск обычной линейной регрессии на Y ~ X1 ( Y=bX1+b0+ϵ ), получаем R2=U . Обычная линейная регрессия Y ~ X2 Get R2=V . Предположим, U<V

Каковы минимальные и максимальные возможные значения R2 для регрессии Y ~ X1+X2 ( Y=b1X1+b2X2+b0+ϵ )?

Я считаю, что минимальное значение R2 должно быть V + небольшое значение, поскольку добавление новых переменных всегда увеличивает R2 , но я не знаю, как количественно определить это небольшое значение, и я не знаю, как получить максимальный диапазон.

Ответы:


9

1) EDIT: комментарий Кардинал ниже показывает , что правильный ответ на минимальное вопроса V . Поэтому я удаляю свой «интересный», но в конечном итоге неправильный ответ на эту часть сообщения ОП.R2V

2) Максимальное значение равно 1. Рассмотрим следующий пример, который соответствует вашему случаю.R2

x1 <- rnorm(100)
x2 <- rnorm(100)
y <- x1 + 2*x2

> summary(lm(y~x1))$r.squared
[1] 0.2378023                 # This is U
> summary(lm(y~x2))$r.squared
[1] 0.7917808                 # This is V; U < V
> summary(lm(y~x1+x2))$r.squared
[1] 1

Здесь мы фиксируем дисперсию в 0. Если вы хотите, чтобы σ 2 ϵ > 0 , то все немного меняется. Вы можете получить R 2 произвольно близко к 1, сделав σ 2 ϵ все меньше и меньше, но, как и в случае с минимальной проблемой, вы не можете туда добраться, поэтому максимума нет. 1 становится супремумом , поскольку он всегда больше, чем R 2, но это также предел при σ 2 ϵ0 .ϵσϵ2>0R2σϵ2R2σϵ20


2
(+1) Некоторые комментарии: это хороший ответ; это интересно , что вы сделали асимптотический подход , тогда не ясно , была ли заинтересовано ОП в том или, возможно, с фиксированным один (или оба). Этот ответ является немного несовместимым с ограничением ОП о том , что U < V , хотя, и если X 1 = 0 или Х 1 = 1 для некоторого а R , например, то минимальная R 2 для всех фиксированных размеров выборки является точно V : = V ( n )nU<VX1=0X1=a1aRR2V:=V(n), (Извините за патологию этих примеров.) Кроме того, OLS не обязательно согласован в отсутствие дополнительных ограничений на предикторы. :)
кардинал

@cardinal - при перечитывании я не могу понять, почему я выбрал такой подход к проблеме min, когда теперь выглядит как очевидно правильный ответ, и, как вы неявно заметили, я мог бы построить пример, который достигает этого в вена максимальной части ... о, хорошо, возможно мой эспрессо этим утром был случайно без кофеина. (Может быть, я должен рассмотреть свои ответы более тщательно, прежде чем V
писать

Я не думаю , что вы должны удалить то , что вы написали, что я сделал найти интересный подход к ответу на вопрос! Хотя патологии, которые я упоминаю, безусловно, допускают минимальное значение , можно задаться вопросом, что на самом деле означает X 1 = 0 . Другой пример, возможно, не настолько патологичен, поскольку в общем варианте этой проблемы он распространяется на случай, когда любой дополнительный X i находится в пространстве столбцов других предикторов. :)R2X1=0Xi
кардинал

1
@cardinal - спасибо! Я реконструирую его, может быть, немного более формально, и через некоторое время верну обратно на дно.
Jbowman

5

r1,2X1X2r1,YX1Yr2,YX2YR2V

(1(1r1,22))(12r1,2r1,Yr2,Y+UV).

R2Vr1,2=0r1,Y2=U=0

r1,22=2r1,2r1,Yr2,YUV.

r1,2=0R2U+V


(+1) Милый. Добро пожаловать на сайт. Пожалуйста, рассмотрите вопрос о регистрации вашей учетной записи, чтобы вы могли участвовать более полно. Я должен буду взглянуть на это выражение чуть позже. :)
кардинал

4

UVVmin(V+U,1)R2U+V1

U<VX1X2U=0X1Ymin=max=V+0X1X2min(V+U,1)

X1X2


1
X1X2R21LATEX

LATEX
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.