В линейной регрессии мы часто получаем несколько R и R в квадрате. Каковы различия между ними?
В линейной регрессии мы часто получаем несколько R и R в квадрате. Каковы различия между ними?
Ответы:
Капитал (в отличие от r 2 ) обычно должен быть кратным R 2 в модели множественной регрессии. В двумерной линейной регрессии нет кратного R , и R 2 = r 2 . Таким образом, одним отличием является применимость: «множественный R » подразумевает множественные регрессоры, тогда как « R 2 » не обязательно.
Другое простое отличие - интерпретация. При множественной регрессии множественное является коэффициентом множественной корреляции , тогда как его квадрат является коэффициентом детерминации . R можно интерпретировать как коэффициент двумерной корреляции , главное отличие состоит в том, что множественная корреляция находится между зависимой переменной и линейной комбинацией предикторов, а не просто одним из них, а не только средним из этих двухфакторных корреляций. R 2 может быть интерпретирован как процент дисперсии в зависимой переменной, который может быть объяснен предикторами ; как и выше, это также верно, если существует только один предиктор.
Множество R на самом деле можно рассматривать как корреляцию между откликом и подобранными значениями. Как таковая, она всегда позитивна. Множественный R-квадрат - это его квадратная версия.
Позвольте мне проиллюстрировать на небольшом примере:
set.seed(32)
n <- 100
x1 <- runif(n)
x2 <- runif(n)
y <- 4 + x1 - 2*x2 + rnorm(n)
fit <- lm(y ~ x1 + x2)
summary(fit) # Multiple R-squared: 0.2347
(R <- cor(y, fitted(fit))) # 0.4845068
R^2 # 0.2347469
Нет необходимости поднимать шум вокруг «множества» или нет. Эта формула всегда применяется, даже в настройках Anova. В случае, когда существует только одна ковариабельная , тогда R со знаком наклона совпадает с корреляцией между X и откликом.
Я просто объясняю своим студентам, что:
кратное число R следует рассматривать как абсолютное значение коэффициента корреляции (или коэффициента корреляции без отрицательного знака)!
R-квадрат - это просто квадрат кратного R. Он может быть выражен в процентах от изменения, вызванного независимой переменной (переменными).
Таким образом, легко понять концепцию и разницу.