Почему квадрат


12

Это может быть основной вопрос, но мне было интересно, почему значение в регрессионной модели может быть просто возведено в квадрат, чтобы дать цифру объясненной дисперсии?R

Я понимаю, что коэффициент может дать силу отношения, но я не понимаю, как просто возводить в квадрат это значение дает меру объясненной дисперсии.R

Любое простое объяснение этого?

Большое спасибо за помощь с этим!


Вы ищете что-то интуитивное или более математическое? Вы просматривали некоторые другие вопросы о и коэффициентах корреляции на этом сайте? R2
кардинал

1
Два связанных вопроса здесь и здесь , например. Если вы поиграете с уравнениями там, вы сможете получить математическую эквивалентность. Но ни один из них, вероятно, не будет особенно полезен с точки зрения интуиции.
кардинал

Я вижу это наоборот. Это R квадрат, который определяется как 1-остаточная дисперсия / общая дисперсия, и тогда R является положительным квадратным корнем этого. Просто так получается, что при простой линейной регрессии R квадрат уменьшается до квадрата коэффициента корреляции.
Майкл Р. Черник

@ Майкл, вы, несомненно, намеревались сказать квадратный корень с правильной подписью, а не положительный .
кардинал

1
@cardinal, у меня такое же впечатление - (или r ) относится к коэффициенту корреляции выборки и был бы удивлен, увидев широко используемую ссылку, которая использует его для обозначения абсолютного значения корреляции выборкиRr
Макро

Ответы:


15

Ручной wavingly, соотношение можно рассматривать как меру угла между двумя векторами, зависимым вектором Y и независимым вектором X . Если угол между векторами равен θ , корреляция R равна cos ( θ ) . Часть Y, которая объясняется X, имеет длину | | Y | | cos ( θ ) и параллельно X (или проекции Y на X ). Часть, которая не объяснена, имеет длинуRYXθRcos(θ)YX||Y||cos(θ)XYX и ортогональна X . В терминах дисперсий мы имеем σ 2 Y = σ 2 Y cos 2 ( θ ) + σ 2 Y sin 2 ( θ ), где первый член справа является объясненной дисперсией, а второй - необъяснимой дисперсией. Фракциякоторая объясняется, таким образом , R 2 ,не R .||Y||sin(θ)X

σY2=σY2cos2(θ)+σY2sin2(θ)
R2R

2
(+1) Здесь на самом деле не слишком много рукопожатий. Геометрическая точка зрения является , на мой взгляд, наиболее интуитивной. Вероятно, существует качественная фигура с открытым исходным кодом, которая изображает вещи именно таким образом.
кардинал

cor(y,y^)2R2

1
Это не отвечает на вопрос, но показывает, как квадрат R упоминается как квадрат коэффициента корреляции без какой-либо ссылки на R. Таким образом, источники, подтверждающие или опровергающие мое утверждение, могут быть трудно найти. Это из статьи о коэффициенте детерминации в Википедии:
Майкл Р. Черник

Как квадратный коэффициент корреляции Аналогично, после регрессии по методу наименьших квадратов с помощью константы + линейная модель (т. Е. Простая линейная регрессия) R2 равен квадрату коэффициента корреляции между наблюдаемыми и смоделированными (прогнозируемыми) значениями данных.
Майкл Р. Черник

В общих условиях значение R2 иногда рассчитывается как квадрат коэффициента корреляции между исходными и смоделированными значениями данных. В этом случае значение не является прямой мерой того, насколько хороши смоделированные значения, а скорее мерой того, насколько хорошо можно построить предиктор из смоделированных значений (путем создания пересмотренного предиктора в форме α + βƒi). Согласно Everitt (2002, стр. 78), это использование является определением термина «коэффициент детерминации»: квадрат корреляции между двумя (общими) переменными.
Майкл Р. Черник
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.