Мне нужно нарисовать сложную графику для визуального анализа данных. У меня есть 2 переменные и большое количество случаев (> 1000). Например (число равно 100, если дисперсия меньше "нормальной"):
x <- rnorm(100,mean=95,sd=50)
y <- rnorm(100,mean=35,sd=20)
d <- data.frame(x=x,y=y)
1) Мне нужно построить исходные данные с размером точки, соответствующей относительной частоте совпадений, поэтому plot(x,y)
это не вариант - мне нужны размеры точек. Что нужно сделать для этого?
2) На том же графике мне нужно построить эллипс с доверительным интервалом 95% и линию, представляющую изменение корреляции (не знаю, как правильно назвать ее) - что-то вроде этого:
library(corrgram)
corrgram(d, order=TRUE, lower.panel=panel.ellipse, upper.panel=panel.pts)
но с обоими графиками на одном участке.
3) Наконец, мне нужно нарисовать результирующую модель линейной регрессии поверх всего этого:
r<-lm(y~x, data=d)
abline(r,col=2,lwd=2)
но с диапазоном ошибок ... как на QQ-plot:
но для ошибок подгонки, если это возможно.
Итак, вопрос:
Как добиться всего этого на одном графике?