Проблема, упомянутая в этом вопросе, исправлена в версии 1.7.3 пакета R glmnet.
У меня возникли некоторые проблемы при запуске glmnet с family = multinomial, и мне было интересно, что я столкнулся с чем-то похожим или, возможно, смог сказать мне, что я делаю неправильно.
Когда я вставляю свои собственные фиктивные данные, при запуске появляется сообщение об ошибке «Ошибка в применении (nz, 1, медиана): dim (X) должна иметь положительную длину») cv.glmnet
, что, помимо сообщения «это не сработало» не был очень информативным для меня.
y=rep(1:3,20) #=> 60 element vector
set.seed(1011)
x=matrix(y+rnorm(20*3*10,sd=0.4),nrow=60) # 60*10 element matrix
glm = glmnet(x,y,family="multinomial") #=> returns without error
crossval = cv.glmnet(x,y,family="multinomial") #=> Error in apply(nz, 1, median) : dim(X) must have a positive length
crossval = cv.glmnet(x,y,family="multinomial",type.measure="class") #=> Error in apply(nz, 1, median) : dim(X) must have a positive length
crossval = cv.glmnet(x,y,family="multinomial",type.measure="mae") #=> Error in apply(nz, 1, median) : dim(X) must have a positive length
cvglm = cv.glmnet(x,y,family="multinomial",lambda=2) #=> Error in apply(nz, 1, median) : dim(X) must have a positive length
Вот визуальное описание проблемы, которую я пытался заставить glmnet решить, если это поможет:
my_colours = c('red','green','blue')
plot(x[,1],x[,2],col=my_colours[y])
Я могу запустить пример кода из документации пакета, что заставляет меня подозревать, что я что-то неправильно понимаю или что есть ошибка в glmnet.
library(glmnet)
set.seed(10101)
n=1000;p=30
x=matrix(rnorm(n*p),n,p) #=> 1000*30 element matrix
beta3=matrix(rnorm(30),10,3)
beta3=rbind(beta3,matrix(0,p-10,3))
f3=x%*% beta3
p3=exp(f3)
p3=p3/apply(p3,1,sum)
g3=rmult(p3) #=> 1000 element vector
set.seed(10101)
cvfit=cv.glmnet(x,g3,family="multinomial")
Это использует R версии 2.13.1 (2011-07-08) и glmnet 1.7.1, хотя я могу создать ту же проблему на R 2.14.1. Есть идеи, люди?