Иногда нам приходится использовать циклы, например, когда мы не знаем, сколько итераций нам нужно, чтобы получить результат. Взять хотя бы циклы в качестве примера. Ниже приведены методы, которые вы должны избегать:
a=numeric(0)
b=1
system.time(
{
while(b<=1e5){
b=b+1
a<-c(a,pi)
}
}
)
# user system elapsed
# 13.2 0.0 13.2
a=numeric(0)
b=1
system.time(
{
while(b<=1e5){
b=b+1
a<-append(a,pi)
}
}
)
# user system elapsed
# 11.06 5.72 16.84
Они очень неэффективны, потому что R копирует вектор каждый раз, когда он добавляет.
Самый эффективный способ добавить это использовать индекс. Обратите внимание, что на этот раз я позволил ему повторить 1e7 раз, но это все еще намного быстрее, чем c
.
a=numeric(0)
system.time(
{
while(length(a)<1e7){
a[length(a)+1]=pi
}
}
)
# user system elapsed
# 5.71 0.39 6.12
Это приемлемо И мы можем сделать это немного быстрее, заменив [
на [[
.
a=numeric(0)
system.time(
{
while(length(a)<1e7){
a[[length(a)+1]]=pi
}
}
)
# user system elapsed
# 5.29 0.38 5.69
Может быть, вы уже заметили, что это length
может занять много времени. Если мы заменим length
на счетчик:
a=numeric(0)
b=1
system.time(
{
while(b<=1e7){
a[[b]]=pi
b=b+1
}
}
)
# user system elapsed
# 3.35 0.41 3.76
Как упоминали другие пользователи, предварительное выделение вектора очень полезно. Но это компромисс между скоростью и использованием памяти, если вы не знаете, сколько циклов нужно для получения результата.
a=rep(NaN,2*1e7)
b=1
system.time(
{
while(b<=1e7){
a[[b]]=pi
b=b+1
}
a=a[!is.na(a)]
}
)
# user system elapsed
# 1.57 0.06 1.63
Промежуточный метод заключается в постепенном добавлении блоков результатов.
a=numeric(0)
b=0
step_count=0
step=1e6
system.time(
{
repeat{
a_step=rep(NaN,step)
for(i in seq_len(step)){
b=b+1
a_step[[i]]=pi
if(b>=1e7){
a_step=a_step[1:i]
break
}
}
a[(step_count*step+1):b]=a_step
if(b>=1e7) break
step_count=step_count+1
}
}
)
#user system elapsed
#1.71 0.17 1.89
vector = values
; или вы можете сделать вектор = вектор + значения. Но я мог бы неправильно понять ваш вариант использования