Я сравнивал sample
функцию в R и сравнивал ее с, igraph:sample_seq
и столкнулся со странным результатом.
Когда я запускаю что-то вроде:
library(microbenchmark)
library(igraph)
set.seed(1234)
N <- 55^4
M <- 500
(mbm <- microbenchmark(v1 = {sample(N,M)},
v2 = {igraph::sample_seq(1,N,M)}, times=50))
Я получаю такой результат:
Unit: microseconds
expr min lq mean median uq max neval
v1 21551.475 22655.996 26966.22166 23748.2555 28340.974 47566.237 50
v2 32.873 37.952 82.85238 81.7675 96.141 358.277 50
Но когда я бегу, например,
set.seed(1234)
N <- 100^4
M <- 500
(mbm <- microbenchmark(v1 = {sample(N,M)},
v2 = {igraph::sample_seq(1,N,M)}, times=50))
Я получаю гораздо более быстрый результат для sample
:
Unit: microseconds
expr min lq mean median uq max neval
v1 52.165 55.636 64.70412 58.2395 78.636 88.120 50
v2 39.174 43.504 62.09600 53.5715 73.253 176.419 50
Кажется, что, когда N
степень 10 (или какое-то другое специальное число?), sample
Намного быстрее, чем другие меньшие N
, которые не являются степенями 10. Это ожидаемое поведение или я что-то упустил?