Вдохновленный выступлением Питера Доннелли на TED , в котором он обсуждает, сколько времени потребуется, чтобы определенный шаблон появился в серии бросков монет, я создал следующий сценарий на языке R. Учитывая два шаблона: «hth» и «htt», он вычисляет, сколько времени в среднем (то есть сколько монет бросит), прежде чем вы нажмете одну из этих моделей.
coin <- c('h','t')
hit <- function(seq) {
miss <- TRUE
fail <- 3
trp <- sample(coin,3,replace=T)
while (miss) {
if (all(seq == trp)) {
miss <- FALSE
}
else {
trp <- c(trp[2],trp[3],sample(coin,1,T))
fail <- fail + 1
}
}
return(fail)
}
n <- 5000
trials <- data.frame("hth"=rep(NA,n),"htt"=rep(NA,n))
hth <- c('h','t','h')
htt <- c('h','t','t')
set.seed(4321)
for (i in 1:n) {
trials[i,] <- c(hit(hth),hit(htt))
}
summary(trials)
Сводная статистика выглядит следующим образом,
hth htt
Min. : 3.00 Min. : 3.000
1st Qu.: 4.00 1st Qu.: 5.000
Median : 8.00 Median : 7.000
Mean :10.08 Mean : 8.014
3rd Qu.:13.00 3rd Qu.:10.000
Max. :70.00 Max. :42.000
В разговоре объясняется, что среднее количество подбрасываний монет будет различным для двух моделей; как видно из моей симуляции. Несмотря на то, что я смотрел разговор несколько раз, я до сих пор не понимаю, почему это так. Я понимаю, что «hth» перекрывает себя, и интуитивно я думаю, что вы нажмете «hth» раньше, чем «htt», но это не так. Я был бы очень признателен, если бы кто-то мог мне это объяснить.