У вас есть дискретизированная версия отрицательного лог-дистрибутива, то есть дистрибутива, чья поддержка и pdf которого f ( t ) = - log t .[0,1]f(t)=−logt
Чтобы увидеть это, я собираюсь переопределить вашу случайную переменную, чтобы принимать значения в наборе вместо { 0 , 1 , 2 , … , N } и вызывать в результате чего распределение T . Тогда я утверждаю, что{0,1/N,2/N,…,1}{0,1,2,…,N}T
Pr(T=tN)→−1Nlog(tN)
при а tN,t→∞ поддерживается (приблизительно) постоянным. tN
Сначала небольшой эксперимент по моделированию, демонстрирующий эту конвергенцию. Вот небольшая реализация сэмплера из вашего дистрибутива:
t_sample <- function(N, size) {
bounds <- sample(1:N, size=size, replace=TRUE)
samples <- sapply(bounds, function(t) {sample(1:t, size=1)})
samples / N
}
Вот гистограмма большой выборки из вашего дистрибутива:
ss <- t_sample(100, 200000)
hist(ss, freq=FALSE, breaks=50)
и вот наложенный логарифмический PDF:
linsp <- 1:100 / 100
lines(linsp, -log(linsp))
Чтобы понять, почему происходит это сближение, начните с выражения
Pr(T=tN)=1N∑j=tN1j
и умножить и разделить на N
Pr(T=tN)=1N∑j=tNNj1N
g(x)=1xtN1N
Pr(T=tN)≈1N∫1tN1xdx=−1Nlog(tN)
К какому выражению я хотел прийти.