Не совсем ответ, а расширенный комментарий к ответу Андраса.
Ответ Андраса содержит приятную интуицию, хотя я не верю, что это строгий расчет ожидаемого количества шагов. Я думаю, что это, возможно, хорошее приближение к ответу, но, похоже, оно не имеет должного отношения к случаям, когда корзина ниже самой высокой занятой корзины становится пустой до того, как верхняя корзина опустошается вниз. Тем не менее, это может быть разумным приближением (я не уверен).
Его расчет содержит ошибку, которая влияет на масштабирование. Я собираюсь взять точно такую же отправную точку, и повторить и расширить расчет.
Он пропускает коэффициент p внутри суммирования, так как вероятность случайного выбора правильного бина равна а не1pn . В результате мы имеем1n
n + ∑р = 1NΣк = 0∞( к + 1 ) рN( п - пN)Кзнак равнознак равнознак равнознак равноn + ∑р = 1NпNΣк = 0∞( k + 1 ) ( n - pN)Кn + ∑р = 1NпN⋅ н2п2N+n∑п=1n1 /pn ( 1+Hn)
где - это n-е гармоническое число . Чтобы приблизить H n, мы можем просто заменить суммирование на интеграл: H n ≈ ∫ n + 1 1 1ЧАСN= ∑Nр = 11 / рЧАСN. Таким образом, масштабирование составляетn(1+log(n+1))или приблизительноnlog(n+1). Хотя это масштабирование не соответствует точно масштабированию задачи (см. Моделирование ниже), оно почти точно уменьшается вlog(2).ЧАСN≈ ∫n + 111Иксdх = лог( n + 1 )n(1+log(n+1))nlog(n+1)log(2)
Красные круги: Точки данных от моделирования процесса в среднем за 10 000 циклов. Зеленый: . Синий: n log ( n + 1 ) .nlog2(n+1)nlog(n+1)