Это прекрасная проблема со сборщиком купонов, с небольшим поворотом в связи с тем, что наклейки поставляются в упаковках по 5 штук.
Если наклейки были куплены индивидуально, результат известен, как вы можете видеть здесь .
Все оценки для 90% верхней границы для индивидуально купленных наклеек также являются верхними оценками для задачи с пакетом из 5, но с менее близкой верхней границей.
Я думаю, что получить лучшую верхнюю границу вероятности 90%, используя пакет из 5 зависимостей, будет намного сложнее и не даст вам гораздо лучшего результата.
Итак, используя оценку хвоста сn=424и n - β + 1 =0,1, вы получите хороший ответ.P[T>βnlogn]≤n−β+1n=424n−β+1=0.1
РЕДАКТИРОВАТЬ :
Статья «Проблема коллекционера с групповыми рисунками» (Вольфганг Стадже), ссылка на статью, предоставленную Assuranceturix, представляет точное аналитическое решение проблемы коллекционера купонов с «наклейками».
Прежде чем писать теорему, определим некоторые обозначения: будет набором всех возможных наклеек, s = | S | , A ⊂ S будет подмножеством, которое вас интересует (в OP, A = S ), а l = | A |Ss=|S|A⊂SA=Sl=|A|, Мы собираемся нарисовать, с заменой, случайных подмножеств m различных наклеек. X k ( A ) будет количеством элементов A, которые появляются хотя бы в одном из этих подмножеств.kmXk(A)A
Теорема говорит, что:
P(Xk(A)=n)=(ln)∑j=0n(−1)j(nj)[(s+n−l−jm)/(sm)]k
Итак, для ОП у нас есть и m = 5 . Я сделал несколько попыток со значениями k около оценки для классической задачи сборщика купонов (729 упаковок), и я получил вероятность 90,02% для k, равного700.l=s=n=424m=5k
Так что это было не так далеко от верхней границы :)