Сколько раз я должен бросить кубик, чтобы уверенно оценить его справедливость?


22

(Заранее извиняюсь за использование языка мирян, а не статистического языка.)

Если я хочу измерить шансы накатывания каждой стороны конкретного физического шестигранного кристалла с точностью примерно +/- 2% с достаточной уверенностью в достоверности, сколько потребуется образцовых роликов?

т.е. сколько раз мне нужно было бы бросить кубик, считая каждый результат, чтобы быть на 98% уверенным, что шансы на то, что он бросит каждую сторону, находятся в пределах 14,6% - 18,7%? (Или некоторые аналогичные критерии, при которых можно было бы убедиться на 98%, что умирание справедливо с точностью до 2%.)

(Это реальная проблема для игр-симуляторов, в которых используются кости, и они хотят убедиться, что определенные конструкции костей приемлемо близки к 1/6 вероятности броска каждого числа. Есть утверждения, что многие обычные конструкции костей были измерены, бросая 29% 1 к бросать несколько таких кубиков по 1000 раз каждый.)


1
Это гораздо сложнее, чем найти доверительный интервал для бинома, так как вы хотите контролировать все вероятности. Взгляните на статью Сюин Вана об одновременных доверительных интервалах для многочленных распределений ( Журнал многомерного анализа 2008, 99, 5, 896-911). Вы можете найти некоторый код в этом посте , который также дает краткое описание некоторых работ, которые были проделаны над этим.
idnavid

1
Обратите внимание, что если вы просто заинтересованы в том, чтобы проверять, выпадают ли единицы достаточно много времени, это значительно упрощает вопрос.
Деннис Джаэруддин

2
Важно отметить, что «доверительный интервал» не дает вам «процентильной вероятности правильности». Я подозреваю, что вы используете очень разумное общепринятое употребление термина «уверен на 98%», но вы должны знать всякий раз, когда кто-то упоминает «доверительный интервал», который совсем не совпадает с вероятностью 98%: link.springer.com/ article / 10.3758% 2Fs13423-013-0572-3
BrianH

1
@BrianH Спасибо! Я имел в виду не только разговорное выражение, но и пытаюсь измерить определенность, подразумеваемую тестом. Мне кажется, что точно так же, как и то, что имеет смысл сказать, что я рассчитываю на то, что бросок кубика будет рассчитан в процентах от времени, будет аналогичный (но более сложный) расчет вероятности того, что я буду бросать результаты в пределах определенная погрешность в броске n раз, что, как мне кажется, я понимаю в ответе Сямои (и последующем комментарии). Да?
Дронз

1
@ Dronz Чтобы быть справедливым, это одна из тех вещей, которые вы действительно думаете, было бы более прямолинейным, чем оказывается на самом деле. Чертовски сложно, на самом деле. Ниже приводятся некоторые ключевые вопросы, связанные с другими вопросами, чтобы помочь вам понять, почему не существует невероятно простого ответа: Frequentist math.stackexchange.com/questions/1578932/… Bayesian math.stackexchange.com/questions/1584833/… и веселье: rpg.stackexchange.com/questions/70802/…
BrianH

Ответы:


18

TL; DR: если p = 1/6, и вы хотите знать, насколько велико n должно быть на 98%, чтобы убедиться, что игра в кости справедлива (с точностью до 2%), n должно быть не менее n ≥ 766 .


Пусть n будет числом рулонов, а X - количеством рулонов, которые приземляются на определенной стороне. Тогда X следует биномиальному (n, p) распределению, где p - вероятность получения указанной стороны.

По центральной предельной теореме мы знаем, что

n(X/np)N(0,p(1p))

поскольку X/n - это выборочное среднееn случайных величинБернулли(p) . Следовательно, для большихn доверительные интервалы дляp могут быть построены как

Xn±Zp(1p)n

Так как p неизвестно, мы можем заменить его среднюю выборочную р = Х / п , и различными теоремами сходимости, мы знаем , что в результате доверительный интервал будет асимптотический действительным. Таким образом, мы получаем доверительные интервалы видаp^=X/n

p^±Zp^(1p^)n

с р = Х / п . Я предполагаю, что вы знаете, что такое Z- баллы. Например, если вы хотите 95% доверительный интервал, вы принимаете Z = 1,96 . Таким образом, для данного уровня достоверности α мы имеемp^=X/nZZ=1.96α

p^±Zαp^(1p^)n

Теперь предположим, что вы хотите, чтобы этот доверительный интервал имел длину меньше, чем Cα , и хотите знать, насколько большой выборки нам нужен для этого случая. Ну, это равносильно тому, чтобы спросить, что удовлетворяет nα

Zαp^(1p^)nαCα2

Который затем решается получить

nα(2ZαCα)2p^(1p^)

Таким образом , вилка в ваших значений Zα ; , Cα ; , и по оценкам р , чтобы получить оценку для п & alpha ;p^nα . Обратите внимание, что, поскольку p неизвестно, это только оценка, но асимптотически (при увеличении n ) она должна быть точной.


3
Спасибо. Поскольку я десятилетиями не занимался математикой по типу колледжа, могу ли я вас побеспокоить, чтобы вы включили числа и фактически дали мне приблизительное число раз, которое мне нужно было бы бросить, как целое число?
Дронц

9
p=1/6nnn766Cα

4
Возможно, было бы интереснее взглянуть на многочленное распределение, поскольку теперь мы тестируем каждую сторону отдельно. Это не учитывает всю имеющуюся у нас информацию о проблеме. Для интуитивного объяснения смотрите stat.berkeley.edu/~stark/SticiGui/Text/chiSquare.htm
января

5
Я согласен с @Jan: Этот ответ не касается вопроса. Более того, его нельзя легко адаптировать для построения ответа, применяя его отдельно ко всем шести сторонам, потому что шесть тестов являются взаимозависимыми.
whuber

3
Это хороший ответ, но я полностью согласен с @Jan, whuber. Этот вопрос заслуживает ответа на основе статистики хи-квадрат и многочленного распределения.
Лукаш Град
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.