Являются ли различия между равномерно распределенными числами равномерно распределенными?


22

Мы бросаем шестигранный кубик большое количество раз.

Вычисляя разницу (абсолютную величину) между рулоном и его предыдущим рулоном, должны ли различия быть равномерно распределены?

Для иллюстрации с 10 рулонами:

roll num  result diff
1           1     0
2           2     1
3           1     1
4           3     2
5           3     0
6           5     2
7           1     4
8           6     5
9           4     2
10          4     0

Будут ли diffзначения равномерно распределены?


13
Составьте гистограмму, чтобы хотя бы получить представление
орудия


Это похоже на домашнюю работу ....
Ману Х

@Manu H, я уверяю тебя, дни домашней работы позади меня
HeyJude

Ответы:


37

Нет, это не равномерно

Вы можете посчитать 36 одинаково вероятных возможностей для абсолютных различий

     second 1   2   3   4   5   6
first                           
1           0   1   2   3   4   5
2           1   0   1   2   3   4
3           2   1   0   1   2   3
4           3   2   1   0   1   2
5           4   3   2   1   0   1
6           5   4   3   2   1   0

который дает распределение вероятности для абсолютных разностей

0    6/36  1/6
1   10/36  5/18
2    8/36  2/9
3    6/36  1/6
4    4/36  1/9
5    2/36  1/18

27
@onurcanbektas Таблица в этом ответе явно противоречит вашему утверждению: например, она показывает, что только одно из возможных различий равно 5, тогда как 6 из них равны 0. Поскольку все 36 возможностей одинаково вероятны, это неравномерно.
whuber

13
@onurcanbektas Я приглашаю вас еще раз рассмотреть стол. Поскольку он имеет только две абсолютные разности 5, не очевидно ли, что не более двух разностей могут равняться 5?
whuber

14
@onurcanbektas Для простых различий (т.е. со знаками, то есть целыми числами от -5 до +5), распределение является симметричным дискретным треугольным распределением с модой (наиболее вероятное значение) в 0. Для абсолютных различий, как показано в моем ответе, режим 1.
Генри

2
Стоит отметить, что подписанная разница по модулю 6 распределена равномерно.
Федерико Полони

2
@FedericoPoloni Разве это не тривиально очевидно? Я имею в виду, что никогда не задумывался об этом до прочтения комментария, но совершенно очевидно, что это просто должно быть правдой
Cruncher

21

Используя только самые основные аксиомы о вероятностях и действительных числах, можно доказать гораздо более сильное утверждение:

Разница любых двух независимых одинаково распределенных непостоянных случайных значений XY никогда не имеет дискретного равномерного распределения.

(Аналогичное утверждение для непрерывных переменных доказано в Uniform PDF разности двух rv .)

Идея состоит в том, что вероятность того, что XY является экстремальным значением, должна быть меньше, чем вероятность того, что XY равна нулю, потому что есть только один способ (скажем) максимизировать XY тогда как есть много способов уменьшить ноль. потому что X и Y имеют одинаковое распределение и поэтому могут равняться друг другу. Вот подробности.

Прежде всего заметим, что гипотетические две переменные X и Y идет речь, каждая из них может достичь только конечного числа n значений с положительной вероятностью, потому что будет как минимум n различных различий, и равномерное распределение присваивает им одинаковую вероятность. Если N бесконечно, то так будет число возможных различий, имеющих положительную, равную вероятность, откуда сумма их шансов будет бесконечной, что невозможно.

Далее , поскольку число различий конечно, среди них будет наибольшее. Наибольшая разница может быть достигнута только в том случае, если вычесть наименьшее значение из Y -let, называющего его m и предположить, что оно имеет вероятность q=Pr(Y=m) - из наибольшего значения вызова X -let, что это M с p=Pr(X=M). Поскольку X и Y независимы, вероятность этой разницы является результатом этих шансов,

(*)Pr(XY=Mm)=Pr(X=M)Pr(Y=m)=pq>0.

Наконец , потому что X иY имеют одинаковое распределение, есть много способов их различия могут продуцировать значение0. Среди этих способов являются случаикогдаX=Y=m иX=Y=M. Поскольку это распределение непостоянное,m отличается отM.Это показывает, что эти два случая являются непересекающимися событиями, и поэтому они должны вноситькак минимумвеличинуp2+q2 в вероятность того, чтоXYноль; то есть,

Pr(XY=0)Pr(X=Y=m)+Pr(X=Y=M)=p2+q2.

Так как квадраты чисел не являются отрицательными, 0(pq)2, откуда мы выводим из () что

Pr(XY=Mm)=pqpq+(pq)2=p2+q2pq<p2+q2Pr(XY=0),

показывая распределение XY не является равномерным, QED.

Редактировать в ответ на комментарий

Аналогичный анализ абсолютных различий |XY|отмечает, что, потому что X иY имеют одинаковое распределение,m=M.Это требует от нас изученияPr(XY=|Mm|)=2pq.Тот же алгебраический метод дает почти тот же результат, но есть вероятность, что2pq=2pq+(pq)2 и2pq+p2+q2=1. Эта система уравнений имеет единственное решениеp=q=1/2 , соответствующей справедливой монеты (а «двусторонний умереть»). Помимо этого исключения, результат для абсолютных различий такой же, как и для различий, и по тем же базовым причинам, которые уже приведены: а именно, абсолютные различия двух случайных переменных iid не могут быть равномерно распределены, когда имеется более двух различных различий с положительной вероятностью.

(конец редактирования)


Давайте применим этот результат к вопросу, который задает что-то более сложное.

Смоделируйте каждый независимый бросок кристалла (который может быть нечестным штампом) со случайной величиной Xi, i=1,2,,n. Различиянаблюдаемые в этихn валков числоΔXi=Xi+1Xi. Мы могли бы задаться вопросом, насколько равномерно распределены этиn1 числа. Это действительно вопрос о статистических ожиданиях: что ожидаемое числоΔXiнапример, равны нулю? Что такое ожидаемое число ΔXi равняться 1 ? И т. Д.

Проблематичный аспект этого вопроса является то , что ΔXi является не независимыми: например, ΔX1=X2X1 и ΔX2=X3X2 включает один и тот же рулон X2.

Тем не менее, это не очень сложно. Поскольку статистическое ожидание является аддитивным и все различия имеют одинаковое распределение, если мы выберем любое возможное значение k различий, ожидаемое число раз, равное разницеk во всей последовательности изn бросков, будет просто вn1 раз больше ожидаемого числа раз разница равнаk в один шаг процесса. Это одношаговое ожиданиеPr(ΔXi=k) (для любогоi ). Эти ожидания будут одинаковыми для всехk (то естьравномерно) тогда и только тогда, когда они одинаковы для одного ΔXi. Но мы видели , что ни ΔXi не имеет равномерное распределение, даже когда умирают может быть предвзятым. Таким образом, даже в этом более слабом смысле ожидаемых частот различия роликов не являются однородными.


@ Михаил Хороший вопрос: я ответил на вопрос в том виде, в котором его задавали (о «различиях»), а не как показано на иллюстрации (что явно относится к абсолютным различиям). Применяется та же техника - нужно учитывать как максимальную, так и минимальную разницу. В том случае , если только эти две возможности (вместе с нулем), можно получить равенство, которое где Бернулли результат получается из (показывая , что это единственный такой пример). (1/2)
whuber

Другой ответ, подтверждающий конкретную версию этого здесь .
Восстановить Монику

Спасибо, @Ben: я забыл эту тему. Поскольку это лучший справочник, я теперь прямо ссылаюсь на него в этом ответе.
whuber

12

На интуитивном уровне случайное событие может быть равномерно распределено, только если все его результаты одинаково вероятны.

Так ли это для рассматриваемого случайного события - абсолютной разницы между двумя бросками костей?

В этом случае достаточно взглянуть на крайности - каковы самые большие и самые маленькие значения, которые может принимать эта разница?

Очевидно, что 0 - наименьшее (мы смотрим на абсолютные различия, и броски могут быть одинаковыми), а 5 - самое большое ( 6против 1).

Мы можем показать, что событие неоднородно, показав, что 0вероятность его возникновения (или меньше) выше, чем 5.

На первый взгляд, есть только два способа возникновения 5 - если первый кубик равен 6, а второй - 1, или наоборот . Сколько способов может возникнуть 0?


1
+1 Я думаю, что это доходит до сути дела. Я опубликовал обобщение вопроса, которое в конечном итоге опирается на то же наблюдение.
whuber

5

Как представил Генри, различия в равномерно распределенных распределениях распределены неравномерно.

Чтобы проиллюстрировать это с помощью смоделированных данных, мы можем использовать очень простой R-скрипт:

barplot(table(sample(x=1:6, size=10000, replace=T)))

введите описание изображения здесь

Мы видим, что это действительно дает равномерное распределение. Давайте теперь посмотрим на распределение абсолютных отличий двух случайных выборок от этого распределения.

barplot(table(abs(sample(x=1:6, size=10000, replace=T) - sample(x=1:6, size=10000, replace=T))))

введите описание изображения здесь


6
Почему это имеет какое-либо отношение к CLT, которое касается асимптотического распределения средних значений большого числа значений iid?
whuber

2
nnn>1n=2n=2n=4n
говорит само за себя, учтите

3
@Krubo Первоначальный вопрос касается распределения различий между последовательными бросками кубика. CLT ничего не может сказать по этому поводу. В самом деле, независимо от того, сколько раз выпадет матрица, распределение этих различий не будет приближаться к нормальному.
whuber

Имеет ли это распределение тенденцию к равномерности, поскольку число граней головки стремится к бесконечности? Не уверен, как показать это, но интуитивно кажется, что он движется в этом направлении, но я не знаю, будет ли он асимптотически «заблокирован» где-то перед тем, как сгладить достаточно
Cruncher

@ Cruncher вы можете легко изменить количество граней в R-коде. Чем больше лиц, тем более очевидным становится характер распределения лестничных площадок. «1» всегда является вершиной этой ступени, и с большими различиями вероятности приближаются к нулю. Кроме того, разница «0» значительно реже, чем «1». (по крайней мере, если наименьшее значение умирает '1')
LuckyPal

2

Другие работали над расчетами, я дам вам ответ, который кажется мне более интуитивным. Вы хотите изучить сумму двух в единицах от rv (Z = X + (-Y)), общее распределение представляет собой (дискретный) продукт свертки:

P(Z=z)=k=P(X=k)P(Y=zk)

zkz

Из обработки сигналов мы знаем, как ведет себя продукт свертки:

  • Произведение свертки двух равномерных функций (двух прямоугольников) даст треугольник. Это иллюстрируется википедией для непрерывных функций:

введите описание изображения здесь

  • zz

  • В более общем смысле мы знаем, что единственными функциями, которые устойчивы при свертке, являются функции семейства гауссовских. т.е. только гауссовское распределение является стабильным путем сложения (или, в более общем случае, линейной комбинации). Это также означает, что вы не получите равномерное распределение при объединении равномерных распределений.

Что касается того, почему мы получаем эти результаты, ответ лежит в разложении этих функций по Фурье. Преобразование Фурье продукта свертки является простым произведением преобразований Фурье каждой функции. Это дает прямую связь между четырьмя коэффициентами функций прямоугольника и треугольника.


Пожалуйста, проверьте обоснованность своих претензий и логику вашего ответа. Вопрос не в том, является ли свертка двух равномерных распределений равномерной, а в том, может ли свертка некоторого распределения и его обращение быть равномерной. И есть гораздо более дистрибутивные семьи , чем гауссовая, которые устойчивы при свертке ( по модулю стандартизации, конечно): см en.wikipedia.org/wiki/Stable_distribution
whuber

Вы правы насчет стабильных дистрибутивов. На вопрос, я почти уверен, что речь идет о разнице двух случайных значений с равномерным распределением (как указано в заголовке). Вопрос о том, может ли свертка некоторого распределения и его обращение быть равномерным, больше того, что задается здесь.
lcrmorin

1

ИксY|Икс-Y|знак равноККзнак равно0,1,2,3,4,5К

consecutive dice rolls difference visualization

Как вы можете легко видеть, количество точек для каждого цвета не одинаково; следовательно, различия не распределены равномерно.


0

DTИксп(DTзнак равно5)знак равноп(ИксTзнак равно6,ИксT-1знак равно1)<п((ИксT,ИксT-1){(6,3),(5,2)})<п(DTзнак равно3)

Так что функция п(DTзнак равноd) не является постоянным в d, Это означает, что распределение не является равномерным.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.