Так что этот вопрос немного запутанный, но я добавлю красочные графики, чтобы восполнить это! Сначала предыстория, затем вопрос (ы).

Задний план

Скажем, у вас есть мерное полиномиальное распределение с равными вероятностями по категориям. Пусть - нормализованные значения ( ) из этого распределения, то есть: $n$ $n$ $\pi = (\pi_1, \ldots, \pi_n)$ $c$

(c_{1}, \dots, c_{n}) \sim Multinomial (1 / n, \dots, 1 / n) π_{i} = \frac{c_{i}}{n}

$(c_1, \ldots, c_n) \sim \text{Multinomial}(1/n, \ldots, 1/n) \\ \pi_i = {c_i \over n}$

Теперь распределение по имеет поддержку по симплексу, но с дискретными шагами. Например, при этот дистрибутив имеет следующую поддержку (красные точки): $\pi$ $n$ $n = 3$

введите описание изображения здесь

Другим распределением с аналогичной поддержкой является мерное распределение , то есть равномерное распределение по единичному симплексу. Например, вот случайные ничьи из 3-мерного : $n$ $\text{Dirichlet}(1, \ldots, 1)$ $\text{Dirichlet}(1, 1, 1)$

введите описание изображения здесь

Теперь у меня появилась идея, что распределение из распределения можно охарактеризовать как отрисовки из , которые дискретизируются до дискретной поддержки . Дискретизация, которую я имел в виду (и которая, кажется, работает хорошо), состоит в том, чтобы взять каждую точку симплекса и «округлить ее» до ближайшей точки, которая находится в поддержке . Для трехмерного симплекса вы получите следующий раздел, где точки в каждой цветной области должны «округляться» до ближайшей красной точки: $\pi$ $\text{Multinomial}(1/n, \ldots, 1/n)$ $\text{Dirichlet}(1, \ldots, 1)$ $\pi$ $\pi$

введите описание изображения здесь

Поскольку распределение Дирихле является равномерным, результирующая плотность / вероятность для каждой из точек пропорциональна площади / объему, который «округляется» до каждой точки. Для двумерного и трехмерного случаев эти вероятности:

введите описание изображения здесь ( эти вероятности взяты из моделирования Монте-Карло )

Таким образом, кажется, что, по крайней мере для 2 и 3 измерений, полученное распределение вероятностей от дискретизации таким конкретным способом совпадает с распределением вероятности для . Это нормализованный результат распределения . Я также пробовал с 4-мя измерениями, и, похоже, там работает. $\text{Dirichlet}(1, \ldots, 1)$ $\pi$ $\text{Multinomial}(1/n, \ldots, 1/n)$

Вопросов)

Итак, мой главный вопрос:

Дискретизируя однородный Дирихле таким конкретным способом, имеет ли отношение отношение для дальнейших измерений? Отношение имеет место вообще? (Я пробовал это только с помощью симуляции Монте-Карло ...) $\text{Multinomial}(1/n, \ldots, 1/n)$

Дальше мне интересно:

Если это соотношение верно, это известный результат? И есть ли какой-нибудь источник, который я могу процитировать для этого?
Если эта дискретизация равномерного Дирихле не имеет этого отношения с Мультивиномом. Есть ли подобная конструкция, которая имеет?

Некоторый контекст

Моя причина для того, чтобы задать этот вопрос, заключается в том, что я смотрю на сходство непараметрического Bootstrap и байесовского Bootstrap, и затем это выяснилось. Я также заметил, что рисунок на цветных областях на 3-мерном симплексе выше выглядит (и должен быть) диаграммой Вороного. Один из способов (я надеюсь) вы можете подумать об этом как последовательность треугольника / симпекса Паскаля ( http://www.math.rutgers.edu/~erowland/pascalssimplices.html ). Если размеры цветных областей следуют за вторым рядом треугольника Паскаля во втором случае, за третьим рядом тетраэдра Паскаля в третьем случае и так далее. Это объяснило бы связь с многочленным распределением, но здесь я действительно в глубокой воде ...

— Расмус Батх
источник

весело! (Как обычно.) Но я скучаю по носкам.

— Сиань

Ну, я начал рисовать носки с заменой. Но потом я начал думать о Байесовском усилителе, одно привело к другому, и вот как я здесь оказался :)

— Расмус Бат

@ Сиань, может быть, именно байки, а не щенки, должны стать талисманом Байеса?

— Тим

Эти два распределения различны для каждого . $n \geq 4$

нотация

Я собираюсь изменить ваш симплекс на коэффициент , чтобы точки решетки имели целочисленные координаты. Это ничего не меняет, я просто думаю, что это делает запись немного менее громоздкой. $n$

Пусть - -симплекс, заданный как выпуклая оболочка точек , ..., в . Другими словами, это точки, где все координаты неотрицательны, и где координаты суммируются с . $S$ $(n-1)$ $(n,0,\ldots,0)$ $(0,\ldots,0,n)$ $\mathbb R^{n}$ $n$

Обозначим через множество точек решетки , т. Е. Тех точек в где все координаты целые. $\Lambda$ $S$

Если - точка решетки, мы обозначим ее ячейку Вороного , определенную как те точки в которые (строго) ближе к чем к любой другой точке в . $P$ $V_P$ $S$ $P$ $\Lambda$

Мы ставим два вероятностных распределения, которые мы можем поместить в . Одним из них является полиномиальное распределение, где точка имеет вероятность . Другой мы будем называть моделью Дирихле , и она назначает каждому вероятность, пропорциональную объему . $\Lambda$ $(a_1, ..., a_n)$ $2^{-n} n!/(a_1! \cdots a_n!)$ $P \in \Lambda$ $V_P$

Очень неформальное оправдание

Я утверждаю, что полиномиальная модель и модель Дирихле дают разные распределения на , когда . $\Lambda$ $n \geq 4$

Чтобы увидеть это, рассмотрим случай , а точки и . Я утверждаю, что и конгруэнтны посредством перевода вектором . Это означает, что и имеют одинаковый объем, и, следовательно, и имеют одинаковую вероятность в модели Дирихле. С другой стороны, в полиномиальной модели они имеют разные вероятности ( И ), И это Отсюда следует, что распределения не могут быть равными. $n=4$ $A = (2,2,0,0)$ $B=(3,1,0,0)$ $V_A$ $V_B$ $(1,-1,0,0)$ $V_A$ $V_B$ $A$ $B$ $2^{-4} \cdot 4!/(2!2!)$ $2^{-4} \cdot 4!/3!$

Тот факт, что и совпадают, следует из следующего правдоподобного, но неочевидного (и несколько расплывчатого) утверждения: $V_A$ $V_B$

Правдоподобное утверждение : На форму и размер влияют только «непосредственные соседи» (т. Те точки в которые отличаются от вектором, который выглядит как , где и могут быть в других местах) $V_P$ $P$ $\Lambda$ $P$ $(1,-1,0,\ldots,0)$ $1$ $-1$

Легко видеть, что конфигурации «непосредственных соседей» и одинаковы, и из этого следует, что и являются конгруэнтными. $A$ $B$ $V_A$ $V_B$

В случае , мы можем играть в ту же игру, с и , например. $n \geq 5$ $A = (2,2,n-4,0,\ldots,0)$ $B=(3,1,n-4,0,\ldots,0)$

Я не думаю, что это утверждение совершенно очевидно, и я не собираюсь доказывать это, вместо немного другой стратегии. Тем не менее, я думаю, что это более интуитивный ответ на вопрос, почему распределения отличаются для . $n \geq 4$

Строгое доказательство

Возьмите и как в неофициальном обосновании выше. Нам нужно только доказать, что и конгруэнтны. $A$ $B$ $V_A$ $V_B$

Учитывая , мы определим следующим образом: - это множество точек , для которых . (В более удобной форме: пусть . - множество точек, для которых разница между самым высоким и самым низким меньше 1.) $P = (p_1, \ldots, p_n) \in \Lambda$ $W_P$ $W_P$ $(x_1, \ldots, x_n) \in S$ $\max_{1 \leq i \leq n} (a_i - p_i) - \min_{1 \leq i \leq n} (a_i - p_i) < 1$ $v_i = a_i - p_i$ $W_P$ $v_i$

Покажем, что . $V_P = W_P$

Шаг 1

: . $V_P \subseteq W_P$

Это довольно просто: предположим, что отсутствует в . Пусть и предположим (без ограничения общности), что , . Поскольку , мы также знаем, что . $X = (x_1, \ldots, x_n)$ $W_P$ $v_i = x_i - p_i$ $v_1 = \max_{1\leq i\leq n} v_i$ $v_2 = \min_{1\leq i\leq n} v_i$ $v_1 - v_2 \geq 1$ $\sum_{i=1}^n v_i = 0$ $v_1 > 0 > v_2$

Пусть теперь . Так как и оба имеют неотрицательные координаты, то и , и поэтому и, следовательно, . С другой стороны, . Таким образом, по крайней мере так же близко к как и к , поэтому . Это показывает (принимая дополнения), что . $Q = (p_1 + 1, p_2 - 1, p_3, \ldots, p_n)$ $P$ $X$ $Q$ $Q \in S$ $Q \in \Lambda$ $\mathrm{dist}^2(X, P) - \mathrm{dist}^2(X, Q) = v_1^2 + v_2^2 - (1-v_1)^2 - (1+v_2)^2 = -2 + 2(v_1 - v2) \geq 0$ $X$ $Q$ $P$ $X \not\in V_P$ $V_p \subseteq W_P$

Шаг 2

Требование : попарно не пересекаются. $W_P$

Предположим иначе. Пусть и - разные точки в , и пусть . Поскольку и различны и оба в , должен быть один индекс где , и один, где . Без ограничения общности будем считать, что , а . Переставляя и складывая вместе, мы получаем . $P=(p_1,\ldots, p_n)$ $Q = (q_1,\ldots,q_n)$ $\Lambda$ $X \in W_P \cap W_Q$ $P$ $Q$ $\Lambda$ $i$ $p_i \geq q_i + 1$ $p_i \leq q_i - 1$ $p_1 \geq q_1 + 1$ $p_2 \leq q_2 - 1$ $q_1 - p_1 + p_2 - q_2 \geq 2$

Теперь рассмотрим числа и . Из того факта, что , мы имеем . Аналогично, подразумевает, что . Сложив их вместе, мы получим , и мы получим противоречие. $x_1$ $x_2$ $X \in W_P$ $x_1 - p_1 - (x_2 - p_2) < 1$ $X \in W_Q$ $x_2 - q_2 - (x_1 - q_1) < 1$ $q_1 - p_1 + p_2 - q_2 < 2$

Шаг 3

Мы показали, что и что не пересекаются. крышка до множества меры нуль, и из этого следует , что ( с точностью до множества меры нуль). [Поскольку и оба открыты, мы фактически имеем , но это не обязательно.] $V_P \subseteq W_P$ $W_P$ $V_P$ $S$ $W_P = V_P$ $W_P$ $V_P$ $W_P = V_P$

Теперь мы почти закончили. Рассмотрим точки и . Легко видеть, что и являются конгруэнтными и переводят друг друга: единственный способ, которым они могут отличаться, - это если граница (кроме граней, на которых лежат и ) будет «обрезана» или или но не другой. Но чтобы достичь такой части границы , нам нужно изменить одну координату или как минимум на 1, что будет достаточно, чтобы гарантировать, что мы из $A = (2,2,n-4,0,\ldots,0)$ $B = (3,1,n-4,0,\ldots,0)$ $W_A$ $W_B$ $S$ $A$ $B$ $W_A$ $W_B$ $S$ $A$ $B$ $W_A$ и любом случае. Таким образом, даже если действительно отличается от точек обзора и , различия слишком , чтобы их можно было определить по определениям и , и, следовательно, и конгруэнтны. $W_B$ $S$ $A$ $B$ $W_A$ $W_B$ $W_A$ $W_B$

Из этого следует, что и имеют одинаковый объем, и, таким образом, модель Дирихле назначает им одинаковую вероятность, даже если они имеют разные вероятности в полиномиальной модели. $V_A$ $V_B$

— Ж. Лю
источник

Вау, строгий! Благодарность! Так что легкая переписка, на которую я надеялся, была случайной, я думаю ...

— Расмус Бат

Можно ли охарактеризовать многочлен (1 / n,…, 1 / n) как дискретный Дирихле (1, .., 1)?

Задний план

Вопросов)

Некоторый контекст

нотация

Очень неформальное оправдание

Строгое доказательство

Шаг 1

Шаг 2

Шаг 3