Смысл представления симплекса как поверхности треугольника в распределении Дирихле?


9

Я читаю из книги, которая представляет распределение Dirchilet, а затем представил цифры о нем. Но я не был в состоянии понять эти цифры. Я прикрепил рисунок здесь внизу. Чего я не понимаю, так это значения треугольников.

Обычно, когда кто-то хочет построить функцию от 2 переменных, вы берете значение var1 и va2, а затем наносите на график значение функции этих двух переменных ... что дает визуализацию в трехмерном измерении. Но здесь есть 3 измерения и одно другое значение для значения функции, поэтому оно визуализируется в 4D пространстве. Я не могу понять эти цифры!

Я надеюсь, что кто-то может уточнить их, пожалуйста!

РЕДАКТИРОВАТЬ: вот что я не понимаю из рисунка 2.14a. Итак, мы взяли из K = 3 dirichlet образец тэты (который в основном является вектором), а именно: тета = [theta1, theta2, theta3]. График треугольника [theta1, theta2, theta3]. Расстояние от начала координат до каждого theta_i является значением theta_i. Затем для каждого theta_i он поместил вершину, соединил все три вершины и сделал треугольник. Я знаю, что если я подключу [theta1, theta2, theta3] к dir (theta | a), я получу одно число, которое является общей вероятностью вектора theta. Я также понимаю, что вероятность непрерывных случайных величин является мерой площади. Но здесь у нас есть 3 измерения, поэтому совместная вероятность будет мерой объема пространства от розовой плоскости и под ... т.е. пирамидой. Теперь я не понимаю, какова роль треугольника здесь.

введите описание изображения здесь


2
Я предлагаю вам начать с бета-дистрибуции и работать оттуда. Дирихле для 3 - это «просто» логическое продолжение беты, то есть Дирихле для 2.
Андрис Биркманис

Посмотрите эту ветку
Тим

Может быть полезно думать, что бета-распределение показано в 2D (ось X представляет двоичный результат {0,1}, а ось Y представляет вероятность), поэтому для тройного результата требуется дополнительное измерение, верно?
Джордж

Ответы:


4

Я не понимаю, какова роль треугольника здесь. Что он пытается общаться или визуализировать?

Все точки в треугольнике должны удовлетворять двум ограничениям: от нуля до единицы в каждом измерении ( ), и все суммы до одного ( ).θ 0 + θ 1 + θ 2 = 10θ1θ0+θ1+θ2=1

То, как я наконец понял это следующее:

фигура

Так (а) показывает трехмерное пространство с качестве координат. Они варьируются только от 0 до 1.θ1,2,3

В (б) показан треугольник, это наш симплекс.

(c) показывает две примерные точки, которые «лежат» на симплексе, которые также соответствуют вторым критериям (суммы до одного).

(d) показывает другую примерную точку на симплексе, те же самые ограничения

В (д) я попытался показать проекцию симплекса на двумерный треугольник со всеми примерами точек, показанных ранее.

Надеюсь, теперь это имеет больше смысла :)


2
Хорошее фото. Это твое? Если нет, не могли бы вы предоставить ссылку и ее источник?
Тим

1
Спасибо. Это мое (нарисовано с использованием Inkscape), я могу предоставить SVG при необходимости ...
Джон Доу

2

График 2.14 (а) показывает плоскость, образованную тремя вершинами на каждой оси. Расстояние вершины от начала координат соответствует одному из классов. Область, ограниченная розовой плоскостью и плоскостями осей, является вероятностью (вектор) k = 3 θθik=3θ, Теперь предположим, что вы наклоняете эту плоскость так, чтобы у вас была пирамида с розовой плоскостью, лицом, ближайшим к читателю, расположенной плоско на странице. Затем подавьте «выкатывание» третьего измерения страницы и закрасьте треугольник так, чтобы область с более высокой плотностью, с большим расстоянием от основания до поверхности, была более красной. Это то, что показывают графики 2.14 (б) и 2.14 (в). Чем больше красный сосредоточен возле вершины, тем более вероятен класс, связанный с этой вершиной. Аналогично, если красная область не очень близка к какой-либо вершине, маловероятно, что событие имеет более высокую вероятность членства в каком-либо из классов.

Эта пирамида, тем не менее, имеет смысл только как единственная реализация распределения Дирихле. Повторное рисование из того же распределения может привести к разной пирамиде с разными длинами для каждой из вершин. Ключевое различие между (a) и (b) / (c) состоит в том, что (a) графически отображает вероятность одной ничьей вектора . Графики (b) и (c) показывают плотность вероятности для значений в симплексе , то есть они пытаются представить функцию плотности вероятности для всех значенийθ θ k = 3 θ θ Dir ( α )θθθk=3θв поддержку. Один из способов думать о (b) и (c) - это точка, имеющая дополнительный красный цвет в соответствии со средней высотой между плоской розовой плоскостью и поверхностью пирамиды, усредненной по многим чертежам .θDir(α)


Некоторые моменты до сих пор не ясны. Возможно потому что мой слабый английский. «Область, окруженная розовой плоскостью и плоскостями осей, является плотностью». Это пустое пространство пирамиды под розовой плоскостью? Тоже "плотность"? Что вы имеете в виду? Например, я понимаю, что dir (x1, x2, x3) - это одно значение, как плотность входит в график?
Джек Твен

Да, между розовой плоскостью и плоскостями, образованными черными линиями в 2.14 (а), находится пространство пирамиды, которое я пытался описать. Извините за путаницу!
Sycorax сообщает восстановить Monica

Я отредактирую свой пост, чтобы объяснить дальше, что еще не ясно
Джек Твен

дело в том, что розовый регион - это именно та поддержка, которая описана в книге. так как theta_k <= 1 и сумма (theta_k) = 1. Как только вы представите это, user777 совершенно прав.
Царапина

@ user777 Я только что отредактировал пост
Джек Твен
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.