Одинаковые или разные? Байесовский путь

Скажем, у меня есть следующая модель:

Poisson (λ) \sim {\begin{cases} λ_{1} & if t < τ \\ λ_{2} & if t \geq τ \end{cases}

$\text{Poisson}(\lambda) \sim \begin{cases} \lambda_1 & \text{if } t \lt \tau \\ \lambda_2 & \text{if } t \geq \tau \end{cases}$

И я делаю выводы из и показанных ниже, из моих данных. Есть ли байесовский способ сказать (или количественной оценку) , если и являются одинаковыми или разными ? $\lambda_1$ $\lambda_2$ $\lambda_1$ $\lambda_2$

Возможно, измерение вероятности того, что $\lambda_1$ отличается от $\lambda_2$ ? Или, возможно, с использованием расхождений KL?

Например, как я могу измерить $p(\lambda_2 \neq \lambda_1)$ или, по крайней мере, $p(\lambda_2 \gt \lambda_1)$ ?

В общем, если у вас есть постеры, показанные ниже (допустите ненулевые значения PDF везде для обоих), каков хороший способ ответить на этот вопрос?

введите описание изображения здесь

Обновить

Похоже, что на этот вопрос можно ответить двумя способами:

Если у нас есть образцы постеров, мы могли бы посмотреть на долю образцов, где $\lambda_1 \neq \lambda_2$ (или эквивалентно $\lambda_2 > \lambda_1$ ). @ Cam.Davidson.Pilon включил ответ, который решит эту проблему с помощью таких примеров.
Интеграция своего рода различий постеров. И это важная часть моего вопроса. Как будет выглядеть эта интеграция? Предположительно подход выборки приблизил бы этот интеграл, но я хотел бы знать формулировку этого интеграла.

Примечание: приведенные выше графики взяты из этого материала .

distributions bayesian poisson-distribution

— Амелио Васкес-Рейна
источник

Вы можете просто рассчитать дисперсию обоих распределений и добавить их. Это разница в средствах. Затем рассчитайте разницу в средних и посмотрите, сколько это стандартных отклонений. Для начала вы можете аппроксимировать оба распределения нормальным и использовать обычные доверительные интервалы для нормального распределения. Это явно разные средства.

— Dave31415

Внутренняя проверка гипотез является ответом

— Стефан Лоран

Все необходимые расчеты приведены в моей статье, но я не изучал случай ( - это соотношение двух пуассоновских скоростей)

H_{0} : {ϕ = 1}

$H_0:\{\phi=1\}$

ϕ

$\phi$

— Стефан Лоран,

Спасибо @ StéphaneLaurent. Ваша статья - отличный указатель, но, похоже, она специфична для пуассоновских процессов. Каково сравнение на высоком уровне, которое может сделать, чтобы оценить, является ли тем же или отличным от ? Должен ли анализ быть конкретным для распределения?

λ_{2}

$\lambda_2$

λ_{1}

$\lambda_1$

— Амелио Васкес-Рейна

Извините @ user023472 У меня нет энергии в эти дни. Смотрите статьи Бернардо, цитируемые в моей статье. «Внутренний» означает, что метод получен из модели и только из нее.

— Стефан Лоран

Ответы:

Я думаю, что лучший вопрос, они значительно отличаются?

Чтобы ответить на это, нам нужно вычислить . Назовите это количество . Если , то есть равный шанс, что один больше другого. С другой стороны, если действительно близко к 1, то мы можем быть уверены, что yes больше (читай: отличается), чем . $P(\lambda_2 > \lambda_1)$ $p$ $p \approx 0.50$ $p$ $\lambda_2$ $\lambda_1$

Как мы вычисляем ? Это тривиально в байесовской структуре MCMC. У нас есть сэмплы сзади, поэтому давайте просто вычислим, что сэмплы из больше, чем : $p$ $\lambda_2$ $\lambda_1$

 p = np.mean( lambda_2_samples > lambda_1_samples )
 print p

Я прошу прощения за то, что не включил это в книгу, я обязательно добавлю это, поскольку я думаю, что это одна из самых полезных идей в байесовском выводе

— Cam.Davidson.Pilon
источник

Вероятность 1,0 они различны, так как они обе являются непрерывными случайными величинами. Подумайте: каково ваше предварительное предположение, что ? Вы действительно думаете, что они на самом деле равны? (Не обращайте внимания на проверку гипотез: мы живем в реальном мире, где переменные фактически никогда не равны). Смотрите этот пост моего героя, Гельмана. В вычислительном отношении вы можете проверить это с помощью вычислений .

λ_{1} = λ_{2}

$\lambda_1 = \lambda_2$ np.mean( lambda_2_samples != lambda_1_samples)

— Cam.Davidson.Pilon

Вы можете определить, как «не равно» имеет смысл. Например, если в вашем примере любая разница меньше единицы практически не имеет смысла, вы можете посмотреть на и это даст вам значимую статистику для

P (| λ_{1} - λ_{2} | > 1)

$P(|\lambda_1-\lambda_2| > 1)$

P (λ_{1} \neq λ_{2})

$P(\lambda_1 \ne \lambda_2)$

— Сэм Диксон,

Чтобы добавить к моему предыдущему комментарию, если переменные и были дискретными, есть вероятность, что = .

λ_{1}

$\lambda_1$

λ_{2}

$\lambda_2$

λ_{2}

$\lambda_2$

λ_{1}

$\lambda_1$

— Cam.Davidson.Pilon

о боже, я бы не хотел быть в такой ситуации! Это вовлекает противные интегралы. Для большинства моделей вы не можете получить постеры. Даже если бы вы могли, было бы все же лучше использовать компьютер, просто ради получения образцов. Таким образом, примеры> формул для вычислений, как это.

— Cam.Davidson.Pilon

Вы не измеряете «достаточно больше». Рассмотрим распределение с пиком в нуле, а другое с равными массами в пиках -10, 10. Ваша статистика - ожидаемое значение показателя того, что одна выборка больше другой - дает 0,5, но распределения явно совершенно разные.

— Нил Дж

$\lambda_1$ $\lambda_2$ $\Pr(\lambda_1=\lambda_2)=0$

Я подозреваю, что вас интересует вероятность того, что и находятся в некотором друг от друга. В этом случае, ответом будет область разности двух задних плотностей на интервале . Большие значения перекрытия указывают на то, что два постериора более похожи. $\lambda_1$ $\lambda_2$ $\epsilon$ $[-\epsilon/2, \epsilon/2]$

Если вы предпочитаете работать с симулированными результатами (а для большинства задач у нас нет роскоши выбора), просто возьмите пропорцию результатов, где в качестве приблизительного значения. $\lambda_2>\lambda_1$

— Sycorax говорит восстановить Монику
источник

Спасибо. Как ваш ответ связан с некоторыми идеями, обсуждаемыми в комментариях ОП?

— Амелио Васкес-Рейна

Извините, но я не знаком ни с одним из этих методов, поэтому не могу комментировать. @ Stéphane_Laurent довольно умный, поэтому я рекомендую просмотреть ссылку, как минимум.

— Sycorax говорит восстановить Monica

@ user023472 Извините, сегодня у меня нет сил ответить на вопрос о внутреннем расхождении. Он основан на расхождении Кульбака-Лейблера.

— Стефан Лоран

@ user777 Это требует исправления . Что если я просто хочу увидеть вероятность или ?

ϵ

$\epsilon$

p (λ_{2} > λ_{1})

$p(\lambda_2 \gt \lambda_1)$

p (λ_{2} \neq λ_{1})

$p(\lambda_2 \neq \lambda_1)$

— Амелио Васкес-Рейна

Спасибо @ user777. Мне интересен случай, когда у нас нет доступа к образцам. Ранее в вашем посте был интеграл, но вы, кажется, удалили его. Как бы выглядел этот интеграл?

— Амелио Васкес-Рейна