Когда получатель должен рандомизировать действия в игре с сигнализацией?

Предположим , что существует сигнализации игра с конечным пространства сообщений $M$ , конечное действие пространства $A$ и конечного типа пространства $T$ . Еще проще, все типы отправителей имеют одинаковые предпочтения (получатель просто предпочитает разные действия в ответ на разные типы). Может ли получатель когда-либо делать строго лучше, рандомизируя ответы? Когда существует равновесие, когда приемник совершает только чистые действия?

Вездесущий вкратце подытожил мой вопрос: «Всегда ли случается, что равновесие с самыми высокими выигрышами для получателей обязательно включает в себя смешанные стратегии?»

Пойдем с последовательным равновесием. Если вы хотите начать с некоторых обозначений.

$\sigma_{t}(m)$ есть вероятностьчто $t\in T$ посылает $m\in M$ .

$\sigma_R^m(a)$ есть вероятностьчто приемник реагирует на $m$ с $a\in A.$ $\mu^m \in \Delta T$ дает убеждения получателя после наблюдения $m$ .

Последовательное равновесие требует, чтобы $\sigma_t$ давали оптимальные отклики при заданном $\sigma_R$ , $\sigma_R$ оптимально при заданном $\mu$ а $\mu$ - байесовский при заданном $\sigma$ . Это действительно определение слабого последовательного, но в игре сигнализации нет никаких различий.

Моя интуиция говорит «нет», когда существует равновесие, когда приемник играет только чистые действия, но я всегда был ужасен с такими вещами. Может быть, мы также должны оговорить, что это не игра с нулевой суммой, но я говорю только об этом, потому что я помню, что игроки были лучше с возможностью рандомизации в этих играх. Возможно, это где-то сноска в газете?

Рассмотрим игру ниже, где предпочтения отправителя не идентичны. Я прошу прощения за низкое качество. Существует три типа отправителей, каждый из которых одинаково вероятен. Мы можем создать то, что, как я считаю, является оптимальным равновесием для получателя (игрока 2), только если они рандомизируются при получении сообщения 1. Тогда типы 1 и 3 будут играть , создавая разделяющее равновесие. Если приемник использует чистую стратегию в ответ на , тогда тип 1 или 2 будет отклоняться и ухудшать состояние приемника. $m_2$ $m_1$

$\sigma_R^{m_1}(a)=.5=\sigma_R^{m_1}(r)=.5$

введите описание изображения здесь

game-theory

— Pburg
источник

Влияют ли действия, выполняемые получателем как функция типа, на сообщение, отправленное отправителем, или они независимы?

— Мартин Ван дер Линден,

Я не совсем уверен, что вы имеете в виду. Есть один тип приемника. Их стратегия отображает сообщения в распределение по действиям. Они влияют на сообщение только в том случае, если отправители играют лучший ответ.

— Пбург

Предположим, что существует равновесие, при котором приемник рандомизирует множество действий

. Это означает, что по определению он должен быть безразличным к любым двум вероятностным распределениям по

включая те, в которых весь вес накладывается на одно действие (чистые стратегии). Так что нет, смешанная стратегия никогда не может быть строго лучше, чем лучшая чистая стратегия. Или я неправильно понял вопрос?

α

$\alpha$

α

$\alpha$

— Вездесущий

@ Вездесущий Это имеет смысл для меня, но мне было интересно, могут ли быть какие-то странные патологические случаи. Например, я мог найти только теорему: «Для общего выбора выплат в игре с конечной экстенсивной формой с идеальным отзывом выплаты постоянны для каждого связанного компонента последовательных равновесий». Общее предостережение заставило меня задуматься.

— Пбург

@Pburg Да, я вижу. Кажется, мы имели в виду разные вопросы. Я подумал: «Это когда-либо так, что единственный лучший ответ получателя на данную стратегию отправителя является смешанной стратегией?», Тогда как, кажется, ваш вопрос на самом деле «всегда ли это случай, когда равновесие с самыми высокими выплатами получателя обязательно включает смешанные стратегии?

— Вездесущий

Ответы:

Возможно, у меня есть контрпример!

$m_1, m_2,$ $m_3$ $t_1,t_2,t_3$ $\Pr(t=t_3)=\frac{1}{2}-\epsilon$ $\Pr(t=t_2)=\frac{1}{4}$ $\Pr(t=t_1)=\frac{1}{4}+\epsilon$ $m_3$ $0$

Набор ответов получателя на сообщение равен $m=m_1,m_2$ $\{a,r\}$

$u_t(a,m_1)=1 > u_t(a,m_2)=\beta>u_t(r,\cdot)=0$

$u_R(t_1,m_1,a)=u_R(t_2,m_2,a)=2$ , , $u_R(t_3,m_i,a)=1$

$u_R(t_2,m_1,a)=u_R(t_2,m_1,a)=0$ , , $u_R(t_3,m_i,r)=2$

$u_R(t_1,m_i,r)=u_R(t_2,m_i,r)=1$ .

Тогда в равновесии все отправители должны получить одинаковую полезность, правильно? В противном случае один будет подражать стратегии другого.

Таким образом, единственное чисто стратегическое равновесие для всех отправителей - это выбрать . В пуле равновесия на или лучшим ответом является выбор . Не существует чистой стратегии, разделяющей равновесие, за исключением случаев, когда и отправляют , а получатель отвечает . Тогда безразличен между всеми сообщениями, потому что он наверняка встретит выплату . Все это дает выигрыш получателю $m_3$ $m_1$ $m_2$ $r$ $t_1$ $t_2$ $m_2$ $r$ $t_3$ $0$ $\frac{3}{2}-\epsilon$

Затем рассмотрим случай, когда иТеперь отправители безразличны к отправке этих двух сообщений. Затем пусть и для . Тогда стратегия приемника рациональна. $\sigma_R^{m_1}(a)=\beta$ $\sigma_R^{m_2}(a)=1.$ $\sigma_{t_3}(m_1)=\frac{\epsilon+1/4}{-\epsilon+1/2}=1-\sigma_{t_3}(m_1)$ $\sigma_{t_i}(m_i)=1$ $i=1,2$

Ожидаемая полезность получателя от учетом или составляет 1,5. Ожидаемая полезность от чуть выше 1,5, учитывая . Таким образом, ожидаемая ожидаемая прибыль выше , лучше, чем чистое равновесие, описанное выше. Кроме того, это разделение поддерживается только путем смешивания. Любая другая чистая стратегия, принятая получателем, будет вызывать объединение отправителей, а это означает, что единственное чисто стратегическое равновесие - это когда получатель выбирает . $m_1$ $a$ $r$ $m_2$ $a$ $\frac{3}{2}-\epsilon$ $r$

Я должен иметь s на картинке ниже для выплат левой стороне отправителю . Я думаю, что является ключевым ингредиентом. $\beta$ $a$ $\beta<1$

введите описание изображения здесь

— Pburg
источник

Я думаю , что это не может произойти с склонными к риску отправителей, риск нейтрального приемника и достаточно богатым. $A$

Например, и чтобы придерживаться модели канонической сигнализации, предположим, что - это положительная действительная линия, и полезность отправителей увеличивается, в время как у получателей линейная полезность уменьшается в . $A$ $u$ $a$ $a$

(Следует признать, что это только частичный ответ, так как структура гораздо менее общая, чем в вашем вопросе, поэтому она может быть неудовлетворительной для вас. Я все же приведу аргумент, если вы согласны с этими предположениями)

Чтобы получить противоречие, предположим , что при равновесном и для некоторого . Позволять $\sigma^m_R(a') > 0$ $\sigma^m_R(a'') > 0$ $a' \neq a'' \in A$

a^{‴} \equiv \frac{σ_{R}^{m} (a^{'})}{σ_{R}^{m} (a^{'}) + σ_{R}^{m} (a^{″})} a^{'} + \frac{σ_{R}^{m} (a^{″})}{σ_{R}^{m} (a^{'}) + σ_{R}^{m} (a^{″})} a^{″} .

$a''' \equiv \frac{\sigma^m_R(a')}{\sigma^m_R(a') + \sigma^m_R(a'') } a' + \frac{\sigma^m_R(a'')}{\sigma^m_R(a') + \sigma^m_R(a'') } a''.$

Отвращением к риску

u [a^{‴}] > \frac{σ_{R}^{m} (a^{'})}{σ_{R}^{m} (a^{'}) + σ_{R}^{m} (a^{″})} u (a^{'}) + \frac{σ_{R}^{m} (a^{″})}{σ_{R}^{m} (a^{'}) + σ_{R}^{m} (a^{″})} u (a^{″}) .

$u[ a''' ] > \frac{\sigma^m_R(a')}{\sigma^m_R(a') + \sigma^m_R(a'') } u(a') + \frac{\sigma^m_R(a'')}{\sigma^m_R(a') + \sigma^m_R(a'') } u(a'').$

[σ_{R}^{m} (a^{'}) + σ_{R}^{m} (a^{″})] u (a^{‴}) > σ_{R}^{m} (a^{'}) u (a^{'}) + σ_{R}^{m} (a^{″}) u (a^{″}) .

$[\sigma^m_R(a') + \sigma^m_R(a'')] u( a''' ) > \sigma^m_R(a') u(a') + \sigma^m_R(a'') u(a'').$

При некотором допущении преемственности также должно существовать

a^{⁗} < a^{‴}

$a '''' < a'''$

такой, что

[σ_{R}^{m} (a^{'}) + σ_{R}^{m} (a^{″})] u (a^{⁗}) = σ_{R}^{m} (a^{'}) u (a^{'}) + σ_{R}^{m} (a^{″}) u (a^{″}) .

$[\sigma^m_R(a') + \sigma^m_R(a'')] u( a'''' ) = \sigma^m_R(a') u(a') + \sigma^m_R(a'') u(a'').$

Итак, рассмотрим построенный следующим образом $\sigma^m_R{'}$

$\sigma^m_R{'}(a') = \sigma^m_R{'}(a'') = 0$ ,
$\sigma^m_R{'}(a'''') = \sigma^m_R(a'''') + [\sigma^m_R(a') + \sigma^m_R(a'')]$
Для всех остальных , $\tilde{a}$ $\sigma^m_R{'}(\tilde{a}) = \sigma^m_R(\tilde{a})$

Получатели предпочли бы чем если это не изменило сигналы, отправленные отправителями, потому что это предполагает более низкие ожидаемые компенсации. Но по построению отправители безразличны между и , поэтому они должны отправлять те же сигналы, что и в . Таким образом, не может быть равновесием, которое показывает, что у нас не может быть двух разных действий, сыгранных с положительной вероятностью в равновесии. $\sigma^m_R{'}$ $\sigma^m_R$ $\sigma^m_R{'}$ $\sigma^m_R$ $\sigma^m_R$ $\sigma^m_R$

— Мартин Ван дер Линден
источник

В этой модели получатель не всегда просто выбирает ?

a = 0

$a=0$

— Пбург

Я не обязательно это так. Если приемник всегда выбирает не имеет значения сигнала, она не типа «Стимулирование введения высоких» , чтобы выявить их тип корыта «высшего» сигнала. Это может быть оптимальным в равновесии объединения, но не в разделительном равновесии. См., Например, раздел 13.C Mas-Colell, Whinston и Green, хотя установка снова немного отличается от вашей (например, есть две фирмы, конкурирующие за работников разных типов)

a

$a$

— Martin Van der Linden

Что значит «получатель имеет линейную полезность, уменьшающуюся в»?

— Пбург

Извините, это было не очень понятно. В модели сигнализации Спенс, которую я имею в виду, действие, которое принимает получатель, заключается в выплате заработной платы w отправителю. Полезность получателя зависит от типа отправителя t минус заработная плата t − w. По сути, получатель нейтрален к риску: она заботится только об ожидаемой заработной плате, которую она должна будет заплатить, и об ожидаемом типе, который она будет использовать.

— Мартин Ван дер Линден,

Хорошо, я полагаю, я видел это как квадратичную потерю,Спасибо за предложение, хотя я ищу что-то более общее, но с дискретными действиями.

- (t - w)^{2} .

$-(t-w)^2.$

— Пбург