Объяснение смешанных стратегий для игр с одним выстрелом


13

В классическом введении в теорию некооперативных игр смешанная стратегия для игрока преподается как распределение по пространству стратегии для игрока. Распределение по существу дает нам вероятности (скажем, набор дискретных стратегий), с которыми игрок должен играть стратегии в равновесии Нэша.

Однако вероятности несут понятие частотности, и они по существу означают долгосрочную долю игр, в которых игрок должен играть в стратегию. Однако настройка - это игра в один выстрел, и это противоречие.

Как нам разрешить противоречие, объясняя, что такое смешанная стратегия?


2
Это не противоречит тому, кто принимает склонность к интерпретации вероятности, которая рассматривает долгосрочное поведение как проявление вероятностей единичного случая.
Пбург

Ответы:


11

Ариэль Рубинштейн имеет тенденцию быть проницательным в отношении таких вопросов.

Он рассматривает интерпретацию смешанных стратегий в разделе 3 этой статьи.

Несколько возможных интерпретаций помимо преднамеренной рандомизации:

  1. Очистка. Смешанная стратегия - это план действий, основанный на информации, не указанной в модели.
  2. Вымышленная долгосрочная история.
  3. Средняя численность населения, так что представьте, что игрока вытягивают из некоторого распределения населения, где разные типы играют разные чистые стратегии. Распределение населения - это смешанная стратегия распределения.

Интересная цитата о игрок «s смешанная стратегия отражает неопределенность среди » ы относительно того, что буду делать:я-яя

Смешанная стратегия может также рассматриваться как убеждение всех других игроков в отношении действий игрока. Тогда равновесие смешанной стратегии - это n-ряд общих ожиданий знаний, обладающих тем свойством, что все действия, которым присваивается строго положительная вероятность, являются оптимальными, учитывая убеждения. Поведение игрока может восприниматься всеми другими игроками как результат случайного устройства, даже если это не так. Принятие этой интерпретации требует переоценки большей части прикладной теории игр. В частности, это подразумевает, что равновесие не приводит к предсказанию (статистическому или иному) поведения игроков. Любое действие игрока, которое является лучшим ответом, учитывая его ожидания относительно других игроков поведение (другие n - 1 стратегии) ​​является последовательным в качестве предсказания для действия i (это может включать действия, которые находятся за пределами поддержки смешанной стратегии). Это лишает смысла какой-либо сравнительный статический анализ или анализ благосостояния равновесия смешанной стратегии и ставит под сомнение огромную экономическую литературу, в которой используется равновесие смешанной стратегии.


6

Пусть обозначает стратегию, которая придает вероятности игре , и пусть - множество таких стратегий, которые приводят к равновесию в симметричная игра для двух игроков.sязнак равно{пAя,пВя}A,Вsзнак равно{sя,sя}я

Как вы говорите, мы думаем, что - это вероятности, с которыми выполняется конкретное действие. Всякий раз, когда не одноэлементный, мы имеем множественные равновесия, что не нравится большинству отраслей экономики, потому что это затрудняет решение моделей, а с неединственностью трудно работать: как мы должны моделировать модель? Какое из равновесий на самом деле играется?sяs

По крайней мере, в случае равновесия со смешанной стратегией мы знаем вероятность возникновения каждого из равновесий. Вам не нравятся вероятности в той степени, в которой они несут частоты, что, как вы говорите, противоречит представлению о том, что игра одноразовая.

Одновременно, однако, игра в один выстрел не означает, что в игру играют только один раз. В мире с множеством людей каждый может найти партнера и сыграть одну из стратегий в , если мы (одновременно!) Найдем из них в равновесии , а доля лиц, играющих в следующем равновесии и т. д.sпA{A,A}пВ

Не симулятивно В качестве альтернативы вы можете утверждать, что в мире с большой анонимностью люди забывают партнеров, с которыми они играли раньше. У нас есть много людей , играющих в стратегии в момент времени , то мы де-пара их, дать всем новым партнерам и позволить им играть снова. Даже если есть возможность снова встретиться с тем же парнем: поскольку эта возможность сводится к нулю, вы можете смоделировать это как повторную игру с коэффициентом дисконтирования .sTδ0

Отсутствие обязательств Наконец, подумайте о ситуациях, которые на самом деле являются повторяющимися играми, такими как взаимодействие между правительством и потребителями. Хотя это можно смоделировать как повторяющуюся игру, мы можем подумать, что правительство не в состоянии принять стратегическую последовательность. Поэтому вместо того, чтобы моделировать это как повторяющуюся игру, мы моделируем ее как повторы равновесия в один : учитывая временной горизонт , мы увидим, что времени, правительство и потребители играют в равновесие и т. Д.TTпA{A,A}


2

Это дополнение цитаты Пбурга:

Одно из представлений Ауманна и Бранденбургера (1995) заключается в том, что смешанная стратегия только в глазах противников. В игровой игре множество состояний мира S : = × i N S i . Для состояния s S оно удовлетворяет следующей спецификации:NSзнак равно×яNSяsS

  1. яπя:SSяяяsяπя-1(sя)πя-1(sя)sя
  2. Aяяaя:SAяaя|πя-1(sя)
  3. яграммяaяграмм(s):Aрsπя-1(sя)sя

1

Что ж, вот мой шанс ответить, следуя этой статье по физике http://bayes.wustl.edu/etj/articles/prob.in.qm.pdf, Я думаю, что склонность - хорошая интерпретация смешанных стратегий, но более формально мы должны сказать, что она отражает невежество моделиста. Мы говорим, что все идет, на самом деле все стратегии могут быть приняты (если поддержка везде положительная), но концепция решения говорит, что некоторые из них более вероятны. Вероятности здесь измеряют невежество моделиста и являются результатом недостатка информации теоретика игры об игре. Чтобы прояснить это представление о расширенном наборе данных, в котором мы знаем дополнительную информацию об игре, скажем, мы разговариваем с одним из игроков, он уверяет нас, что он выберет одну стратегию, несмотря ни на что, тогда мы можем сделать более точный прогноз в форма чистой стратегии. Частоты возникают, когда мы думаем об игре как о типичной игре,


0

Это относится не ко всем играм, но есть также ситуации, в которых (по крайней мере, некоторые из) игроки фактически используют устройства рандомизации в играх, которые можно рассматривать как одноразовые. Здесь распределения вероятностей - это не частоты, а распределения, используемые устройством рандомизации. Любое равновесие смешанной стратегии является тогда равновесием в предварительном смысле (хотя игроки могут очень хорошо извлечь из устройства рандомизации один раз, и не может быть никакого смысла в том, что исходная ситуация является равновесием).

Примеры включают в себя:

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.