Источники для алгоритмической эволюционной теории игр


15

Я использую заглавный термин в очень свободном смысле.

Существует значительный объем работ по эволюционной теории игр, включая ее математические основы. Мне порекомендовали «Эволюционные игры и динамика населения», но я еще не углубился в это.

Существует также значительный объем работ по теории алгоритмических игр, которая является популярной темой на этом сайте.

То, что я хотел бы видеть, это работа, которая делает вычислительную сложность или заявления о сходимости относительно определенной эволюционной динамики.

Примеры (сформулированы очень свободно):

  1. Учитывая популяцию и эволюционную схему, можем ли мы дать вероятностное сожаление, связанное с долгосрочной оптимальностью популяции (по сравнению с лучшим произведенным человеком?). Похоже, это тесно связано с группами экспертов и проблемами бандитов. А как насчет нестационарных настроек?
  2. Учитывая набор популяций различных видов, которые взаимодействуют в своей среде, играя практически в любую многопользовательскую игру, какие заявления мы можем сделать о возможной стабильности их стратегий или распределений стратегий, учитывая их эволюционные стратегии.
  3. В любой среде со многими «нишами» (насколько я понимаю, это слишком широкое выражение, либо с точки зрения прямой связи с окружающей средой, либо с точки зрения отношений с другими видами), какие заявления мы можем сделать о том, как будут распределяться популяции? через эти ниши.
  4. Любая проблема, которую я не задавал, но должен - я приду к этому с небольшим AGT, TCS, Генетическими Алгоритмами, эволюционной теорией игр или биологией популяции; Я задаю свои вопросы с точки зрения оптимизации / машинного обучения / статистики, которые могут быть неправильными или неполными.

Ответы:


11

Это одна из тем, где я долго искал связи. Тем не менее, они не кажутся распространенными. Люди, работающие над теоретической биологией и экономикой, которые используют EGT, обычно придерживаются теории динамических систем и не надевают алгоритмический объектив. Таким образом, большинство результатов имеют стиль AMath / Physics, а не алгоритмы и стиль дискретной математики. Если вы хотите использовать динамический системный подход, то проведите опрос Хофбауэра и Зигмунда, который короче и свежее, чем их книга (я упоминаю об этом и некоторые мимолетные комментарии в предыдущем ответе ).

Одним из мест, где динамика репликатора использовалась в результатах, связанных со сложностью, является Марчелло Пелилло и соавторы в качестве эвристики для решения max-clique (приведение max-clique к квадратичному программированию, решение квадратичного программирования с использованием динамики репликатора в качестве эвристики) :

[1] Иммануил М. Бомзе и Марчелло Пелилло [2000]. «Приближение клики максимального веса с использованием динамики репликатора». Транзакции IEEE в нейронных сетях 11 (6)

[2] Марчелло Пелилло и Андреа Торселло [2006]. «Динамика выигрышно-монотонной игры и проблема максимальной клики». Нейронные вычисления 18: 1215-1258.

Σ2пΣ2п

[3] Kousha Etessami и Andreas Lochbihler [2008] «Вычислительная сложность эволюционно устойчивых стратегий». Международный журнал теории игр , 37 (1): 93-113. (Впервые доступно в 2004 году как технический отчет ECCC TR04-055).

[4] Винсент Конитцер [2013] «Точная вычислительная сложность эволюционно устойчивых стратегий». 9-я конференция по сети и интернет-экономике (WINE) . ( pdf )

Сегодня многие интересные вопросы о EGT касаются игр на графиках, и хотя есть некоторые интересные динамические результаты системы, например (см. Также этот вопрос для расширений этого подхода):

[5] Хисаши Охцуки и Мартин Новак [2006] «Уравнение репликатора на графах». _ Журнал теоретической биологии_, 243 (1), 86-97 ( ссылка , пост в блоге )

Большая часть работы проходит через агентное моделирование (см. Этот ответ для контекста моделирования распространения болезни). Эти модели, как правило, гораздо более привлекательны для заявлений о сложности и сходимости. Посмотрите на следующую книгу для получения дополнительной информации:

[6] Йоав Шохам и Кевин Лейтон-Браун [2009], «Многоагентные системы: алгоритмические, теоретико-игровые и логические основы», издательство Кембриджского университета.

Я думаю, что машинное обучение - это довольно простой способ приблизиться к EGT, поскольку это естественный промежуточный пункт между соответствующей физикой (статистической механикой) и информатикой. Это определенно было сделано, мне потребовалось бы немного времени, чтобы найти хорошую ссылку, но случайную ссылку (которая также показывает, что люди EGT рассматривали другие популярные концепции равновесия, такие как коррелированное равновесие):

[7] Серджиу Харт и Андреу Мас-Колелл [2000], «Простая адаптивная процедура, приводящая к коррелированному равновесию», Econometrica 68 (5): 1127-1150

[8] Антонелла Янни [2001], «Изучение коррелированных равновесий в популяционных играх», Математические социальные науки 42 (3): 271-294.

[9] Людек Циглер и Бои Фалтингс [2011], «Достижение коррелированного равновесия посредством многоагентного обучения», AAMAS 2011: 509-516

Я определенно надеюсь, что другие дадут более конкретные ответы, так как это вопрос, о котором я всегда хотел узнать больше.


5

Как уже говорили другие, есть меньше, чем вы ожидаете. Пара касательно связанных статей:

«Мультипликативные веса в координационных играх и теория эволюции» Шастена, Ливната, Пападимитриу и Вазирани. В этой статье утверждается, что эволюционная динамика (в простой модели) эквивалентна координационной игре между генами, в которую играет алгоритм изучения мультипликативных весов. Они анализируют вариант 2 генов в упрощенной модели.

Обратите внимание, что алгоритм мультипликативных весов является естественной динамикой, о которой известно, что она сходится к равновесию по Нэшу в играх с нулевой суммой, играх с неатомным потенциалом и некоторых других (см., Например, Фрейнда и Шапира ).

«Цена стохастической анархии» Чанга, Лигетта, Пруса и меня (некоторое время назад). Здесь мы изучаем стохастически устойчивые состояния игры, связанные с ESS. Нас не беспокоит сложность их поиска, но мы показываем, что в некоторых играх цена анархии ниже, чем набор стохастически устойчивых равновесий, по сравнению с произвольными равновесиями Нэша.


Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.