Этот недавний вопрос теории игр заставил меня задуматься (это, конечно, касательно): возможно ли эффективно оптимизировать личную стратегию выбора исследовательских вопросов для работы над теорией игр?
Чтобы перейти к формализации вопроса, я сделаю следующие (неофициально заявленные) предположения:
- Я также «наслаждаюсь» любой конкретной проблемой, над которой я могу работать (чтобы избежать «мягкого» (и правильного!) Ответа «Делай, что тебе нравится!»).
- Я могу или не могу быть успешным в поиске ответа на любую проблему, над которой я хочу работать. Для любой данной проблемы у меня есть некоторая оценка вероятности того, насколько хорошо я буду в решении проблемы (потратив на это время).
- Моя цель - максимизировать свою отдачу при оценке в дальнейшем (подача заявки на работу, подача заявки на пребывание в должности, подача заявки на стипендию и т. Д.), Которая зависит от того, сколько проблем я решаю и насколько важны или трудны проблемы. , У меня нет четкого представления о точных результатах по каждой проблеме, но я могу сделать разумную оценку.
- Существует слабая обратная связь между проблемой вознаграждения и проблемой сложности. Еще одним утверждением моей цели является «игра» различий (то есть поиск «низко висящих фруктов»).
- Пример этой общей проблемы определяется списком исследовательских вопросов (возможно, бесконечное число), к которым я твердо прикрепляю (без вычислительных затрат; он приводится в качестве входных данных) оценку ценности вопроса и сложности вопроса. Я играю в эту игру против противника (человека, который оценивает меня); природа решает, учитывая вероятность того, что я решу данную проблему, успешно ли я ее решу после того, как решу попробовать.
В попытке действительно формализовать происходящее (и обойти неинтересные или аргументированные / дискуссионные ответы), я буду рассматривать эту проблему как игру в расширенной форме с неполной информацией с бесконечным набором действий .
Вопрос : я предполагаю, что игры такого типа не являются эффективно вычисляемыми. Однако, есть ли алгоритм полиномиального времени, чтобы приблизительно максимизировать мою отдачу? Что насчет PTAS?
Или, альтернативно, есть более точная теоретико-игровая модель для этой проблемы? Если так, то остается тот же вопрос: могу ли я (приблизительно) максимально увеличить свою выплату? Если да, то как?