Допустим, мы находимся в дискретном вероятностном пространстве, так что . Интуитивно вам нужна некоторая функция чтобы вы могли оптимизировать . Вы можете оптимизировать только одну цель! U : R n → R U ( f ( x ) )f(x)∈RnU:Rn→RU(f(x))
Оптимизация одной целевой функции может показаться довольно сдерживающей, но это не так ! Скорее одна цель может представлять невероятно разнообразные предпочтения, которые вы можете иметь перед тем, что является лучшим или худшим решением.
Забегая вперед, можно начать с простого выбора случайной величины затем решить:λ
E[f(x)]
minimize (over x)subject toE[λf(x)]x∈X
Это простое линейное повторное взвешивание . В любом случае, вот аргумент, почему объединение нескольких целей в одну цель обычно нормально.
E[f(x)]
Базовая настройка:
- У вас есть выбор переменной и допустимое множество .хxX
- Ваш выбор приводит к случайному результату˜ y = f ( x )xy~=f(x)
- У вас есть рациональные предпочтения над случайным исходом. (По сути, вы можете сказать, предпочитаете ли вы один случайный результат другому.)~ у≺y~
Ваша проблема состоит в том, чтобы выбрать , чтобы:x∗∈X
∄x∈Xf(x∗)≺f(x)
На английском языке вы хотите выбрать так что никакой выполнимый выбор приведет к результату, предпочтительнее ,
x∗xf(x∗)
Эквивалентность максимизации полезности (при определенных технических условиях)
Для технической простоты я скажу, что мы находимся в дискретном вероятностном пространстве с исходами, поэтому я могу представить случайный результат с вектором .ny~y∈Rn
При определенных технических условиях (которые не являются ограничивающими в практическом смысле) вышеуказанная проблема эквивалентна максимизации функции полезности . (Функция полезности назначает более предпочтительным результатам большее число.)U(y)
Эта логика применима к любой проблеме, когда ваш выбор приводит к множеству переменных результата.
maximize (over x)subject toU(f(x))x∈X
Предоставление большей структуры функции полезности : Гипотеза ожидаемой полезности :U
Если мы находимся в вероятностной обстановке и принимаем аксиомы Неймана-Моргернстерна , общая функция полезности должна принимать особый вид:U
U(y)=E[u(yi)]=∑ipiu(yi)
где - вероятность состояния а - вогнутая функция полезности. Кривизна измеряет неприятие риска. Просто подставив эту специализированную форму вы получите:
piiuuU
maximize (over x)subject to∑ipiu(yi)x∈Xy=f(x)
Заметьте, что простой случай максимизирует ожидаемое значение (то есть отсутствие неприятия риска).u(yi)=yi
Другой подход: весλ
Еще одна вещь, которую нужно сделать:
maximize (over x)subject to∑iλiyix∈Xy=f(x)
Интуитивно вы можете выбрать веса , которые больше или меньше вероятности возникновения состояния , и это отражает важность состояния.p iλipi
Более глубокое обоснование этого подхода состоит в том, что при определенных технических условиях существуют лямбда-веса , так что вышеуказанная проблема и более ранние проблемы (например, максимизация ) имеют одно и то же решение.U ( f ( x ) )λU(f(x))