Минимаксный принцип Яо об алгоритмах Монте-Карло

$P$ $\mathcal{X}$ $\mathcal{A}$ $P$ $\mathcal{D}$ $\mathcal{R}$ $\mathcal{A}$

min_{A \in A} E c o s t (A, D) \leq max_{x \in X} E c o s t (R, x) for all D and R .

$\min_{A\in\mathcal{A}}\quad\mathbb{E} cost(A,\mathcal{D}) \leq \max_{x\in\mathcal{X}}\quad\mathbb{E} cost(\mathcal{R},x) \quad\quad\text{for all $\mathcal{D}$ and $\mathcal{R}$}.$

В основном принцип Яо касается только алгоритмов Лас-Вегаса , но его можно обобщить на алгоритмы Монте-Карло следующим образом. где обозначает стоимость алгоритмов Монте-Карло, вероятность которых не .

\frac{1}{2} min_{A \in A} E c o s t_{2 ϵ} (A, D) \leq max_{x \in X} E c o s t_{ϵ} (R, x) for all D, R and ϵ \in [0, 1 / 2]

$\frac12 \min_{A\in\mathcal{A}}\quad\mathbb{E} cost_{2\epsilon}(A,\mathcal{D}) \leq \max_{x\in\mathcal{X}}\quad\mathbb{E} cost_{\epsilon}(\mathcal{R},x)\quad\quad\text{for all $\mathcal{D}$, $\mathcal{R}$ and $\epsilon\in [0,1/2]$}$

c o s t_{ϵ} (\cdot, \cdot)

$cost_\epsilon(\cdot,\cdot)$

ϵ

$\epsilon$

В оригинальной статье Яо соотношение для алгоритмов Монте-Карло дано в теореме 3 без доказательства. Любой намек на доказательство этого?

randomized-algorithms

— Федерико Магалланез
источник

Это просто расширенный комментарий к ответу Маркоса с использованием его записи. Я не совсем в состоянии следить за деталями его аргумента, и тот, что ниже, довольно короткий и простой.

\sum_{A} q (A) \sum_{x} d (x) ϵ (A, x) = \sum_{x} d (x) \sum_{A} q (A) ϵ (A, x) \leq λ .

$\sum_A{q(A)\sum_x{d(x)\epsilon(A, x)}} = \sum_x{d(x)\sum_A{q(A)\epsilon(A, x)}} \leq \lambda.$

Из приведенного выше факта и неравенства Маркова вытекает . $\sum_{A \in \beta(2\lambda)}{q(A)} \geq 1/2$

Итак, мы получаем:

\begin{aligned} max_{x} \sum_{A} q (A) r (A, x) & \geq \sum_{x} d (x) \sum_{A} q (A) r (A, x) \\ = \sum_{A} q (A) \sum_{x} d (x) r (A, x) \\ \geq \sum_{A \in β (2 λ)} q (A) \sum_{x} d (x) r (A, x) \\ \geq (\sum_{A \in β (2 λ)} q (A)) min_{A \in β (2 λ)} \sum_{x} d (x) r (A, x) \\ \geq \frac{1}{2} min_{A \in β (2 λ)} \sum_{x} d (x) r (A, x) \end{aligned}

$\begin{align*} \max_x \sum_A{q(A)r(A,x)} &\geq \sum_x{d(x)\sum_A{q(A)r(A, x)}}\\ &= \sum_A{q(A)\sum_x{d(x)r(A, x)}}\\ &\geq \sum_{A \in \beta(2\lambda)}{q(A)\sum_x{d(x)r(A, x)}}\\ &\geq \left(\sum_{A \in \beta(2\lambda)}{q(A)}\right) \min_{A \in \beta(2\lambda)}{\sum_x{d(x)r(A, x)}}\\ &\geq \frac{1}{2}\min_{A \in \beta(2\lambda)}{\sum_x{d(x)r(A, x)}} \end{align*}$

— Сашо Николов
источник

Я попробую это. Я собираюсь использовать оригинальную запись Яо. Таким образом, будет легче противопоставить его статью и его определения.

Пусть - конечный набор входных данных, и пусть - конечный набор детерминированных алгоритмов, которые могут не дать правильный ответ для некоторых входных данных. Пусть также если дает правильный ответ для , и противном случае. Также обозначим через количество запросов, сделанных на входе , или, что эквивалентно, глубину дерева решений $\mathcal{I}$ $\mathcal{A}_0$ $\epsilon(A,x)=0$ $A$ $x$ $\epsilon(A,x)=1$ $r(A,x)$ $A$ $x$ $A$

Средняя стоимость: учитывая распределение вероятности для , средняя стоимость алгоритма равна . $d$ $\mathcal{I}$ $A\in \mathcal{A}_0$ $C(A,d)=\sum_{x\in\mathcal{I}} d(x)\cdot r(A,x)$

Распределительная сложность: Пусть . Для любого распределения на входах пусть будет подмножеством заданным . Сложность распределения с ошибкой для вычислительной задачи определяется как , $\lambda\in[0,1]$ $d$ $\beta(\lambda)$ $\mathcal{A}_0$ $\beta(\lambda)=\{A : A\in \mathcal{A}_0, \sum_{x\in\mathcal{I}} d(x)\cdot \epsilon(A,x)\leq \lambda\}$ $\lambda$ $P$ $F_{1,\lambda}(P)=\max_{d} \min_{A\in \beta(\lambda)} C(A,d)$

$\lambda$ -толерантность: распределение в семействе является -толерантным, если . $q$ $\mathcal{A}_0$ $\lambda$ $\max_{x\in \mathcal{I}} \sum_{A\in\mathcal{A}_0} q(A)\cdot \epsilon(A,x)\leq \lambda$

Ожидаемая стоимость: для рандомизированного алгоритма пусть будет распределением вероятности, -толерантным к . Ожидаемая стоимость из для данного входа являются . $R$ $q$ $\lambda$ $\mathcal{A}_0$ $R$ $x$ $E(R,x)=\sum_{A\in \mathcal{A}_0} q(A)\cdot r(A,x)$

Рандомизированная сложность: пусть . Рандомизированная сложность с ошибкой равна . $\lambda\in[0,1]$ $\lambda$ $F_{2,\lambda}=\min_R \max_{x\in\mathcal{I}} E(R,x)$

Теперь мы готовы идти в бизнес. То, что мы хотим доказать, - это распределение на входах и рандомизированный алгоритм (т. Е. Распределение на ) $d$ $R$ $q$ $\mathcal{A}_0$

Минимаксный принцип Яо для алгоритмов Монте-Карло для .
$max_{x \in I} E (R, x) \geq \frac{1}{2} min_{A \in β (2 λ)} C (A, d)$ $\begin{equation}\max_{x\in\mathcal{I}} E(R,x)\geq \frac{1}{2}\min_{A\in \beta(2\lambda)} C(A,d) \end{equation}$ $\lambda\in[0,1/2]$

Я буду следовать подходу, данному Фичем, Мейером и Хайде, Рагде и Вигдерсоном (см. Лемму 4). Их подход не дает характеристики для алгоритмов Лас-Вегаса (только нижняя граница), но этого достаточно для наших целей. Из их доказательства легко увидеть, что для любых и $\mathcal{A}_0$ $\mathcal{I}$

Утверждение 1. . $\max_{x\in \mathcal{I}} E(R,x)\geq \min_{A\in \mathcal{A}_0} C(A,d)$

Чтобы получить правильные цифры там, мы сделаем что-то подобное. Учитывая, что распределение вероятностей заданное рандомизированным алгоритмом является толерантным к мы получаем, что Если мы заменим семейство на $q$ $R$ $\lambda$ $\mathcal{A}_0$

\begin{aligned} λ & \geq max_{x \in I} {\sum_{A \in A_{0}} q (A) \cdot ϵ (A, x)} \\ \geq \sum_{x \in I} d (x) \sum_{A \in A_{0}} q (a) \cdot ϵ (A, x) \\ = \sum_{A \in A_{0}} q (a) \sum_{x \in I} d (x) \cdot ϵ (A, x) \\ \geq min_{A \in A_{0}} {\sum_{x \in I} d (x) \cdot ϵ (A, x)} . \end{aligned}

$\begin{align*} \lambda &\geq \max_{x\in \mathcal{I}}\left\{ \sum_{A\in\mathcal{A}_0} q(A)\cdot \epsilon(A,x) \right\}\\ &\geq \sum_{x\in\mathcal{I}} d(x) \sum_{A\in \mathcal{A}_0} q(a)\cdot \epsilon(A,x)\\ &= \sum_{A\in \mathcal{A}_0} q(a)\sum_{x\in\mathcal{I}} d(x) \cdot \epsilon(A,x)\\ &\geq \min_{A\in \mathcal{A}_0}\left\{ \sum_{x\in\mathcal{I}} d(x) \cdot \epsilon(A,x) \right\}. \end{align*}$

A_{0}

$\mathcal{A}_0$

β (2 λ)

$\beta(2\lambda)$ Мы видим, что

\begin{aligned} λ & \geq max_{x \in I} {\sum_{A \in A_{0}} q (A) \cdot ϵ (A, x)} \\ \geq max_{x \in I} {\sum_{A \in β (2 λ)} q (A) \cdot ϵ (A, x)} \\ \geq \sum_{x \in I} d (x) \sum_{A \in β (2 λ)} q (a) \cdot ϵ (A, x) \\ = \sum_{A \in β (2 λ)} q (a) \sum_{x \in I} d (x) \cdot ϵ (A, x) \\ \geq min_{A \in β (2 λ)} {\frac{1}{2} \sum_{x \in I} d (x) \cdot ϵ (A, x)}, \end{aligned}

$\begin{align*} \lambda &\geq \max_{x\in \mathcal{I}}\left\{ \sum_{A\in\mathcal{A}_0} q(A)\cdot \epsilon(A,x) \right\}\\ &\geq \max_{x\in \mathcal{I}}\left\{ \sum_{A\in\beta(2\lambda)} q(A)\cdot \epsilon(A,x) \right\}\\ &\geq \sum_{x\in\mathcal{I}} d(x) \sum_{A\in \beta(2\lambda)} q(a)\cdot \epsilon(A,x)\\ &= \sum_{A\in \beta(2\lambda)} q(a)\sum_{x\in\mathcal{I}} d(x) \cdot \epsilon(A,x)\\ &\geq \min_{A\in \beta(2\lambda)}\left\{ \frac{1}{2}\sum_{x\in\mathcal{I}} d(x) \cdot \epsilon(A,x) \right\}, \end{align*}$

где следует второе неравенство, потому что , а последнее неравенство дается определением где сумма, деленная на 2, не может быть больше, чем . Следовательно, $\beta(2\lambda) \subseteq \mathcal{A}_0$ $\beta(2\lambda)$ $\lambda$

max_{x \in I} {\sum_{A \in A_{0}} q (A) \cdot ϵ (A, x)} \geq \frac{1}{2} min_{A \in β (2 λ)} {\sum_{x \in I} d (x) \cdot ϵ (A, x)} .

$\begin{equation}\max_{x\in \mathcal{I}}\left\{ \sum_{A\in\mathcal{A}_0} q(A)\cdot \epsilon(A,x) \right\}\geq\frac{1}{2} \min_{A\in \beta(2\lambda)}\left\{ \sum_{x\in\mathcal{I}} d(x) \cdot \epsilon(A,x) \right\}. \end{equation}$

Отметив, что отображается на а отображается на и п. 1 выше, теперь мы можем смело заменить функцию в вышеприведенном неравенстве на чтобы получить желаемое неравенство. $\epsilon$ $\{0,1\}$ $r$ $\mathbb{N}$ $\epsilon$ $r(A,x)$

— Маркос Вильягра
источник

Есть ли краткое объяснение, откуда взялся фактор 2?

— Робин Котари

короче говоря, это происходит от определения . Суммирование в определении, деленное на 2, не более .

β (2 λ)

$\beta(2\lambda)$

λ

$\lambda$

— Маркос Вильягра

что-то кажется мне странным. по определению, так почему мин?

max_{A \in β (2 λ))} {\frac{1}{2} \sum_{x \in I} d (x), ϵ (A, x)} \leq λ

$\max_{A \in \beta(2\lambda))} \left\{\frac{1}{2} \sum_{x \in \mathcal{I}}{d(x), \epsilon(A,x)}\right\} \leq \lambda$

— Сашо Николов

и я не понимаю последнее предложение. как вы сделали полный аргумент о а затем заменили его на ?

ϵ

$\epsilon$

r

$r$

— Сашо Николов

Что касается вашего первого вопроса, я добавил более подробную информацию.

— Маркос Вильягра