У меня есть проблема с доказательством
E ( Y | X ) ∈ arg min g ( X ) E [ ( Y - g ( X ) ) 2 ]
E(Y|X)∈argming(X)E[(Y−g(X))2]
что, скорее всего, выявит более глубокое непонимание ожиданий и условных ожиданий.
Доказательство, которое я знаю, выглядит следующим образом (другую версию этого доказательства можно найти здесь )
arg min g ( X ) E [ ( Y - g ( x ) ) 2 ] = arg min g ( X ) E [ ( Y - E ( Y | X ) + E ( Y | X ) - g ( X ) ) 2 ] = arg min g ( x ) E [ ( Y-E(Y| X ) ) 2 + 2 ( Y - E ( Y | X ) ) ( E ( Y | X ) - g ( X ) ) + ( E ( Y | X ) - g ( X ) ) 2 ] = arg min g ( x ) E [ 2 ( Y - E ( Y | X ) ) ( E ( Y) | X ) - g ( X ) ) + ( E ( Y | X ) - g ( X ) ) 2 ]
Затем доказательство обычно продолжается аргументом, показывающим, что 2E[(Y−E(Y|X))(E(Y|X)−g(X))]=0
argming(x)E[(Y−g(x))2]=argming(x)E[(E(Y|X)−g(X))2]
который можно увидеть минимизированным, когда g(X)=E(Y|X)
Мои загадки по поводу доказательства следующие:
- Рассмотреть возможность
E[2(Y−E(Y|X))(E(Y|X)−g(X))+(E(Y|X)−g(X))2]
E[2(Y−E(Y|X))(E(Y|X)−g(X))+(E(Y|X)−g(X))2] .
Мне кажется, что независимо от любого аргумента, показывающего, что первый член всегда равен нулю, можно видеть, что установка g(X)=E(Y|X)
E[2(Y−E(Y|X))(E(Y|X)−g(X))+(E(Y|X)−g(X))2]=E(0+0)
E[2(Y−E(Y|X))(E(Y|X)−g(X))+(E(Y|X)−g(X))2]=E(0+0) = 0.
Но если это так, то можно повторить доказательство, заменив любой другой функцией , скажем, , и прийти к выводу, что именно минимизирует выражение. Так что должно быть что-то, что я неправильно понимаю (правильно?).E(Y|X)
- У меня есть некоторые сомнения относительно значения в постановке задачи. Как следует понимать обозначения? Значит ли этоE[(Y−g(X))2]
E[(Y−g(X))2]
EX[(Y−g(X))2]
EX[(Y−g(X))2] , или ?EY[(Y−g(X))2]EY[(Y−g(X))2] EXY[(Y−g(X))2]EXY[(Y−g(X))2]