Вывод Negentropy. Застрять


13

Итак, этот вопрос несколько сложен, но я старательно пытался сделать его как можно более простым.

Цель: Короче говоря, есть происхождение негэнтропии, которое не связано с кумулянтами более высокого порядка, и я пытаюсь понять, как это было получено.

Фон: (Я все это понимаю)

Я самостоятельно изучаю книгу «Анализ независимых компонентов» , найденную здесь. (Этот вопрос из раздела 5.6, если у вас есть книга - «Приближение энтропии неполиномиальными функциями»).

У нас есть , который является случайной величиной и чью негэнтропию мы хотим оценить, исходя из некоторых наблюдений, которые мы имеем. PDF от x определяется как p x ( ζ ) . Негентропия - это просто разница между дифференциальной энтропией стандартизированной гауссовской случайной величины и дифференциальной энтропией x . Дифференциальная энтропия здесь дается H , такой что:xxpx(ζ)xH

H(x)=px(ζ)log(px(ζ))dζ

и так, негэнтропия дается

J(x)=H(v)H(x)

где - стандартизированное гауссово rv, где PDF задается как ϕ ( ζ ) .vϕ(ζ)

Теперь, как часть этого нового метода, моя книга вывела оценку PDF для формуле:x

px(ζ)=ϕ(ζ)[1+iciFi(ζ)]

(Где . Кстати, i - это не степень, а индекс).ci=E{Fi(x)}i

Пока я «принимаю» эту новую формулу PDF и спрошу об этом в другой день. Это не моя главная проблема. Что он делает сейчас, так это вставляет эту версию PDF-файла обратно в уравнение негэнтропии и в итоге получает :x

J(x)12iE{Fi(x)}2

Имейте в виду, сигма (здесь и для остальной части поста), просто зацикливается вокруг индекса . Например, если бы у нас было только две функции, сигнал был бы зациклен для i = 2 и i = 2 . Конечно, я должен рассказать вам о тех функциях, которые он использует. Таким образом, очевидно, что эти функции F i определены следующим образом:ii=2i=2Fi

Функции в этом случае не являются полиномиальными функциями. (Мы предполагаем, что rv x является нулевым средним и имеет единичную дисперсию). Теперь давайте сделаем некоторые ограничения и дадим свойства этих функций:Fix

Fn+1(ζ)=ζ,cn+1=0

Fn+2(ζ)=ζ2,cn+1=1

Для упрощения расчетов, давайте сделаем еще один, чисто техническое предположение: Функции , сформировать ортонормированную систему, как таковую:Fi,i=1,...n

ϕ(ζ)Fi(ζ)Fj(ζ)dζ={1,if i=j0,if ij

и

ϕ(ζ)Fi(ζ)ζkd(ζ)=0,for k=0,1,2

Почти готово! ОК, так что все это было фоном, а теперь по вопросу. Задача состоит в том, чтобы просто поместить этот новый PDF в формулу дифференциальной энтропии . Если я пойму это, я пойму все остальное. Теперь в книге дается вывод (и я с этим согласен), но я застрял ближе к концу, потому что я не знаю / не вижу, как это отменяется. Кроме того, я не знаю, как интерпретировать запись о-о из разложения Тейлора.H(x)

Это результат:

Используя разложение Тейлора , для H ( x ) получаем:(1+ϵ)log(1+ϵ)=ϵ+ϵ22+o(ϵ2)H(x)

H(x)=ϕ(ζ)(1+ciFi(ζ))(log(1+ciFi(ζ)+log(ζ))d(ζ)=ϕ(ζ)log(ζ)ϕ(ζ)ciFi(ζ)log(ϕ(ζ))ϕ(ζ)[ciFi(ζ)+12(ciFi(ζ))2+o((ciFi(ζ))2)]

и так

Вопрос: (я не понимаю этого)

H(x)=H(v)0012ci2+o((ci)2

Итак, моя проблема: за исключением , я не понимаю, как он получил последние 4 слагаемых в последнем уравнении. (т. е. 0, 0 и 2 последних члена). Я все понимаю до этого. Он говорит, что он использовал отношения ортогональности, данные в свойствах выше, но я не понимаю, как. (Я также не понимаю здесь маленькую нотацию, в том смысле, как она используется?)H(v)

БЛАГОДАРНОСТЬ!!!!

РЕДАКТИРОВАТЬ:

Я пошел дальше и добавил изображения из книги, которую я читаю, это в значительной степени говорит о том, что я сказал выше, но на всякий случай кому-то нужен дополнительный контекст.

введите описание изображения здесь введите описание изображения здесь введите описание изображения здесь

ci2


1
logϕ(x)

@cardinal Хорошо, исправил опечатку, спасибо. При этом, мне не ясно, как он выполняет отмену. Кстати, я добавил реальные изображения из самой книги.
Спейси

2
Честно говоря, я понятия не имею, как и почему это было перенесено с математического сайта. Во всяком случае, я счастлив иметь его здесь, где он одинаково дома. Вы вложили много усилий в вопрос. :-)
кардинал

2
@cardinal Мне так приятно слышать, что ты так говоришь. :-) Да, надеюсь, эти инвестиции для самообучения когда-нибудь окупятся. ;-)
Spacey

2
Это будет, @ Мохаммед, это будет! ICA тоже очень интересная тема :-).
Нестор

Ответы:


9

ci

ci=p0(ξ)Gi(ξ)dξ.
ξξci ).

>> Чтобы получить нулевые условия:

φ(ξ)=exp(ξ2/2)/2πlogφ(ξ)

logφ(ξ)=ξ2/2log2π.
ciφ(ξ)Gi(ξ)logφ(ξ)=12ciφ(ξ)Gi(ξ)ξ2log2πciφ(ξ)Gi(ξ),   (1)
where I have dropped the constants outside the integrals.

From here, note that in (5.39) it is stated that φ(ξ)Fi(ξ)ξk is 0 for k=0,1,2. The integral on the first term in the right of eq. (1) is of this form (with k=2) and the integral in the second term too, (with k=0). You just have to exploit this fact on the sums and you are done!

>> To obtain the ci2 terms:

Note that the integral to be obtained to obtain these terms is:

φ(ξ)(i=1nciGi(ξ))2dξ.
We can use the multinomial theorem to expand the squared sum. This gives us:
φ(ξ)k1+k2+...kn=22!k1!k2!...kn!1tn(ctGt(ξ))ktdξ.
However, from (5.39) again, note that all the terms in this sum which include integrals for the form
φ(ξ)Gi(ξ)Gj(ξ)dξ
are zero for ij and one for i=j. This leave us with the result
φ(ξ)(ciGi(ξ))2dξ=ci2.

>> About the o(whatever) notation

I think this is pretty confusing from the authors, but I recall that they use it just to mean that there are terms of order whatever every time they put o(whatever) (i.e., just like the big-O notation). However, as @Macro commented on this same answer, there is a difference between the big-O notation and the little-O one. Maybe you should check by yourself and see which one suits the problem in this Wikipedia article.

PS: This is a great book by the way. The papers of the authors on the subject are also very good and are a must read if you are trying to understand and implement ICA.


1
(+1) Good answer. If the sums are infinite, we have to be more careful about interchanging them with the integral. If they are finite (as the OP suggests, but I did not look at the images closely) then everything is straightforward, as you've shown. :-)
cardinal

Ah yes! Thank you Nestor, but what about the last two results, that is, the summation with the ci2, and summation with the small-o notation part?
Spacey

1
@cardinal: Oh yes! They ARE finite (I don't know why I wrote they where infinite...). I changed that on my answer.
Néstor

@Mohammad, I'm writing on my answers your other two questions ;-).
Néstor

1
@Néstor, +1 to this answer but re: your last comment, I think there is a distinction between big-O and little-o notation.
Macro
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.