Am×nm≥nvAv1=argmaxv∈Rn∥Av∥2subject to ∥v∥2=1.(1)
v1Av2=argmaxv∈Rn∥Av∥2subject to ⟨v1,v⟩=0,∥v∥2=1.
v1,…,vnRnRnA
Пусть (поэтому количественно определяет взрывную силу в направлении ). Предположим, что единичные векторы определены так, что
Уравнения (2) могут быть кратко выражены с использованием матричной записи в виде
где - матрица , й столбец которой равен , - матрица чья столбец иσi=∥Avi∥2σiAviuiAvi=σiuifor i=1,…,n.(2)
AV=UΣ,(3)
Vn×niviUm×niuiΣэто диагональная матрица, й диагональный элемент которой равен . Матрица ортогональна, поэтому мы можем умножить обе части (3) на чтобы получить
Может показаться, что теперь мы вывели SVD из с почти нулевым усилием. Ни один из шагов до сих пор не был сложным. Однако важная часть картины отсутствует - мы еще не знаем, что ортогонально.n×niσiVVTA=UΣVT.
AU
Вот ключевой факт, отсутствующий фрагмент: оказывается, что ортогонален :
Я утверждаю, что если это не так, то не будет оптимальным для задачи (1). Действительно, если бы (4) не было выполнено, то можно было бы улучшить , немного его возмутив в направлении .Av1Av2⟨Av1,Av2⟩=0.(4)
v1 v1v2
Предположим (для противоречия), что (4) не выполняется. Если слегка возмущается в ортогональном направлении , норма не изменяется (или, по крайней мере, изменение нормы незначительно). Когда я иду по поверхности земли, мое расстояние от центра Земли не меняется. Однако, когда возмущается в направлении , вектор возмущается в неортогональном направлении , и поэтому изменение нормы является пренебрежимо малым . Нормаv1v2v1v1v1v2Av1Av2Av1Av1может быть увеличено на незначительную сумму. Это означает, что не является оптимальным для задачи (1), что противоречит. Мне нравится этот аргумент, потому что: 1) интуиция очень ясна; 2) интуиция может быть преобразована непосредственно в строгое доказательство.v1
Аналогичный аргумент показывает, что является ортогональным как к и к , и так далее. Векторы попарно ортогональны. Это означает, что единичные векторы могут быть выбраны попарно ортогональными, что означает, что матрица выше является ортогональной матрицей. Это завершает наше открытие СВД.Av3Av1Av2Av1,…,Avnu1,…,unU
Чтобы преобразовать приведенный выше интуитивный аргумент в строгое доказательство, мы должны учитывать тот факт, что если возмущен в направлении , возмущенный вектор
действительно не является единичным вектором. (Его норма .) Чтобы получить строгое доказательство, определите
Вектор действительно является единичным вектором. Но, как вы можете легко показать, если (4) не выполняется, то для достаточно малых значений имеем
(при условии, что знакv1v2v~1=v1+ϵv2
1+ϵ2−−−−−√v¯1(ϵ)=1−ϵ2−−−−−√v1+ϵv2.
v¯1(ϵ)ϵf(ϵ)=∥Av¯1(ϵ)∥22>∥Av1∥22
ϵвыбран правильно). Чтобы показать это, просто проверьте, что . Это означает, что не является оптимальным для задачи (1), что противоречит.f′(0)≠0v1
(Кстати, я рекомендую прочитать объяснение Qiaochu Юаня из СВДА здесь . В частности, обратите внимание на «Key лемме # 1», которая является то , что мы обсуждали выше. Как Qiaochu говорит, ключевая лемму # 1 является «техническим сердцем разложения по сингулярным числам ".)