Безопасное применение итерационных методов на диагонально-доминантных матрицах

Предположим, что задана следующая линейная система

\begin{matrix} (1) & L x = c, \end{matrix}

$Lx=c,\tag1$ где представляет собой взвешенное лапласиан , как известно, положительно определенной с одномерным нуль - пространство , натянутое на , а перевод дисперсия , т. е. не меняет значение функции (производная которой ). Единственные положительные элементы в находятся на его диагонали, которая является суммой абсолютных значений отрицательных недиагональных элементов.

L

$L$

s e m i -

$semi-$

1_{n} = (1, \dots, 1) \in R^{n}

$1_n=(1,\dots,1)\in\mathbb{R}^n$

x \in R^{n}

$x\in\mathbb{R}^{n}$

x + a 1_{n}

$x+a1_n$

(1)

$(1)$

L

$L$

Я обнаружил в одной высоко цитируемой научной работе в этой области, что, хотя является диагонально доминирующим, такие методы, как Conjugate Gradient, Gauss-Seidl, Jacobi, все еще можно безопасно использовать для решения . Обоснование состоит в том, что из-за инвариантности перевода можно безопасно зафиксировать одну точку (например, удалить первую строку и столбец и первую запись из ), тем самым преобразовав в диагонально доминирующую матрицу. В любом случае, исходная система решается в полной форме с . $L$ $not~strictly$ $(1)$ $L$ $c$ $L$ $strictly$ $(1)$ $L\in\mathbb{R}^{n\times n}$

Верно ли это предположение, и, если да, каково альтернативное обоснование? Я пытаюсь понять, как сближение методов все еще держится.

Если метод Якоби сходится с $(1)$ Что можно сказать о спектральном радиусе? $\rho$ итерационной матрицы $D^{-1}(D-L)$ , где $D$ диагональная матрица с записями $L$ по диагонали? Является $\rho(D^{-1}(D-L)\leq1$ Таким образом, отличается от общих гарантий сходимости для $\rho(D^{-1}(D-L))<1$ ? Я спрашиваю это, так как собственные значения матрицы Лапласа $D^{-1}L$ с теми, которые по диагонали должны быть в диапазоне $[0, 2]$ ,

Из оригинальной работы:

......................................

На каждой итерации мы вычисляем новый макет (x (t +1), y (t + 1)), решая следующую линейную систему:

\begin{matrix} (8) & L \cdot x (t + 1) = L (x (t), y (t)) \cdot x (t) L \cdot y (t + 1) = L (x (t), y (t)) \cdot y (t) \end{matrix}

$L · x(t + 1) = L(x(t),y(t)) · x(t) \\ L · y(t + 1) = L(x(t),y(t)) · y(t) \tag 8$ Без потери общности мы можем зафиксировать местоположение одного из датчиков (используя степень перемещения локализованного напряжения) и получить строго диагонально доминирующую матрицу. Поэтому мы можем смело использовать итерацию Якоби для решения (8)

.......................................

Выше понятие «итерация» относится к базовой процедуре минимизации, и ее не следует путать с итерацией Якоби. Итак, система решается Якоби (итеративно), и затем решение покупается в правой части (8), но теперь для другой итерации базовой минимизации. Я надеюсь, что это проясняет вопрос.

Обратите внимание, что я нашел Какие итерационные линейные решатели сходятся для положительных полуопределенных матриц? , но ищу более сложный ответ.

— Usero
источник

Не могли бы вы опубликовать ссылку или ссылку на цитируемую работу?

— Джефф Оксберри

Его можно получить по адресу : citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.164.1421. Поскольку вы не должны читать всю работу, посмотрите на стр.7 (внизу). Я полагаю, что выбор итерационных решателей оправдан, но я считаю, что требуется лучшее (или, по крайней мере, другое) обоснование.

— Usero

Интересно, являются ли эти ребята из того же сообщества, что и комбинаторные прекондиционеры?

— shuhalo

Ответы:

Итерация Якоби может быть доказана сходящейся.

Первое, что вы должны убедиться, что $c^T \mathbf{1}_n = 0$ , что является условием существования решения (полагаю $L=L^T$ иначе тебе нужно $c\in (\mathrm{Ker} L^T)^\perp$ ) потому что ты сказал $V_0:=\mathrm{Ker} L = \mathrm{span}\{\mathbf{1}_n\}$ , Мы будем использовать соглашение, которое $V_0$ также является матрицей со столбцами, являющимися ее ортонормированной основой. В твоем случае, $V_0:=\mathbf{1}_n/\sqrt{n}$ ,

Тогда для ошибок итерации Якоби в исходной системе вы

e_{1} = (I - D^{- 1} L) e_{0} = (I - D^{- 1} L) (P e_{0} + V_{0} a) = (I - D^{- 1} L) P e_{0} + V_{0} a,

$e_1 = (I-D^{-1}L)e_0 = (I-D^{-1}L) (P e_0 + V_0a)=(I-D^{-1}L) P e_0 + V_0a,$ где

P := I - V_{0} V_{0}^{'}

$P:=I-V_0V_0'$ это ортогональная проекция на

V_{1} := V_{0}^{⊥}

$V_1:=V_0^\perp$ , Из приведенной выше итерации мы знаем, что

P e_{1} = P (I - D^{- 1} L) P e_{0},

$P e_1 = P (I-D^{-1}L) P e_0,$
из которой у нас есть итерационная матрица

S

$S$ в

V_{1}

$V_1$ ,

S := P (I - D^{- 1} L) P .

$S: = P (I-D^{-1}L) P.$ Не то

S

$S$ имеет одинаковые спектры (кроме нулей) со следующей матрицей

\tilde{S} := (I - D^{- 1} L) P P = (I - D^{- 1} L) P = (I - D^{- 1} L) (I - V_{0} V_{0}^{'}) = I - D^{- 1} L - V_{0} V_{0}^{'} .

$\tilde{S}:= (I-D^{-1}L) P P=(I-D^{-1}L) P=(I-D^{-1}L)(I-V_0V_0')\\ =I-D^{-1}L-V_0V_0'.$ Мы хотим, чтобы спектральный радиус

S

$S$ меньше, чем один, чтобы доказать сходимость.

Следующая цитата старая и хранится только для справки. Смотрите после для нового доказательства.

В твоем случае, $V_0V_0'=\frac{1}{n}\mathbf{1}_{n\times n}.$ И вы можете убедиться, что $D^{-1}L+V_0V_0'$ строго по диагонали с использованием предположения, что записи $L$ положительны по диагонали и отрицательны в противном случае. Чтобы показать собственные значения $D^{-1}L+V_0V_0'$ реальны, отметим, что матрица самосопряжена относительно внутреннего произведения $<x,y>:=y^TDx.$

Если $V_0$ не в вашей конкретной форме, я не нашел ответа на вопрос о конвергенции. Может кто-то это прояснить?

Обратите внимание, что $V_0$ собственный вектор, соответствующий собственному значению $1$ из $I-D^{-1}L$ , Основываясь на наблюдении, мы называем теорему 2.1 из собственных значений обновленных матриц ранга 1 с некоторыми приложениями Джиу Дина и Ай-Хуэй Чжоу.

Теорема 2.1 Пусть $u$ а также $v$ быть двумя $n$ векторы столбцов такие, что $u$ является собственным вектором $A$ связано с собственным значением $\lambda_1$ , Тогда собственные значения $A+uv^T$ находятся $\{\lambda_1+u^Tv,\lambda_2,\ldots,\lambda_n\}$ считая алгебраическую кратность.

Тогда мы знаем, что спектры $\tilde{S}$ такой же как $I-D^{-1}L$ кроме того, что собственное значение $1$ в последнем сдвигается на $-1$ в собственное значение ноль в первом. поскольку $\rho(I-D^{-1}L)\subset (-1,1]$ , у нас есть $\rho(\tilde{S})\subset (-1,1)$ ,

— Хуэй Чжан
источник

Спасибо за ответы. Нечто похожее было то, что я рассмотрел: а именно, с взвешенным лапласианом, структурированным как

D^{- 1} L

$D^{-1}L$ выше, можно показать, что его собственные значения находятся в пределах

[0, 2)

$[0, 2)$ следовательно, со спектральным радиусом в пределах

(0, 2)

$(0, 2)$ (одно собственное значение больше

0

$0$ и по крайней мере один

0

$0$ ). Следовательно, спектральный радиус итерационной матрицы

I - D^{- 1} L

$I-D^{-1}L$ меньше чем

1

$1$ следовательно, со сходящимся Якоби. Возможно, приведенное выше предположение о спектральном радиусе

I - D^{- 1} L

$I-D^{-1}L$ (без учета

0

$0$ ) не безопасно?

— Usero

Я думаю, что спектры

D^{- 1} L

$D^{-1}L$ должен быть в

[0, 2]

$[0,2]$ закрыто на

2

$2$ , Я не знаю, как вы можете получить

2

$2$ Исключенный. С моей точки зрения, (теорема Гершгорина о круге) [ en.wikipedia.org/wiki/Gershgorin_circle_theorem] может дать только оценку, включающую

2

$2$ , Если это так, то оценка спектрального радиуса

I - D^{- 1} L

$I-D^{-1}L$ является

\leq 1

$\leq 1$ с равенством, достижимым с векторами в ядре

L

$L$ , Я думаю, что сходимость, которую вы хотите, заключается в том, что в пространстве ортогонального дополнения

V_{1}

$V_1$ как отмечено в приведенном выше ответе.

— Хуэй Чжан

Вы можете взглянуть на лемму 1.7 (v) из math.ucsd.edu/~fan/research/cb/ch1.pdf Матрица

D^{- 1} L

$D^{−1}L$ можно рассматривать как взвешенный лапласиан на полном графе, следовательно, с исключенным

2

$2$ , Я предполагаю, что это достаточный аргумент для доказательства сходимости? ........... Требует ли ваш подход другой предварительной / последующей обработки итераций, кроме центрирования?

c

$c$ , Я спрашиваю, потому что вы представили

V_{0}

$V_0$ И относительно спектров

I - D^{- 1} L - V_{0} V_{0}^{'}

$I-D^{-1}L-V_0V_0'$ : учитывая, что спектральный радиус (

s r

$sr$ ) из

I - D^{- 1} L

$I-D^{-1}L$ является

(0, 1]

$(0, 1]$ , Добавление

- \frac{1}{n}

$-\frac{1}{n}$ , даст

s r < 1

$sr<1$ , Разве это не достаточно хороший аргумент?

— Usero

Привет, спасибо за указание на хорошую книгу. Но я обнаружил, что не могу быстро взглянуть. Что касается вашего последнего аргумента, он выглядит почти так же, как «ответ» выше. Просто будьте осторожны, вы не добавляете

\frac{1}{n}

$\frac{1}{n}$ но

\frac{1}{n} 1_{n \times n}

$\frac{1}{n}\mathbf{1}_{n\times n}$ так что это не простое дополнение к

s r

$sr$ из

I - D^{- 1} L

$I-D^{-1}L$ , Как правило,

s r

$sr$ суммы двух матриц не являются простой суммой

s r

$sr$ с отдельных матриц.

— Хуэй Чжан

Хорошо, что ты указал на это. Требует ли ваш подход другой предварительной / последующей обработки итераций за пределами центровки c. Я спрашиваю, потому что вы представили

V_{0}

$V_0$ и я подумал, что вы говорите о проецировании нулевого пространства. Если это так, является ли проекция пустым пространством действительно необходимой для сходимости?

— Usero

Методы Крылова никогда явно не используют размерность пространства, в котором они итерируются, поэтому вы можете запускать их в особых системах, пока вы сохраняете итерации в ненулевом подпространстве. Обычно это делается путем проецирования пустого пространства на каждой итерации. Есть две вещи, которые могут пойти не так: первая встречается гораздо чаще, чем вторая.

Предусловие неустойчиво применительно к сингулярному оператору. Прямые решатели и неполная факторизация могут обладать этим свойством. На практике мы просто выбираем разные предварительные кондиционеры, но есть более принципиальные способы создания предварительных кондиционеров для единичных систем, например, Zhang (2010). .
На некоторой итерации, $x$ находится в ненулевом подпространстве, но $A x$ живет полностью в нулевом пространстве. Это возможно только с несимметричными матрицами. Немодифицированный GMRES ломается в этом сценарии, но см. Reichel и Ye (2005) для вариантов без поломок.

Для решения особых систем с использованием PETSc см. KSPSetNullSpace() . Большинство методов и предварительных кондиционеров могут решать особые системы. На практике малое нулевое пространство для PDE с граничными условиями Неймана почти никогда не является проблемой, если вы сообщаете решателю Крылова о нулевом пространстве и выбираете разумный предобусловливатель.

Судя по комментариям, вас особенно интересует Якоби. (Почему? Якоби полезен как многосеточный сглаживатель, но есть гораздо лучшие методы для использования в качестве решателей.) Якоби применил к $A x = b$ не сходится, когда вектор $b$ имеет компонент в нулевом пространстве $A$ однако часть решения, ортогональная нулевому пространству, действительно сходится, поэтому, если вы проецируете нулевое пространство из каждой итерации, она сходится. В качестве альтернативы, если вы выбираете последовательный $b$ и начальное предположение, итерации (в точной арифметике) не накапливают компоненты в нулевом пространстве.

— Джед браун
источник

Вы можете выполнить ортогональное изменение базиса так, чтобы на диагонали был ноль (найдите любую ортогональную матрицу

Q

$Q$ в котором первый столбец является постоянным вектором). Под этим преобразованием

A_{1} = Q^{T} A Q

$A_1 = Q^T A Q$ , матрица

A_{1}

$A_1$ все еще остается симметричным положительным полуопределенным, но первая диагональная запись равна 0, поэтому прямое применение Якоби не удастся. поскольку

A_{1}

$A_1$ плотный, вы не будете делать это на практике, но это показывает, что основа имеет значение. Если

Z

$Z$ является ортогональным базисом для нулевого пространства, спроектированный GMRES просто решает

(I - Z) P^{- 1} A x = (I - Z) P^{- 1} b

$(I-Z)P^{-1} A x = (I-Z)P^{-1} b$ .

— Jed Brown

Hmm, it seems I replied to a comment that was deleted. I'll leave the comment here in case it's useful.

— Jed Brown

Thanks for the answer, it's on much higher specialized level then I expected. Therefore, I'll need some guides on: 1) how to project out the null space at each iteration? 2) In my understanding, you stated that the Jacobi application to the system as stated primarily might not converge to the exact solution (i.e. the iterands are not getting better solution estimates). It is therefore suggested to choose different preconditioners? If so, does that practically imply a dynamic check on behaviour with

d i a g (A)

$diag(A)$ , and change if problem occurs (with the above case of the linear system)?

— usero

My 1) from above should be regarded as: given the Jacobi iteration with the system primarily posted, is it needed to project out the nullspace, and, if so, how could one incorporate it within the update

X_{k + 1} = D^{- 1} (b - (A - D) X_{k})

$X_{k+1}=D^{-1}(b-(A-D)X_k)$ ? Postprocessing the iterate

X_{k + 1}

$X_{k+1}$ , and considering the postprocessed version for

X_{k}

$X_{k}$ ?

— usero

In a reasonable basis, Jacobi should be stable. It can also use 1 on the diagonal if the diagonal matrix element is 0, the projection still removes the null space. Are you planning to use a Krylov method like CG or GMRES? If not, why not? If you are, you just need an orthogonal basis for the null space. You only have the constant mode in your null space, so an orthogonal projector into the null space is

N = Z Z^{T}

$N=ZZ^T$ where

Z

$Z$ is the column vector. The orthogonal projector that removes the null space is thus

I - N

$I-N$ . (My first comment had a mistake, if

Z

$Z$ is the basis,

N = I - Z Z^{T}

$N=I-ZZ^T$ is the projector.)

— Jed Brown