О нелинейных операторных уравнениях — различия между версиями

Материал из Викиконспекты
Перейти к: навигация, поиск
(that all forks)
м (rollbackEdits.php mass rollback)
 
(не показано 15 промежуточных версий 5 участников)
Строка 1: Строка 1:
 
{{В разработке}}
 
{{В разработке}}
 +
 +
[[Теория Гильберта-Шмидта|<<]]
  
 
Ранее мы рассматривали уравнения вида <tex> y = \lambda x - \mathcal{A} x </tex>, где <tex> y </tex> дано, так называемое "линейное уравнение 2 рода". Для ответа на вопрос "имеет ли решение это уравнение?" надо изучать <tex> \sigma(\mathcal{A}) </tex>.  
 
Ранее мы рассматривали уравнения вида <tex> y = \lambda x - \mathcal{A} x </tex>, где <tex> y </tex> дано, так называемое "линейное уравнение 2 рода". Для ответа на вопрос "имеет ли решение это уравнение?" надо изучать <tex> \sigma(\mathcal{A}) </tex>.  
Строка 46: Строка 48:
 
Складывая полученное: <tex> \varepsilon \| x_n - \overline x \| + q \| x_n - \overline x \| \le (\frac {1-q}2 + q) \delta = \frac {1+q}2 \delta < \delta </tex>.  
 
Складывая полученное: <tex> \varepsilon \| x_n - \overline x \| + q \| x_n - \overline x \| \le (\frac {1-q}2 + q) \delta = \frac {1+q}2 \delta < \delta </tex>.  
  
Окончательно мы получили, что <tex> x_n \in V_\delta (\overline x) \implies x_{n+1} \in V_\delta (\overline x) </tex>, то есть метод простых итераций определен корректно. Попутно мы также установили, что <tex> \| x_{n+1} - \overline x \| \le \frac {1+q}2 \| x_n - \overline x \| \le \hdots \le (\frac {1+q}2)^{n+1} \| x_0 - \overline x \| \xrightarrow[n \to \infty]{} 0 </tex>, то есть <tex> x_n \to \overline x </tex>.
+
Окончательно мы получили, что <tex> x_n \in V_\delta (\overline x) \implies x_{n+1} \in V_\delta (\overline x) </tex>, то есть метод простых итераций определен корректно. Попутно мы также установили, что <tex> \| x_{n+1} - \overline x \| \le \frac {1+q}2 \| x_n - \overline x \| \le \ldots \le (\frac {1+q}2)^{n+1} \| x_0 - \overline x \| \xrightarrow[n \to \infty]{} 0 </tex>, то есть <tex> x_n \to \overline x </tex>.
  
 
}}
 
}}
Строка 58: Строка 60:
 
<tex> x_0 </tex> {{---}} начальное приближение.
 
<tex> x_0 </tex> {{---}} начальное приближение.
  
<tex> \mathcal{T} (\overline x) = \mathcal{T}(x_0) + \mathcal{T}'(x_0) \cdot (\overline x - x_0) + \hdots </tex>. Обрежем последнюю часть: <tex> 0 = \mathcal{T}(x_0) + \mathcal{T}'(x_0) \cdot (x_0 - \overline x) </tex>.
+
<tex> \mathcal{T} (\overline x) = \mathcal{T}(x_0) + \mathcal{T}'(x_0) \cdot (\overline x - x_0) + \ldots </tex>. Обрежем последнюю часть: <tex> 0 = \mathcal{T}(x_0) + \mathcal{T}'(x_0) \cdot (\overline x - x_0) </tex>.
  
 
Обозначим <tex> \Gamma(x_0) = (\mathcal{T}'(x_0))^{-1} </tex>.
 
Обозначим <tex> \Gamma(x_0) = (\mathcal{T}'(x_0))^{-1} </tex>.
Строка 134: Строка 136:
 
Пусть <tex> M </tex> {{---}} ограниченное замкнутое выпуклое подмножество B-пространства <tex> X </tex> и <tex> \mathcal{T} </tex> вполне непрерывно отображает <tex> M </tex> в себя.  
 
Пусть <tex> M </tex> {{---}} ограниченное замкнутое выпуклое подмножество B-пространства <tex> X </tex> и <tex> \mathcal{T} </tex> вполне непрерывно отображает <tex> M </tex> в себя.  
  
Тогда <tex> \exists x^* \in M : x^* = Tx^* </tex>.
+
Тогда <tex> \exists x^* \in M : x^* = \mathcal{T}x^* </tex>.
 
}}  
 
}}  
  
Строка 152: Строка 154:
 
<tex> \forall \varepsilon > 0 </tex> по равномерной сходимости, <tex> \exists n_0: \| \mathcal{T}(x) - \mathcal{T}_{n_0}(x) \| < \varepsilon \, \forall x \in D </tex>.
 
<tex> \forall \varepsilon > 0 </tex> по равномерной сходимости, <tex> \exists n_0: \| \mathcal{T}(x) - \mathcal{T}_{n_0}(x) \| < \varepsilon \, \forall x \in D </tex>.
  
По предположению, <tex> \mathcal{T}_{n_0} </tex> {{---}} вполне непрерывный: существует конечная <tex> \varepsilon </tex>-сеть <tex> y_1, \hdots, y_p </tex> для <tex> \mathcal{T}_{n_0}(D) </tex>.
+
По предположению, <tex> \mathcal{T}_{n_0} </tex> {{---}} вполне непрерывный: существует конечная <tex> \varepsilon </tex>-сеть <tex> y_1, \ldots, y_p </tex> для <tex> \mathcal{T}_{n_0}(D) </tex>.
  
 
<tex> \forall y \in \mathcal{T}(D), y = \mathcal{T}x </tex>. Рассмотрим <tex> \mathcal{T}_{n_0}(x) \in \mathcal{T}_{n_0}(D) </tex> и подберем такое <tex> y_j </tex>, что <tex> \| y_j - \mathcal{T}_{n_0}x \| < \varepsilon </tex>.
 
<tex> \forall y \in \mathcal{T}(D), y = \mathcal{T}x </tex>. Рассмотрим <tex> \mathcal{T}_{n_0}(x) \in \mathcal{T}_{n_0}(D) </tex> и подберем такое <tex> y_j </tex>, что <tex> \| y_j - \mathcal{T}_{n_0}x \| < \varepsilon </tex>.
Строка 158: Строка 160:
 
<tex> \| y - y_j \| = \| \mathcal{T}x - y_j \| \le \| \mathcal{T}x - \mathcal{T}_{n_0}x \| + \| \mathcal{T}_{n_0}x - y_j \| </tex>. Первое слагаемое <tex> \le \varepsilon </tex> по выбору <tex> n_0 </tex> и равномерной сходимости. Второе слагаемое <tex> \le \varepsilon </tex> по выбору <tex> y_j </tex> из <tex> \varepsilon </tex>-сети.  
 
<tex> \| y - y_j \| = \| \mathcal{T}x - y_j \| \le \| \mathcal{T}x - \mathcal{T}_{n_0}x \| + \| \mathcal{T}_{n_0}x - y_j \| </tex>. Первое слагаемое <tex> \le \varepsilon </tex> по выбору <tex> n_0 </tex> и равномерной сходимости. Второе слагаемое <tex> \le \varepsilon </tex> по выбору <tex> y_j </tex> из <tex> \varepsilon </tex>-сети.  
  
Окончательно, <tex> \exists y_1, \hdots, y_p : \forall y \in \mathcal{T}(D) \exists y_j: \| y - y_j \| < 2 \varepsilon </tex>. Значит, мы получили <tex> 2\varepsilon </tex>-сеть для <tex> \mathcal{T}(D) </tex>.
+
Окончательно, <tex> \exists y_1, \ldots, y_p : \forall y \in \mathcal{T}(D) \exists y_j: \| y - y_j \| < 2 \varepsilon </tex>. Значит, мы получили <tex> 2\varepsilon </tex>-сеть для <tex> \mathcal{T}(D) </tex>.
  
 
}}
 
}}
Строка 168: Строка 170:
 
Рассмотрим <tex> \mathcal{T}_n </tex> {{---}} последовательность вполне непрерывных операторов на <tex> D </tex>, <tex> \mathcal{T}_n \rightrightarrows \mathcal{T} </tex>.  
 
Рассмотрим <tex> \mathcal{T}_n </tex> {{---}} последовательность вполне непрерывных операторов на <tex> D </tex>, <tex> \mathcal{T}_n \rightrightarrows \mathcal{T} </tex>.  
  
Тогда множество <tex> \mathcal{T}_1(D) \cup \mathcal{T}_2(D) \cup \hdots \cup \mathcal{T}_n(D) \cup \hdots \cup \mathcal{T}(D) </tex> относительно компактно.   
+
Тогда множество <tex> \mathcal{T}_1(D) \cup \mathcal{T}_2(D) \cup \ldots \cup \mathcal{T}_n(D) \cup \ldots \cup \mathcal{T}(D) </tex> относительно компактно.   
  
 
|proof=
 
|proof=
Строка 174: Строка 176:
 
По равномерной сходимости, <tex> \forall \varepsilon > 0 \, \exists n_0: \forall n > n_0 \forall x \in D: \| \mathcal{T}(x) - \mathcal{T}_n(x) \| < \varepsilon </tex>.
 
По равномерной сходимости, <tex> \forall \varepsilon > 0 \, \exists n_0: \forall n > n_0 \forall x \in D: \| \mathcal{T}(x) - \mathcal{T}_n(x) \| < \varepsilon </tex>.
  
Рассмотрим множество <tex> \mathcal{T}_1(D) \cup \mathcal{T}_2(D) \cup \hdots \cup \mathcal{T}_{n_0}(D) </tex>. Оно относительно компактно как конечное объединение относительно компактных множеств.  
+
Рассмотрим множество <tex> \mathcal{T}_1(D) \cup \mathcal{T}_2(D) \cup \ldots \cup \mathcal{T}_{n_0}(D) </tex>. Оно относительно компактно как конечное объединение относительно компактных множеств.  
  
<tex> \forall \varepsilon > 0 </tex> рассмотрим <tex> \varepsilon </tex>-сеть для этого множества: <tex> y_1, \hdots, y_p </tex>.
+
<tex> \forall \varepsilon > 0 </tex> рассмотрим <tex> \varepsilon </tex>-сеть для этого множества: <tex> y_1, \ldots, y_p </tex>.
  
Рассмотрим <tex> \bigcup\limits_{n=1}^{\infty} \mathcal{T}_n(D) \cup \mathcal{T}(D) </tex>. Проверим, что <tex> y_1, \hdots, y_p </tex> {{---}} <tex> k \varepsilon </tex>-сеть для этого множества, где число <tex> k </tex> определим позже.  
+
Рассмотрим <tex> \bigcup\limits_{n=1}^{\infty} \mathcal{T}_n(D) \cup \mathcal{T}(D) </tex>. Проверим, что <tex> y_1, \ldots, y_p </tex> {{---}} <tex> k \varepsilon </tex>-сеть для этого множества, где число <tex> k </tex> определим позже.  
  
 
Возьмем произвольный <tex> y \in \bigcup\limits_{n=1}^{\infty} \mathcal{T}_n(D) \cup \mathcal{T}(D) </tex>.  
 
Возьмем произвольный <tex> y \in \bigcup\limits_{n=1}^{\infty} \mathcal{T}_n(D) \cup \mathcal{T}(D) </tex>.  
Строка 200: Строка 202:
 
Аналогичную оценку получаем, если <tex> y \in \mathcal{T}(D) </tex>.
 
Аналогичную оценку получаем, если <tex> y \in \mathcal{T}(D) </tex>.
  
В итоге, получили, что <tex> y_1, \hdots, y_p </tex> {{---}} <tex> 3\varepsilon </tex>-сеть для <tex> \bigcup\limits_{n=1}^{\infty} \mathcal{T}_n(D) \cup \mathcal{T}(D) </tex>.
+
В итоге, получили, что <tex> y_1, \ldots, y_p </tex> {{---}} <tex> 3\varepsilon </tex>-сеть для <tex> \bigcup\limits_{n=1}^{\infty} \mathcal{T}_n(D) \cup \mathcal{T}(D) </tex>.
  
 
}}
 
}}
Строка 210: Строка 212:
 
<tex> \mathcal{T} </tex> {{---}} вполне непрерывен на ограниченном <tex> D </tex>, <tex> M = \mathcal{T}(D) </tex> {{---}} относительно компактно.
 
<tex> \mathcal{T} </tex> {{---}} вполне непрерывен на ограниченном <tex> D </tex>, <tex> M = \mathcal{T}(D) </tex> {{---}} относительно компактно.
  
<tex> \forall \varepsilon > 0 \exists y_1 \in M, \hdots, y_p \in M </tex> {{---}} конечная <tex> \varepsilon </tex>-сеть.
+
<tex> \forall \varepsilon > 0 \; \exists y_1 \in M, \ldots, y_p \in M </tex> {{---}} конечная <tex> \varepsilon </tex>-сеть.
  
Построим следующую функцию: <tex> \forall j = 1, \hdots, p, \forall y \in M: </tex>
+
Построим следующую функцию: <tex> \forall j = 1, \ldots, p, \forall y \in M: </tex>
  
 
<tex> \mu_j(y) = \begin{cases}  
 
<tex> \mu_j(y) = \begin{cases}  
Строка 219: Строка 221:
 
</tex>
 
</tex>
  
Легко проверить, что для любого <tex> j </tex> функция <tex> \mu_j </tex> непрерывна на <tex> M </tex>. {{TODO|t=Легко? Так давайте сделаем это.}}
+
Легко проверить, что для любого <tex> j </tex> функция <tex> \mu_j </tex> непрерывна на <tex> M </tex>. В самом деле, вне интервала <tex> (y_j - \varepsilon;\,y_j + \varepsilon) </tex> функция <tex> \mu_j </tex> непрерывна как константа, внутри интервала она непрерывна в силу непрерывности нормы, а кроме того <tex> \lim\limits_{y \rightarrow y_j \pm \varepsilon} (\varepsilon - \| y - y_j \|) = 0 = \mu_j(y_j \pm \varepsilon) </tex>
  
 
Поскольку <tex> \{ y_j \} </tex> {{---}} <tex> \varepsilon </tex>-сеть, то <tex> \forall y </tex> все <tex> \mu_j(y) </tex> не могут быть равны нулю одновременно.  
 
Поскольку <tex> \{ y_j \} </tex> {{---}} <tex> \varepsilon </tex>-сеть, то <tex> \forall y </tex> все <tex> \mu_j(y) </tex> не могут быть равны нулю одновременно.  
Строка 234: Строка 236:
 
Коэффициенты <tex> \frac {\mu_j(y)} {S(y)} </tex> обозначим за <tex> \alpha_j(y) </tex>. Из определения следует, что <tex> \sum\limits_{j=1}^p \alpha_j(y) = 1 </tex>, то есть, <tex> P_\varepsilon(y) </tex> есть выпуклая комбинация точек <tex> \varepsilon </tex> сети для любого <tex> y </tex>.   
 
Коэффициенты <tex> \frac {\mu_j(y)} {S(y)} </tex> обозначим за <tex> \alpha_j(y) </tex>. Из определения следует, что <tex> \sum\limits_{j=1}^p \alpha_j(y) = 1 </tex>, то есть, <tex> P_\varepsilon(y) </tex> есть выпуклая комбинация точек <tex> \varepsilon </tex> сети для любого <tex> y </tex>.   
  
<tex> P_\varepsilon(M) \subset \mathcal{L}(y_1, \hdots, y_p) </tex>
+
<tex> P_\varepsilon(M) \subset \mathcal{L}(y_1, \ldots, y_p) </tex>
  
Если <tex> M = \mathcal{T}(D) </tex> {{---}} выпуклое множество, то <tex> P_\varepsilon(y) \in M </tex>, как выпуклая комбинация точек <tex> y_1, \hdots, y_p </tex>.
+
Если <tex> M = \mathcal{T}(D) </tex> {{---}} выпуклое множество, то <tex> P_\varepsilon(y) \in M </tex>, как выпуклая комбинация точек <tex> y_1, \ldots, y_p </tex>.
  
Рассмотрим <tex> \| P_\varepsilon (\mathcal{T} x) - \mathcal{T} x \| = \| \sum\limits_{j=1}^p \alpha_j y_j - \sum\limits_{j=1}^p \alpha_j y \| = \| \sum\limits_{j=1}^p \alpha_j (y_j - y) \| </tex>.
+
Рассмотрим <tex> \| P_\varepsilon (\mathcal{T} x) - \mathcal{T} x \| = \| \sum\limits_{j=1}^p \alpha_j(y) \cdot y_j - \sum\limits_{j=1}^p \alpha_j(y) \cdot y \| = \| \sum\limits_{j=1}^p \alpha_j(y) \cdot (y_j - y) \| </tex>.
  
Если <tex> \| y_j - y \| > \varepsilon </tex>, то <tex> \alpha_j(y) = 0 </tex>, поэтому, продолжая цепочку неравенств, <tex> \| \sum\limits_{j=1}^p \alpha_j (y_j - y) \| \le \varepsilon \sum\limits_{j=1}^p \alpha_j \le \varepsilon </tex>.
+
Если <tex> \| y_j - y \| > \varepsilon </tex>, то <tex> \alpha_j(y) = 0 </tex>, поэтому, продолжая цепочку неравенств, <tex> \| \sum\limits_{j=1}^p \alpha_j(y) \cdot (y_j - y) \| \le \varepsilon \sum\limits_{j=1}^p \alpha_j(y) \le \varepsilon </tex>.
  
 
Получили, что <tex> P_\varepsilon \mathcal{T} \rightrightarrows \mathcal{T} </tex>, когда <tex> \varepsilon \to 0 </tex>.
 
Получили, что <tex> P_\varepsilon \mathcal{T} \rightrightarrows \mathcal{T} </tex>, когда <tex> \varepsilon \to 0 </tex>.
Строка 259: Строка 261:
 
<tex> M </tex> {{---}} выпуклое ограниченное множество, оператор <tex> \mathcal{T} : M \to M </tex> является вполне ограниченным.
 
<tex> M </tex> {{---}} выпуклое ограниченное множество, оператор <tex> \mathcal{T} : M \to M </tex> является вполне ограниченным.
  
Определим последовательность <tex> \mathcal{T}_n = P_{\frac 1n} \mathcal{T} </tex>. <tex> \mathcal{T}_n : M \to M_n </tex>, где <tex> M_n </tex> {{---}} конечномерное пространство.  
+
Определим последовательность <tex> \mathcal{T}_n = P_{\frac 1n} \mathcal{T} </tex>. <tex> \mathcal{T}_n : M \to M_n </tex>, где <tex> M_n </tex> {{---}} подмножество конечномерного пространства. Каждое <tex> M_n </tex> является замкнутым выпуклым множеством, поскольку является линейной оболочкой соответствующей <tex>\frac{1}{n}</tex>-сети.
 
 
Применяя теорему Брауэра, получаем, что <tex> \forall n: \exists x_n \in M_n: x_n = \mathcal{T}_n x_n = x_n </tex>.  
 
  
Учитывая, что <tex> M_1 \cup M_2 \cup \hdots </tex> относительно компактно, из <tex> \{ x_n \} </tex> можно выделить сходящуюся подпоследовательность: <tex> \exists x_{n_k} \to x^* \in M </tex>.
+
Применяя теорему Брауэра, получаем, что <tex> \forall n: \exists x_n \in M_n: x_n = \mathcal{T}_n x_n = x_n </tex>.
 +
Учитывая, что <tex> M_1 \cup M_2 \cup \ldots </tex> относительно компактно, из <tex> \{ x_n \} </tex> можно выделить сходящуюся подпоследовательность: <tex> \exists x_{n_k} \to x^* \in M </tex>.
  
 
<tex> \| x^* - \mathcal{T}x^* \| = \| \lim(x_{n_k} - \mathcal{T} x_{n_k}) \| </tex>.  
 
<tex> \| x^* - \mathcal{T}x^* \| = \| \lim(x_{n_k} - \mathcal{T} x_{n_k}) \| </tex>.  

Текущая версия на 19:33, 4 сентября 2022

Эта статья находится в разработке!
<<

Ранее мы рассматривали уравнения вида [math] y = \lambda x - \mathcal{A} x [/math], где [math] y [/math] дано, так называемое "линейное уравнение 2 рода". Для ответа на вопрос "имеет ли решение это уравнение?" надо изучать [math] \sigma(\mathcal{A}) [/math].

Сложнее, когда задано уравнение вида [math]\mathcal{T}(x) = 0[/math] или [math]\mathcal{T}(x) = x[/math], где [math] T: X \xrightarrow[nonlinear]{} X [/math] — произвольный оператор из [math] X [/math] в [math] X [/math].

В этом параграфе мы покажем 3 способа решения таких уравнений.

Простые итерации

Решаем уравнение [math] x = \mathcal{T}(x) [/math]. Составляем последовательность [math] x_{n+1} = \mathcal{T}(x_n) [/math] и изучаем сходимость последовательности [math] \{ x_n \} \xrightarrow[]{?} x^* [/math].

Если [math] \mathcal{T} [/math] — непрерывный оператор, то [math] x_{n+1} \to \mathcal{T} x^*, \mathcal{T} x_n \to \mathcal{T} x^* [/math] и, по единственности предела, получаем [math] x^* = \mathcal{T} x^* [/math].

Во втором семестре у нас было определение производной Фреше: [math] \mathcal{T}(x+\Delta x) -\mathcal{T}(x) = \mathcal{T}'_x (\Delta x) + o(\Delta x)[/math]. [math] \mathcal{T}'_x [/math] — линейный ограниченный оператор.

[math] \frac { \| o(\Delta x) \|} { \| \Delta x \| } \to 0 [/math]

Теорема (Локальная теорема о простой итерации):
Пусть известно, что существует [math] \overline{x}: \mathcal{T}(\overline{x}) = \overline{x} [/math] и [math] \| \mathcal{T}(\overline{x})' \| \le q \lt 1 [/math].

Тогда существует такой шар [math] V_{\delta} (\overline x) [/math], что если [math] x_0 \in V_{\delta} (\overline x) [/math], то:

  • Метод простых итераций корректно определен: [math] \mathcal{T}x_n \in V_{\delta} (\overline x), n \ge 0[/math].
  • [math] x_n \to \overline x [/math]
Доказательство:
[math]\triangleright[/math]

Положим [math] \varepsilon = \frac {1-q}2 [/math].

В силу определения производной Фреше существует [math] \delta \gt 0: \| \Delta x \| \lt \delta \implies \| \mathcal{T} (\overline x + \Delta x) - \mathcal{T}(\overline x) - \mathcal{T}'(\overline x) \cdot \Delta x \| \lt \varepsilon \| \Delta x \| [/math].

Убедимся в том, что такая [math] \delta [/math] подходит в качестве радиуса шара из условия теоремы:

Предположим, что [math] x_n \in V_\delta (\overline x) [/math].

[math] \| x_{n+1} - \overline x \| = \| \mathcal{T}x_n - \mathcal{T} \overline x\| \le [/math]

[math] \le \| \mathcal{T} x_n - \mathcal{T} \overline x - \mathcal{T}' (\overline x) (x_n - \overline x) \| + \| \mathcal{T}'(\overline x) (x_n - \overline x)\| [/math].

Рассмотрим первое слагаемое: [math] x_n \in V_\delta (\overline x) \implies \| x_n - \overline x \| \lt \delta [/math], а значит, [math] \| \mathcal{T} x_n - \mathcal{T} \overline x - \mathcal{T}' (\overline x) (x_n - \overline x) \| \lt \varepsilon \| x_n - \overline x \| [/math].

Второе слагаемое: [math] \| \mathcal{T}'(\overline x) (x_n - \overline x)\| \le \| \mathcal{T}'(\overline x) \| \| x_n - \overline x \| \le q \| x_n - \overline x \| [/math]

Складывая полученное: [math] \varepsilon \| x_n - \overline x \| + q \| x_n - \overline x \| \le (\frac {1-q}2 + q) \delta = \frac {1+q}2 \delta \lt \delta [/math].

Окончательно мы получили, что [math] x_n \in V_\delta (\overline x) \implies x_{n+1} \in V_\delta (\overline x) [/math], то есть метод простых итераций определен корректно. Попутно мы также установили, что [math] \| x_{n+1} - \overline x \| \le \frac {1+q}2 \| x_n - \overline x \| \le \ldots \le (\frac {1+q}2)^{n+1} \| x_0 - \overline x \| \xrightarrow[n \to \infty]{} 0 [/math], то есть [math] x_n \to \overline x [/math].
[math]\triangleleft[/math]

Метод Ньютона-Канторовича

Ньютоном был предложен классический способ решения уравнений (метод касательных). До Ньютона использовали метод половинного деления. В двадцатом веке Канторович перенес соответствующие методы на операторные уравнения вида [math] \mathcal{T} x = 0, \mathcal{T} [/math] — непрерывный оператор из [math] X [/math] в [math] X [/math], [math]X[/math]— нормированное пространство.

Предположим, что [math] \mathcal{T} (\overline x) = 0 [/math]. Получим схему метода Ньютона-Канторовича.

[math] x_0 [/math] — начальное приближение.

[math] \mathcal{T} (\overline x) = \mathcal{T}(x_0) + \mathcal{T}'(x_0) \cdot (\overline x - x_0) + \ldots [/math]. Обрежем последнюю часть: [math] 0 = \mathcal{T}(x_0) + \mathcal{T}'(x_0) \cdot (\overline x - x_0) [/math].

Обозначим [math] \Gamma(x_0) = (\mathcal{T}'(x_0))^{-1} [/math].

[math] -\mathcal{T}(x_0) = \mathcal{T}'(x_0) \cdot (\overline x - x_0) [/math]

Домножим равенство с обеих сторон на [math] \Gamma(x_0) [/math]:

[math] -\Gamma(x_0) \mathcal{T}(x_0) = \Gamma(x_0) \mathcal{T}'(x_0) \cdot (\overline x - x_0) = \overline x - x_0 [/math].

[math] \overline x = x_0 - \Gamma(x_0) \mathcal{T}(x_0) [/math].

Теперь положим [math] x_{n+1} = x_n - \Gamma(x_n) \mathcal{T} (x_n) [/math] и получим итерацию метода Ньютона-Канторовича для функции

[math] \mathcal{F}(x) = x - \Gamma(x) \mathcal{T} (x)[/math]

[math] x_{n+1} = \mathcal{F}(x_n) [/math]

Покажем, что [math] \mathcal{F}'(\overline x) = 0 [/math], то есть [math] q = 0 [/math] из условия локальной теоремы о простой итерации.

Утверждение:
[math] \mathcal{F}'(\overline x) = 0 [/math]
[math]\triangleright[/math]

[math] \| \mathcal{F} (\overline x + \Delta x) - \mathcal{F} (\overline x) \| [/math]

[math]= \| \overline x + \Delta x - \Gamma(\overline x + \Delta x) \mathcal{T} (\overline x + \Delta x) - \overline x + \Gamma(\overline x) \mathcal{T} (\overline x) \| [/math]

[math]= \| \Delta x - \Gamma(\overline x + \Delta x) \mathcal{T} (\overline x + \Delta x) \|[/math]

Запишем [math] 0 = \mathcal{T}(\overline x) [/math] через значение [math] \mathcal{T}' (\overline x + \Delta x) [/math]:

[math] 0 = \mathcal{T}(\overline x) [/math]

[math] = \mathcal{T}(\overline x + \Delta x) + \mathcal{T}'(\overline x + \Delta x) \cdot (\overline x - (\overline x + \Delta x)) + o(\overline x - (\overline x + \Delta x)) [/math]

[math]= \mathcal{T}(\overline x + \Delta x) - \mathcal{T}'(\overline x + \Delta x) \cdot \Delta x + o(\Delta x) [/math], откуда [math] \mathcal{T}(\overline x + \Delta x) = \mathcal{T}'(\overline x + \Delta x) \cdot \Delta x + o(\Delta x) [/math].

Подставим это равенство в выражение выше: [math] \| \Delta x - \Gamma(\overline x + \Delta x) \mathcal{T} (\overline x + \Delta x) \| [/math]

[math] = \| \Delta x - \Gamma(\overline x + \Delta x) \mathcal{T}' (\overline x + \Delta x) \cdot \Delta x + \Gamma(\overline x + \Delta x) \cdot o(\Delta x) \| [/math]

[math] = \| \Delta x - \Delta x + \Gamma(\overline x + \Delta x)) \cdot o(\Delta x) \| [/math].

Итого: [math] \| \mathcal{F}(\overline x + \Delta x) - \mathcal{F}(\overline x) \| \le \| \Gamma(\overline x + \Delta x) \| \| o(\Delta x) \| [/math], откуда [math] \mathcal{F}(\overline x + \Delta x) - \mathcal{F}(\overline x) = o(\Delta x) \implies \mathcal{F}'(\overline x) = 0 [/math]
[math]\triangleleft[/math]

Теорема Шаудера

Рассмотрим другую идею решения [math] \mathcal{T} x = x [/math]. Оно основывается на том факте, что если функция [math] f [/math] отображает отрезок [math] [a, b] [/math] в себя, то существует такая точка [math] c \in [a, b] : c = f(c) [/math].

Обобщение этого факта для [math] \mathbb{R}^n [/math] называется теоремой Брауэра:

Теорема (Брауэр, о неподвижной точке):
Пусть [math] M [/math] — ограниченное выпуклое замкнутое подмножество [math] \mathbb{R}^n [/math], [math] F [/math] непрерывно отображает [math] M [/math] в себя. Тогда [math] \exists x^*: F(x^*) = x^* [/math].

Как перенести этот факт в бесконечномерный случай? Ответ на это дает теорема Шаудера:


Определение:
Пусть [math] X [/math] — B-пространство, [math] D \subset X [/math] — ограничено в [math] X [/math]. [math] \mathcal{T} [/math] — непрерывное отображение [math] D \mapsto X [/math]. Говорят, что [math] \mathcal{T} [/math] вполне непрерывно на [math] D [/math], если [math] \mathcal{T}(D) [/math] — относительно компактно в [math] X [/math].


Теорема (Шаудер, о неподвижной точке):
Пусть [math] M [/math] — ограниченное замкнутое выпуклое подмножество B-пространства [math] X [/math] и [math] \mathcal{T} [/math] вполне непрерывно отображает [math] M [/math] в себя. Тогда [math] \exists x^* \in M : x^* = \mathcal{T}x^* [/math].

Замечание: теорему Брауэра нельзя будет назвать частным случаем теоремы Шаудера, так как при доказательстве теоремы Шаудера мы сошлемся на теорему Брауэра. У теоремы Шаудера также очень частое практическое применение.

Вспомогательные факты

Утверждение (Факт Первый):
Рассмотрим [math] \mathcal{T}_n [/math] — последовательность вполне непрерывных операторов на [math] D [/math], [math] \mathcal{T}_n \rightrightarrows \mathcal{T} [/math] ([math] \forall \varepsilon \gt 0 \, \exists N: \forall n \gt N, \forall x \in D : \| \mathcal{T}_n(x) - \mathcal{T}(x) \| \lt \varepsilon[/math]). Тогда [math] \mathcal{T} [/math] вполне непрерывен на [math] D [/math].
[math]\triangleright[/math]

[math] \forall \varepsilon \gt 0 [/math] по равномерной сходимости, [math] \exists n_0: \| \mathcal{T}(x) - \mathcal{T}_{n_0}(x) \| \lt \varepsilon \, \forall x \in D [/math].

По предположению, [math] \mathcal{T}_{n_0} [/math] — вполне непрерывный: существует конечная [math] \varepsilon [/math]-сеть [math] y_1, \ldots, y_p [/math] для [math] \mathcal{T}_{n_0}(D) [/math].

[math] \forall y \in \mathcal{T}(D), y = \mathcal{T}x [/math]. Рассмотрим [math] \mathcal{T}_{n_0}(x) \in \mathcal{T}_{n_0}(D) [/math] и подберем такое [math] y_j [/math], что [math] \| y_j - \mathcal{T}_{n_0}x \| \lt \varepsilon [/math].

[math] \| y - y_j \| = \| \mathcal{T}x - y_j \| \le \| \mathcal{T}x - \mathcal{T}_{n_0}x \| + \| \mathcal{T}_{n_0}x - y_j \| [/math]. Первое слагаемое [math] \le \varepsilon [/math] по выбору [math] n_0 [/math] и равномерной сходимости. Второе слагаемое [math] \le \varepsilon [/math] по выбору [math] y_j [/math] из [math] \varepsilon [/math]-сети.

Окончательно, [math] \exists y_1, \ldots, y_p : \forall y \in \mathcal{T}(D) \exists y_j: \| y - y_j \| \lt 2 \varepsilon [/math]. Значит, мы получили [math] 2\varepsilon [/math]-сеть для [math] \mathcal{T}(D) [/math].
[math]\triangleleft[/math]
Утверждение (Факт Второй):
Рассмотрим [math] \mathcal{T}_n [/math] — последовательность вполне непрерывных операторов на [math] D [/math], [math] \mathcal{T}_n \rightrightarrows \mathcal{T} [/math]. Тогда множество [math] \mathcal{T}_1(D) \cup \mathcal{T}_2(D) \cup \ldots \cup \mathcal{T}_n(D) \cup \ldots \cup \mathcal{T}(D) [/math] относительно компактно.
[math]\triangleright[/math]

По равномерной сходимости, [math] \forall \varepsilon \gt 0 \, \exists n_0: \forall n \gt n_0 \forall x \in D: \| \mathcal{T}(x) - \mathcal{T}_n(x) \| \lt \varepsilon [/math].

Рассмотрим множество [math] \mathcal{T}_1(D) \cup \mathcal{T}_2(D) \cup \ldots \cup \mathcal{T}_{n_0}(D) [/math]. Оно относительно компактно как конечное объединение относительно компактных множеств.

[math] \forall \varepsilon \gt 0 [/math] рассмотрим [math] \varepsilon [/math]-сеть для этого множества: [math] y_1, \ldots, y_p [/math].

Рассмотрим [math] \bigcup\limits_{n=1}^{\infty} \mathcal{T}_n(D) \cup \mathcal{T}(D) [/math]. Проверим, что [math] y_1, \ldots, y_p [/math][math] k \varepsilon [/math]-сеть для этого множества, где число [math] k [/math] определим позже.

Возьмем произвольный [math] y \in \bigcup\limits_{n=1}^{\infty} \mathcal{T}_n(D) \cup \mathcal{T}(D) [/math].

Рассмотрим, в какое из множеств попадает выбранный нами [math] y [/math]. Пусть, для начала, [math] y \in \mathcal{T}_n(D) [/math].

Если [math] n \le n_0 [/math], то [math] \exists y_j : \| y - y_j \| \lt \varepsilon [/math].

Пусть [math] n \gt n_0, y \in \mathcal{T}_n(D) \implies y = \mathcal{T}_n x[/math].

[math] \| y - y_j \| [/math]

[math] = \| \mathcal{T}_n x - y_j \| [/math]

[math] \le \| \mathcal{T}_n x - \mathcal{T} x \| + \| \mathcal{T} x - y_j \| [/math]

[math] \le \| \mathcal{T}_n x - \mathcal{T} x \| + \| \mathcal{T} x - \mathcal{T}_{n_0} x \| + \| \mathcal{T}_{n_0} x - y_j \| [/math].

Первые два слагаемых [math] \le \varepsilon [/math] по равномерной сходимости, третье [math] \le \varepsilon [/math] по выбору [math] \varepsilon [/math]-сети для [math] n_0 [/math].

Аналогичную оценку получаем, если [math] y \in \mathcal{T}(D) [/math].

В итоге, получили, что [math] y_1, \ldots, y_p [/math][math] 3\varepsilon [/math]-сеть для [math] \bigcup\limits_{n=1}^{\infty} \mathcal{T}_n(D) \cup \mathcal{T}(D) [/math].
[math]\triangleleft[/math]

Проекторы Шаудера

Основная идея данного доказательства — построение проекторов Шаудера.

[math] \mathcal{T} [/math] — вполне непрерывен на ограниченном [math] D [/math], [math] M = \mathcal{T}(D) [/math] — относительно компактно.

[math] \forall \varepsilon \gt 0 \; \exists y_1 \in M, \ldots, y_p \in M [/math] — конечная [math] \varepsilon [/math]-сеть.

Построим следующую функцию: [math] \forall j = 1, \ldots, p, \forall y \in M: [/math]

[math] \mu_j(y) = \begin{cases} 0 & \mbox{if } \| y - y_j \| \ge \varepsilon \\ \varepsilon - \| y - y_j \| & \mbox{if } \| y - y_j \| \lt \varepsilon \end{cases} [/math]

Легко проверить, что для любого [math] j [/math] функция [math] \mu_j [/math] непрерывна на [math] M [/math]. В самом деле, вне интервала [math] (y_j - \varepsilon;\,y_j + \varepsilon) [/math] функция [math] \mu_j [/math] непрерывна как константа, внутри интервала она непрерывна в силу непрерывности нормы, а кроме того [math] \lim\limits_{y \rightarrow y_j \pm \varepsilon} (\varepsilon - \| y - y_j \|) = 0 = \mu_j(y_j \pm \varepsilon) [/math]

Поскольку [math] \{ y_j \} [/math][math] \varepsilon [/math]-сеть, то [math] \forall y [/math] все [math] \mu_j(y) [/math] не могут быть равны нулю одновременно.

Обозначим [math] S(y) = \sum\limits_{j=1}^p \mu_j(y) [/math]. По предыдущему утверждению, [math] \forall y: S(y) \gt 0 [/math]


Определение:
[math] P_\varepsilon (y) = \sum\limits_{j=1}^p \frac {\mu_j(y)} {S(y)} y_j [/math]проектор Шаудера.


Коэффициенты [math] \frac {\mu_j(y)} {S(y)} [/math] обозначим за [math] \alpha_j(y) [/math]. Из определения следует, что [math] \sum\limits_{j=1}^p \alpha_j(y) = 1 [/math], то есть, [math] P_\varepsilon(y) [/math] есть выпуклая комбинация точек [math] \varepsilon [/math] сети для любого [math] y [/math].

[math] P_\varepsilon(M) \subset \mathcal{L}(y_1, \ldots, y_p) [/math]

Если [math] M = \mathcal{T}(D) [/math] — выпуклое множество, то [math] P_\varepsilon(y) \in M [/math], как выпуклая комбинация точек [math] y_1, \ldots, y_p [/math].

Рассмотрим [math] \| P_\varepsilon (\mathcal{T} x) - \mathcal{T} x \| = \| \sum\limits_{j=1}^p \alpha_j(y) \cdot y_j - \sum\limits_{j=1}^p \alpha_j(y) \cdot y \| = \| \sum\limits_{j=1}^p \alpha_j(y) \cdot (y_j - y) \| [/math].

Если [math] \| y_j - y \| \gt \varepsilon [/math], то [math] \alpha_j(y) = 0 [/math], поэтому, продолжая цепочку неравенств, [math] \| \sum\limits_{j=1}^p \alpha_j(y) \cdot (y_j - y) \| \le \varepsilon \sum\limits_{j=1}^p \alpha_j(y) \le \varepsilon [/math].

Получили, что [math] P_\varepsilon \mathcal{T} \rightrightarrows \mathcal{T} [/math], когда [math] \varepsilon \to 0 [/math].

Каждый из операторов [math] P_\varepsilon \mathcal{T} [/math] конечномерен: [math] \operatorname{dim} R(P_\varepsilon \mathcal{T}) \lt +\infty [/math].

По неравенству, полученному чуть выше, также имеем [math] \| P_\varepsilon (\mathcal{T} x) - \mathcal{T} x \| \le \varepsilon \, \forall x \in D [/math].

В итоге мы имеем следующую теорему:

Теорема:
Проекторы Шаудера оператора [math] \mathcal{T} [/math] равномерно сходятся к [math] \mathcal{T} [/math]: [math] P_\varepsilon \mathcal{T} \rightrightarrows \mathcal{T} [/math], то есть любой вполне непрерывный оператор является равномерным пределом последовательности конечномерных операторов.

Соединяя с теоремой Брауэра, получим:

[math] M [/math] — выпуклое ограниченное множество, оператор [math] \mathcal{T} : M \to M [/math] является вполне ограниченным.

Определим последовательность [math] \mathcal{T}_n = P_{\frac 1n} \mathcal{T} [/math]. [math] \mathcal{T}_n : M \to M_n [/math], где [math] M_n [/math] — подмножество конечномерного пространства. Каждое [math] M_n [/math] является замкнутым выпуклым множеством, поскольку является линейной оболочкой соответствующей [math]\frac{1}{n}[/math]-сети.

Применяя теорему Брауэра, получаем, что [math] \forall n: \exists x_n \in M_n: x_n = \mathcal{T}_n x_n = x_n [/math]. Учитывая, что [math] M_1 \cup M_2 \cup \ldots [/math] относительно компактно, из [math] \{ x_n \} [/math] можно выделить сходящуюся подпоследовательность: [math] \exists x_{n_k} \to x^* \in M [/math].

[math] \| x^* - \mathcal{T}x^* \| = \| \lim(x_{n_k} - \mathcal{T} x_{n_k}) \| [/math].

По выбору [math] x_{n_k} [/math]: [math] x_{n_k} = \mathcal{T}_{n_k} x_{n_k} [/math].

По равномерной сходимости [math] \mathcal{T}_n \rightrightarrows \mathcal{T} [/math]: [math] \| \mathcal{T}_{n_k} x_{n_k} - \mathcal{T} x_{n_k} \| \le \varepsilon [/math], начиная с [math] k_0 [/math] для всех [math] x \in M [/math].

Откуда, окончательно, получаем, что искомый предел равен [math] 0 [/math], и [math] \| x^* - \mathcal{T} x^* \| = 0 [/math], и [math] x^* = \mathcal{T} x^* [/math]. Теорема Шаудера доказана.

Thats all forks.jpg