Теорема Банаха об обратном операторе

Материал из Викиконспекты
Перейти к: навигация, поиск
Эта статья находится в разработке!


Определение:
Оператор [math] A : X \to Y [/math] называется непрерывно обратимым, если существует [math] A^{-1} : Y \to X [/math] и [math] \| A^{-1} \| \lt \infty [/math], причем [math]A^{-1}[/math] должен быть определен на всем [math]Y[/math].


Теорема (Банах, о непрерывной обратимости I-C):
Пусть [math] X [/math] — B-пространство, оператор [math] C : X \to X, C \in {L}(X) [/math] и [math] \| C \| \lt 1 [/math]. Тогда оператор [math] I - C [/math], где [math] I [/math] — тождественный оператор, непрерывно обратим.
Доказательство:
[math]\triangleright[/math]

[math] {L}(X) [/math] — B-пространство.

Рассмотрим следующие суммы: [math] S_n = \sum\limits_{k=0}^n C^k [/math].

[math] (I - C)S_n = \sum\limits_{k=0}^n (C^k - C^{k + 1}) = I - C^{n + 1} [/math].

[math] \sum\limits_{k=0}^{\infty} C^k [/math] — ряд в B-пространстве [math] {L}(X) [/math] сходится, если сходится ряд из соответствующих норм. Покажем это: пусть есть операторный ряд [math]\sum\limits_{i=1}^\infty A_i[/math]. Рассмотрим последовательность частичных сумм [math]S_n = \sum\limits_{i=1}^n A_i[/math], она будет сходиться если сходится в себе (по Банаховости пространства). Тогда [math]S_n - S_m = \sum\limits_{i=m}^{n} A_i[/math], а [math]\|S_n - S_m\| = \| \sum\limits_{i=m}^n A_i \| \le \sum\limits_{i=m}^n \|A_i\|[/math] (так как для конечного числа членов норма суммы меньше суммы норм), но так как последовательность норм сходится, она также сходится в себе и [math]\sum\limits_{i=m}^n \|A_i\| \xrightarrow[n, m \to \infty]{} 0[/math], то есть частичные суммы сходятся в себе, а, значит, и сходятся.

Из того, что [math] \| C^k \| \le \| C \|^k [/math], получаем [math] \left\| \sum\limits_{k=0}^{\infty} C^k \right\| \le \sum\limits_{k=0}^{\infty} \| C \|^k = \frac 1{1 - \| C \|} \lt \infty [/math].

Так как [math] \| C \| \lt 1 [/math], то существует такой [math] S \in {L}(X) [/math], что [math] S = \sum\limits_{k=0}^{\infty} C^k [/math].

[math] S_n \xrightarrow[n \to \infty]{} S [/math]. Поскольку [math] \| C \| \lt 1 [/math], то [math] \| C^k \| \to 0 [/math], а значит, и [math] C^k \to \mathbb{O} [/math].

[math] (I - C)S_n = I - C^{n + 1} [/math]. Устремляя [math] n [/math] к бесконечности, получаем [math] (I - C)S = I [/math], а значит [math] S = \sum\limits_{k=0}^{\infty} C^k = (I - C)^{-1} [/math] — ограниченный оператор.
[math]\triangleleft[/math]

Трактовка этой теоремы: [math] Ix = x [/math], [math] I [/math] — непрерывно обратимый оператор. При каких условиях на оператор [math] C [/math] оператор [math] I - C [/math] сохраняет ннепрерывную обратимость? Из теоремы выше известен ответ на этот вопрос: когда [math] \| C \| \lt 1 [/math], то есть "при малых возмущениях [math] I [/math] сохраняется его непрерывная обратимость".

Далее считаем, что пространства [math]X[/math] и [math]Y[/math] — всегда банаховы.


Определение:
Рассмотрим уравнение [math] Ax = y [/math] при заданном [math] y [/math]. Если для такого уравнения можно написать [math] \| x \| \le \alpha \| y \| [/math], где [math] \alpha [/math] — константа, то говорят, что это уравнение допускает априорную оценку решений.


[math] R(A) = \{ Ax \mid x \in X \} [/math] — область значений оператора [math] A [/math], является линейным множеством, но может быть незамкнутым. Однако, верно следующее:

Утверждение:
Если [math] A [/math] непрерывен, и уравнение [math] Ax = y [/math] допускает априорную оценку решений, то [math] R(A) = \mathrm{Cl} R(A) [/math].
[math]\triangleright[/math]

Возьмем сходящуюся последовательсть [math] y_n \in R(A), y_n \to y [/math]. Нужно проверить, правда ли [math] y \in R(A) [/math], или, что то же самое, что уравнение [math] Ax = y [/math] имеет решение для такого [math] y [/math].

[math] y_n \to y \implies \| y_n - y_m \| \to 0 [/math]. Можно выбрать такую подпоследовательность [math] y_n [/math], что для этой подпоследовательности после перенумерации будет выполняться [math] \| y_n - y_{n+1} \| \lt \frac 1{2^n} [/math].

По линейности [math] R(A) [/math]: [math] y_{n+1} - y_n \in R(A) [/math] и для любого [math] n [/math] существует [math] x_n: A x_n = y_{n+1} - y_n [/math].

Поскольку уравнение [math] Ax = y [/math] допускает априорную оценку решений, имеем [math] \| x_n \| \le \alpha \| y_{n+1} - y_n \| [/math].

Рассмотрим следующий ряд: [math] \sum\limits_{n=1}^{\infty} x_n [/math]. Сумма ряда из норм: [math] \sum\limits_{n=1}^{\infty} \| x_n \| \le \alpha \sum\limits_{n=1}^{\infty} \| y_{n+1} - y_n \| \le \alpha \sum\limits_{n=1}^{\infty} \frac 1{2^n} = \alpha [/math]. По банаховости [math] X [/math] получаем, что [math] \sum\limits_{n=1}^{\infty} x_n [/math] сходится, и [math] \sum\limits_{n=1}^{\infty} x_n = x [/math].

По непрерывности [math] A [/math] получаем, что [math] Ax = A \sum\limits_{n=1}^{\infty} x_n = \sum\limits_{n=1}^{\infty} A x_n = \sum\limits_{n=1}^{\infty} y_{n+1} - y_n = y - y_1 [/math].

[math] Ax = y - y_1, y = Ax + y_1 = Ax + A x_0 = A(x + x_0) [/math], поэтому [math] y \in R(A) [/math].
[math]\triangleleft[/math]
Теорема:
Пусть [math] A : X \to Y [/math] — линейный ограниченный оператор, и [math]\exists m \gt 0: m \| x \| \le \| Ax \| [/math]. Тогда [math] A [/math] непрерывно обратим на [math]R(A)[/math].
Доказательство:
[math]\triangleright[/math]
Заметим, что в ядре только нулевой элемент, в противном случае: пусть [math]x \ne 0[/math], тогда [math]0 \lt m \|x\| \le \|A x\| = 0[/math]. Из этого следует, что оператор инъективен: пусть [math]A x_1 = y, A x_2 = y[/math], тогда [math]A (x_1 - x_2) = 0[/math], что возможно только когда [math]x_1 = x_2[/math]. Так как строим обратный оператор на [math]R(A)[/math], [math]\forall y \in R(A) \exists x: A x = y[/math], то есть оператор биективен на области значений, определим [math]A^{-1}[/math] на всем [math]R(A)[/math] и для любого [math]y[/math] рассмотрим [math]x = A^{-1} y[/math]. Тогда [math] m \|x\| = m \|A^{-1} y \| \le \|A A^{-1} y\| \implies \|A^{-1} y\| \le \frac{1}{m} \|y\|[/math], то есть оператор ограничен константой [math]\frac{1}{m}[/math].
[math]\triangleleft[/math]

Теорема Банаха о гомеоморфизме

Перед доказательством теоремы Банаха о гомеоморфизме докажем для начала вспомогательную лемму.

Утверждение:
Рассмотрим линейный оператор [math] A : X \to Y [/math]. Обозначим [math] X_n = \{ x \in X: \| Ax \| \le n \| x \| \} [/math]. Тогда хотя бы одно [math] X_n [/math] всюду плотно в [math] X [/math].
[math]\triangleright[/math]

Очевидно, что [math] X = \bigcup\limits_{n=1}^{\infty} X_n [/math], [math] X [/math] — B-пространство (а значит, и полное метрическое), значит, по теореме Бэра о категориях, [math] X [/math] — 2 категории, то есть какое-то множество [math]X_{n_0}[/math] не является нигде не плотным.

Вспомним определение нигде не плотности: [math]A[/math] нигде не плотно, если [math]\forall V \exists U \subset V: A \cap U = \emptyset[/math]. Раз [math]X_{n_0}[/math] не является нигде не плотным, то [math]\exists V \forall U \subset V: X_{n_0} \cap U \ne \emptyset[/math], то есть [math]X_{n_0}[/math] всюду плотно в каком-то открытом шаре. Теперь возьмем замкнутый шар [math]\overline V_r(a)[/math], лежащий в этом открытом шаре, причем такой, что [math]a \in X_{n_0}[/math].

Заметим, что множество [math]X_{n_0}[/math] также всюду плотно в кольце [math]R = \{z \mid \frac r2 \le \| z - a \| \le r \}[/math]. Сдвинем и множество [math]X_{n_0}[/math], и кольцо на [math]a[/math], то есть центр кольца окажется в точке [math]0[/math]. Сдвинутое [math]X_{n_0}[/math] будет также всюду плотно в сдвинутом кольце. Теперь покажем, что найдется такое множество [math]X_m[/math], что пересечение сдвинутого [math]R[/math] и сдвинутого [math]X_{n_0}[/math] лежит в [math]X_m[/math], то есть [math]X_m[/math] будет всюду плотно в сдвинутом кольце.

Рассмотрим кольцо: [math] \{z \mid \frac r2 \le \| z - a \| \le r \} [/math]. Обозначим [math] y = z - a [/math], тогда кольцо имеет следующий вид: [math] \{\frac r2 \le \| y \| \le r \} [/math] — кольцо с центром в [math] 0 [/math].

Будем рассматривать [math] z \in X_{n_0} \cap \{\frac r2 \le \| z - a \| \le r \}, y = z - a[/math]. Проверим, что [math]y[/math] войдет в какое-нибудь [math]X_m[/math]:

[math] \| Ay \| = \frac {\| A(z - a) \|}{\| y \|} \| y \| \le \frac 2r (\| Az \| + \| Aa \|) \| y \| [/math], так как [math] \| y \| \ge \frac r2 [/math].

Поскольку [math] z \in X_{n_0} [/math], то [math] \| Az \| \le n_0 \| z \| [/math]. [math] \| z \| \le \| a \| + \| z - a \| \le r + \| a \| [/math], так как [math] z [/math] принадлежит кольцу.

Подставляем и продолжаем неравенство выше: [math] \| Ay \| \le \frac2r (n_0 (r + \| a \|) + \| Aa \|) \| y \| [/math].

Обозначим [math] m = \lceil (n_0 (r + \| a \|) + \| Aa \|) \rceil [/math] (это выражение не зависит от [math] y [/math]), получаем, что [math] \| Ay \| \le m \| y \| \implies y \in X_m [/math].

Итак, получили, что [math] X_m [/math] всюду плотно в кольце с центром в [math] 0 [/math]. Возьмем теперь любой [math] x \in X [/math], его можно представить как [math] x = tz, z \in \{\frac r2 \le \| z \| \le r \} [/math].

По всюду плотности в кольце, найдется последовательность [math]y_p[/math] в [math]X_m \cap \{\frac r2 \le \| z \| \le r \}[/math] такая, что [math]y_p \to z [/math]. Но [math] ty_p \to tz = x [/math]. [math] \| A(ty_p) \| \le m \| t y_p \| \implies ty_p \in X_m [/math].

Взяв любую точку из [math] X [/math], мы можем приблизить ее элементами [math] t y_p \in X_m [/math], а значит, [math]\mathrm{Cl} \ X_m = X [/math], то есть [math]X_m[/math] всюду плотно в [math] X [/math].
[math]\triangleleft[/math]

На основе доказанной леммы можем доказать теорему:

Теорема (Банаха, о гомеоморфизме):
Пусть [math] A : X \to Y [/math] — линейный ограниченный оператор, причем осуществляющий биекцию, тогда [math] A^{-1} [/math] — линейный ограниченный оператор.
Доказательство:
[math]\triangleright[/math]

Если [math] A [/math] — биекция, то [math] A^{-1} [/math] существует. Осталось показать, что он будет ограничен.

Представим [math]Y[/math] как [math]\bigcup\limits_{n=1}^{\infty} Y_n[/math], [math] Y_n = \{ y \in Y \mid \| A^{-1}(y) \| \le n \| y \| \}[/math] (заметим, что для леммы не требуется ограниченность оператора).

По только что доказанной лемме, существет такое число [math] n_0 [/math], что [math]\mathrm{Cl} Y_{n_0} = Y [/math], обозначим этот [math]Y_{n_0}[/math] как [math]Y^*[/math].

Рассмотрим произвольный [math] y \in Y [/math]. Покажем, что существует такое разложение [math] y = \sum\limits_{n=1}^{\infty} y_n [/math], что [math] y_n \in Y^*, \| y_n \| \le \frac 3{2^n} \| y \| [/math].

По всюду плотности, для любого [math] \varepsilon [/math] можно подобрать [math] y_1 \in Y^* : \| y - y_1 \| \lt \varepsilon \| y \| [/math]. Дальше можно подобрать [math] y_2 \in Y^* : \| (y - y_1) - y_2 \| \lt \frac {\varepsilon}2 \| y \| [/math], и так далее, получаем, что [math] \| y - \sum\limits_{k = 1}^n y_k \| \lt \frac {\varepsilon}{2^{n-1}} \| y \| [/math].

Проверим, что для всех [math]y_n[/math] их норма удовлетворяет условию разложения: [math] \| y_n \| \le \| \sum\limits_{k = 1}^n y_k - y + y - \sum\limits_{k = 1}^{n-1} y_k \|[/math][math] \le \| y - \sum\limits_{k = 1}^n y_k \| + \| y - \sum\limits_{k = 1}^{n - 1} y_k \| \le \frac {\varepsilon}{2^{n-1}} \| y \| + \frac {\varepsilon}{2^{n-2}} \| y \| = \frac {3\varepsilon}{2^{n-2}} \| y \| [/math]

В качестве [math] \varepsilon [/math] выберем [math] \frac 14 [/math], и получим необходимое разложение [math] y [/math].

Итак, теперь [math] y = \sum\limits_1^{\infty} y_n, y_n \in Y^*, \| y_n \| \le \frac 3{2^n} \| y \| [/math].

Обозначим [math] x_n = A^{-1}y_n [/math]. Рассмотрим ряд из [math] x_n [/math]: [math] \sum\limits_{n=1}^{\infty} x_n [/math], проверим сходимость ряда из норм: [math] \sum\limits_{n=1}^{\infty} \| x_n \| \lt \infty [/math].

Вспомним, что [math] y_n \in Y^* = Y_{n_0} [/math].

[math] \| x_n \| = \| A^{-1} y_n \| \le n_0 \| y_n \| \le n_0 \frac 3{2^n} \| y \| [/math]: ряд из [math] \| x_n \| [/math] мажорируется убывающей геометрической прогрессией, а значит, сходится. Получили, что существует [math] x = \sum\limits_{n=1}^{\infty} x_n [/math].

Используем непрерывность [math] A [/math]: [math] Ax = \sum\limits_{n=1}^{\infty} Ax_n = \sum\limits_{n=1}^{\infty} y_n = y [/math], получили, что [math] Ax = y, A^{-1}y = x [/math].

Рассмотрим норму [math] A^{-1}y [/math]: [math] \| A^{-1} y \| = \| x \| = \| \sum\limits_{n=1}^{\infty} x_n \| \le \sum\limits_{n=1}^{\infty} 3n_0 \| y \| \frac 1{2^n} = 3n_0 \| y \| [/math].

Поскольку [math] y [/math] выбирался произвольный, получаем, что [math] A^{-1} [/math] ограничен.
[math]\triangleleft[/math]

Теорема о замкнутом графике

Определение:
Графиком линейного оператора [math] A: X \to Y [/math] называется множество [math] G(A) = \{ (x, Ax) \mid x \in X \}, G(A) \subset X \times Y [/math].


В прямых произведениях множеств сходимость — покоординатная, поэтому можно говорить о замкнутости множеств.

Теорема (о замкнутом графике):
Линейный [math]A : X \to Y [/math] ограничен [math] \iff [/math] [math] G(A) [/math] — замкнут.
Доказательство:
[math]\triangleright[/math]

Докажем в прямую сторону: пусть есть последовательность пар [math] (x_n, y_n) \to (x, y) [/math]. Принадлежит ли [math] (x, y)\, G(A) [/math] ?

[math] y_n = Ax_n, x_n \to x \implies Ax_n \to Ax, y_n \to y \implies Ax=y [/math] (по единственности предела). Так как [math] Ax = y [/math], то [math] (x, Ax) = (x, y) \in G(A) [/math].

Обратное следствие интереснее.

Пусть [math] G(A) = \{ (x, Ax) \mid x \in X \} [/math] замкнут.

Можно показать, что [math] X \times Y [/math] банахово с нормой [math] \| (x, y) \| = \| x \| + \| y \| [/math]:

  • То, что [math]\| (x, y) \| = \|x\| + \|y\|[/math] — норма, показывается очевидно
  • Покажем, что если [math](x_n, y_n)[/math] сходится в себе, то она сходится к элементу [math]X \times Y[/math]. Рассмотрим последовательность [math]\|(x_n, y_n) - (x_m, y_m) \| \xrightarrow[n, m \to \infty]{} 0[/math], значит, [math]\|(x_n - x_n, y_m - y_m)\| = \|x_n - x_m\| + \|y_n - y_m\| \to 0[/math], то есть [math]x_n[/math] и [math]y_n[/math] сходятся в себе, а значит, по полноте пространств [math]X[/math] и [math]Y[/math], существует [math]x \in X = \lim x_n, y \in Y = \lim y_n[/math]. Значит, [math](x, y) \in X \times Y[/math]. Далее очевидно показывая, что [math]\|(x_n, y_n) - (x, y)\| \xrightarrow[n \to \infty]{} 0[/math], покажем, что [math]x, y[/math] и есть нужный предел.

Рассмотрим следующий оператор: [math] T : G(A) \to X, T(x, Ax) = x [/math]. [math] T [/math] биективно отображает [math] G(A) [/math] в [math] X [/math].

[math] \|\| T(x, Ax) \| = \| x \| \le \| (x, Ax) \| \implies T [/math] ограничен.

По теореме Банаха о гомеоморфизме, так как [math] T [/math] ограничен и биективен, то существует [math] T^{-1} [/math], который также ограничен. Рассмотрим его.

[math] T^{-1}(x) = (x, Ax), \| T^{-1}(x) \| = \| x \| + \| Ax \| \le M \| x \| [/math] (по ограниченности). Получаем, что [math] \| Ax \| \le (M - 1) \| x \| [/math], откуда [math] A [/math] ограничен.
[math]\triangleleft[/math]

Теорема об открытом отображении

Определение:
[math] F : X \to Y [/math] — произвольное отображение. Если для любого открытого [math] G \subset X [/math] [math] F(G) [/math] открыто в [math] Y [/math], то [math] F [/math] называют открытым отображением.


Теорема (об открытом отображении):
Пусть [math] A : X \to Y [/math] — линейный ограниченный оператор. Тогда [math] A [/math] — открытое отображение.
Доказательство:
[math]\triangleright[/math]

[math] Z = \mathrm{Ker} A [/math] — линейное подпространство в [math] X [/math].

Рассмотрим [math] X/_Z [/math] — фактор-подпространство. [math] i : X \to X/_Z, i(x) = [x][/math], где [math] [x] [/math] — класс смежности [math] x [/math], [math]i[/math] называется каноническим вложением [math]X[/math] в фактор-пространство. Оператор [math] i [/math] — линейный и ограниченный, переводит открытое множество в [math] X [/math] в открытое множество в [math] X/_Z [/math] TODO: почему это он так делает?, то есть открытый.

  • [math]i(x + y) = [x + y] = [x] + [y] = i(x) + i(y)[/math] - по свойствам фактор-множества
  • [math]i(\alpha x) = [\alpha x] = \alpha [x] = \alpha i [/math] - по свойствам фактор-множства показали линейность.
  • [math]\|i\| = \sup \limits_{\|x\| = 1} \|ix\| = \sup \limits_{\|x\| = 1} \|[x]\| = \sup \limits_{\|x\| = 1} \inf \limits_{z \in Z} \| x- z \|_{X}[/math][math] \le \sup \limits_{\|x\| = 1} \inf \limits_{z \in Z} (\| x \|_{X} + \| z \|_{X}) \le 1 + \inf \limits_{z \in Z} \| z \|_{X} = 1 \lt + \infty [/math] - показали ограниченность

Введем норму как [math]\|[x]\|_{X /_Z} = \inf\limits_{z \in Z} \| x - z \|_X[/math] (заметим, что ее значение не зависит от того, какой [math]x \in [x][/math] выбрать. Покажем, что это действительно норма:

  • положительная определенность очевидна, покажем равенство нулю только в нулевом классе эквивалентности: пусть [math]x \ne 0, \|[x]\| = 0, x \notin [0][/math], тогда [math]f(x)\ne 0[/math] и по определению инфимума, существует последовательность [math]z_n \in Z: \|z_n - x\| \to 0[/math], но тогда [math]x[/math] — предел последовательности [math]z_n[/math] и по замкнутости ядра также лежит в ядре, получили противоречие.
  • вторая аксиома очевидна
  • третья аксиома: [math]\|[x] + [y]\| = \inf\limits_{z \in Z} \|x + y - z\|_X = \inf\limits_{z \in Z} \|x - \frac{z}{2} + y - \frac{z}{2}\| \le \inf\limits_{z \in Z}\|x - \frac{z}{2}\| + \inf\limits_{z \in Z} \|y - \frac{z}{2}\|[/math]. Заметим что так как [math]Z[/math] — линейное подпространство, [math]\frac{z}{2}[/math] пробегает те же элементы, что и [math]z[/math], то есть [math]\inf\limits_{z \in Z}\|x - \frac{z}{2}\| + \inf\limits_{z \in Z} \|y - \frac{z}{2}\| = \inf\limits_{z \in Z}\|x - z\| + \inf\limits_{z \in Z} \|y - z\| = \|[x]\| + \|[y]\|[/math].

Рассмотрим [math] U_A : X/_Z \to Y[/math]— оператор, ассоциированный с [math] A [/math]. То, что [math]U_A([x]) = y[/math], означает, что для некоторого [math]x \in [x], k \in \mathrm{Ker} A: A(x + k) = y[/math], заметим, что при этом [math] A = U_A \cdot i [/math]. Покажем ограниченность [math]U_A[/math]: [math]\|U_A\| = \sup\limits_{\|[x]\| = 1} \|U_a([x])\| = \sup\limits_{\|[x]\| = 1} \|A (x \in [x])\|[/math]. Покажем, что если [math]\|[x]\| = 1[/math], то [math]\exists x \in [x]: \|x\| \le 1[/math], а, значит, [math]\|A x\| \le \|A\|[/math]. TODO: неясно, как показать Таким образом, получим [math]\|x\| \le \|[x]\| = 1[/math], и получили ограниченность.

Покажем, что [math]U_A[/math] разные классы переводит в разные точки [math] Y [/math], так как факторизация происходит по ядру [math]A[/math]: пусть [math]U_A([x]_1) = y[/math] и [math]U_A([x]_2) = y[/math], это значит, что [math]A(x_1 + k_1) = y, A(x_2 + k_2) = y \implies A(x_1 + k_1) - A(x_2 + k_2) = 0[/math], по линейности [math]A(x_1 - x_2) + A(k_1 - k_2) = 0 \implies A(x_1 - x_2) = 0[/math], так как [math]k_1 - k_2[/math] в ядре. Но тогда получили, что [math]x_1 - x_2[/math] также в ядре, то есть [math]x_1[/math] отличается от [math]x_2[/math] на элемент ядра, и находятся в одном классе эквивалентности, получили противоречие.

Таким образом, оператор [math] U_A : X/_Z \to R(A)[/math] биективен, следовательно, [math]U_A^{-1} [/math] — непрерывен (по теореме Банаха), , так как [math]U_A[/math] тоже непрерывен, то прообразы (по оператору [math]U_A[/math]) всех открытых в [math]Y[/math] открыты в [math]X[/math], а прообразы (по оператору [math]U_A^{-1}[/math] всех открытых в [math]X[/math] открыты в [math]Y[/math]. Значит [math] U_A [/math] переводит открытые множества в открытые и является открытым отображением. Так как [math]i[/math] открытое и суперпозиция открытых отображение открыта, [math] A [/math] тоже открыт.
[math]\triangleleft[/math]

Ссылки