Локальная теорема о неявном отображении — различия между версиями

Материал из Викиконспекты
Перейти к: навигация, поиск
(Статью еще пилить и пилить до читаемого состояния.)
Строка 1: Строка 1:
 
==Принцип сжатия Банаха==
 
==Принцип сжатия Банаха==
  
Пусть <tex>X</tex> {{---}} B-пространство. Пусть <tex>\overline V</tex> {{---}} замкнутый шар в <tex>X</tex>.
+
Принцип сжатия будем излагать для нормированных пространств, хотя он без изменения переносится на метрические пространства.
 +
 
  
 
{{Определение
 
{{Определение
|definition=<tex> \mathcal{T} : \overline V \to \overline V</tex> {{---}} ''сжатие'' на шаре <tex>V</tex>, если <tex>\exists q \in (0;1) \ \forall x',x'' \in \overline V</tex> <tex> : \| \mathcal{T}x''-\mathcal{T}x' \| \le q \|x''-x'\|</tex>
+
|definition=
 +
Пусть <tex>X</tex> {{---}} B-пространство. Пусть <tex>\overline V</tex> {{---}} замкнутый шар в <tex>X</tex>.<br>
 +
 
 +
<tex> \mathcal{T} : \overline V \to \overline V</tex> {{---}} '''сжатие''' на шаре <tex>V</tex>, если <tex>\exists q \in (0;1) \ \forall x',x'' \in \overline V</tex> <tex> : \| \mathcal{T}x''-\mathcal{T}x' \| \le q \|x''-x'\|</tex>.
 
}}
 
}}
 +
 
{{Теорема
 
{{Теорема
 
|author=Банах
 
|author=Банах
 
|statement=
 
|statement=
У любого сжимающего отображения существует неподвижная точка <tex>x^*=\mathcal{T}x^*</tex>.
+
У любого сжимающего отображения существует ровно одна неподвижная точка <tex>x^*=\mathcal{T}x^*</tex>.
 
|proof=
 
|proof=
<tex>\forall x_0 \in \overline V x_{n+1}=\mathcal{T}x_n</tex>.  
+
<tex>\forall x_0 \in \overline V:\ x_{n+1}=\mathcal{T}x_n</tex>.
 +
 
 
Тогда <tex>\|x_{n+1}-x_n\| = \|\mathcal{T}x_n-\mathcal{T}x_{n-1}\|\le q \|x_n-x_{n-1}\| \leq \ldots \leq q^n \|x_1-x_0\|</tex>
 
Тогда <tex>\|x_{n+1}-x_n\| = \|\mathcal{T}x_n-\mathcal{T}x_{n-1}\|\le q \|x_n-x_{n-1}\| \leq \ldots \leq q^n \|x_1-x_0\|</tex>
  
Строка 21: Строка 27:
 
<tex>\sum\limits_{k=1}^\infty \|x_{k+1}-x_k\| \le \|x_1-x_0\|\sum\limits_{k=1}^\infty q^k</tex>, <tex>0<q<1</tex>.
 
<tex>\sum\limits_{k=1}^\infty \|x_{k+1}-x_k\| \le \|x_1-x_0\|\sum\limits_{k=1}^\infty q^k</tex>, <tex>0<q<1</tex>.
  
Последний ряд сходится и ряд из норм тоже сходится. По свойствам рядов определим <tex>S=x_1+\sum\limits_{k=1}^\infty (x_{k+1}-x_k)</tex>. <tex>S_n=x_{n+1}</tex>. Если <tex> S_n \to S</tex>, то <tex>x_n \to S</tex>. Но любое сжатие непрерывно. Это позволяет в <tex>x_{n+1}=Tx_n</tex> перейти к пределу — <tex>S=TS</tex>. Если <tex>Tx'=x', Tx''=x''</tex>, то составим норму их разности: <tex>\|x''-x'\|=\|Tx''-Tx'\| \le q\|x''-x'\|</tex> и при <tex>\|x''-x'\| \ne 0</tex> <tex>q \ge 1</tex> — противоречие. <tex>\|x''-x' \|= 0</tex>, следовательно, <tex>x''=x'</tex>.
+
Последний ряд сходится и ряд из норм тоже сходится.  
 +
 
 +
По свойствам рядов определим <tex>S=x_1+\sum\limits_{k=1}^\infty (x_{k+1}-x_k)</tex>. <tex>S_n=x_{n+1}</tex>. Если <tex> S_n \to S</tex>, то <tex>x_n \to S</tex>. Но любое сжатие непрерывно(так как оно ограничено). Это позволяет в <tex>x_{n+1}=Tx_n</tex> перейти к пределу — <tex>S=TS</tex>. Получили неподвижную точку <tex> S </tex>.
 +
 
 +
Допустим теперь, что существуют две различных неподвижных точки:
 +
 
 +
Если <tex>Tx'=x', Tx''=x''</tex>, то составим норму их разности: <tex>\|x''-x'\|=\|Tx''-Tx'\| \le q\|x''-x'\|</tex> и при <tex>\|x''-x'\| \ne 0</tex> <tex>q \ge 1</tex>, что противоречит условию.
 +
 
 +
Поэтому <tex>\|x''-x' \|= 0</tex>, следовательно, <tex>x''=x'</tex>.
 
}}
 
}}
  
 
== 2 ==  
 
== 2 ==  
<tex>\overline x \in V \subset \mathbb{R}^n, \overline y \in W \subset \mathbb{R}^m</tex>; <tex>V\times W=\{(\overline x, \overline y) \in \mathbb R^{n+m},\overline x \in V, \overline y \in W\}</tex>.
+
Пусть <tex>\overline x \in V \subset \mathbb{R}^n, \overline y \in W \subset \mathbb{R}^m</tex>, тогда рассмотрим <tex>V\times W=\{(\overline x, \overline y) \in \mathbb R^{n+m},\overline x \in V, \overline y \in W\}</tex>.
  
<tex>f\colon V(\overline {x_0})\times W(\overline {y_0}) \to \mathbb{R}^m</tex>, <tex>f(x_0,y_0)=0^m</tex>. Существуют ли такие <tex>\delta_1,\delta_2>0</tex>, что <tex>\forall\overline x\in V_{\delta_1}(\overline{x_0})\ \exists! \overline y\in W_{\delta_2}(\overline{y_0})\colon f(\overline x,\overline y)=0^m</tex>?
+
<tex>f\colon V(\overline {x_0})\times W(\overline {y_0}) \to \mathbb{R}^m</tex>, <tex>f(x_0,y_0)=0^m</tex>. Существуют ли такие <tex>\delta_1,\delta_2>0</tex>, что для любого <tex>\overline x\in V_{\delta_1}(\overline{x_0})</tex> существует единственный <tex> \overline y\in W_{\delta_2}(\overline{y_0})\colon f(\overline x,\overline y)=0^m</tex>?
  
Если это так, то в силу единственности <tex>\overline y </tex> определяем <tex>\overline y = \phi(\overline x)</tex> на <tex>V_{\delta_1}(\overline{x_0})</tex> так, чтобы <tex>f(\overline x,\phi(\overline x))=0^m</tex>. <tex>\phi</tex> — неявное отображение, определяется как <tex>f(\overline x,\overline y)=0^m,~(x_0,y_0)\colon f(\overline{x_0},\overline{y_0})=0^m</tex>
+
Если это так, то, в силу единственности y, определяем <tex>\overline y = \phi(\overline x)</tex> на <tex>V_{\delta_1}(\overline{x_0})</tex> так, чтобы <tex>f(\overline x,\phi(\overline x))=0^m</tex>. <tex>\phi</tex> — неявное отображение, определяется как <tex>f(\overline x,\overline y)=0^m,~(x_0,y_0)\colon f(\overline{x_0},\overline{y_0})=0^m</tex>
  
  
Строка 40: Строка 54:
 
Сейчас мы установим условия, при которых неявное отображение будет существовать:
 
Сейчас мы установим условия, при которых неявное отображение будет существовать:
  
<tex>\overline z=f(\overline x,\overline y).~\overline x \in \mathbb R^n;~y,z\in R^m.~f_{\overline y}'</tex> — производная отображения <tex>f</tex>, при фиксированном <tex>x</tex> и варьирующемся <tex>y</tex>.
+
<tex>\overline z = f(\overline x,\overline y).~\overline x \in \mathbb R^n;~y,z\in \mathbb R^m.~f_{\overline y}'</tex> — производная отображения <tex>f</tex>, при фиксированном <tex>x</tex> и варьирующемся <tex>y</tex>.
  
<tex>f_{\overline y}'(\overline x,\overline y)</tex> (зависит и от <tex>\overline x</tex>, и от <tex>\overline y</tex>). Непрерывность <tex>f_{\overline y}'</tex>: производная — линейный оператор, поэтому непрерывность понимается в метрике линейного оператора:
+
<tex>f_{\overline y}'</tex> зависит и от <tex>\overline x</tex>, и от <tex>\overline y</tex>. <tex>f_{\overline y}'</tex> — линейный оператор, поэтому непрерывность <tex>f_{\overline y}'</tex> понимается в метрике линейного оператора:
  
 
<tex>\forall \varepsilon >0 \exists \delta > 0\colon~\|\overline{\mathcal{4}x}\|,\|\overline{\mathcal{4}y}\|<\delta\Rightarrow\|f_{\overline y}'(\overline x + \overline{\mathcal{4}x},\overline y + \overline{\mathcal{4}y})-f_{\overline y}'(\overline x,\overline y)\|<\varepsilon</tex>
 
<tex>\forall \varepsilon >0 \exists \delta > 0\colon~\|\overline{\mathcal{4}x}\|,\|\overline{\mathcal{4}y}\|<\delta\Rightarrow\|f_{\overline y}'(\overline x + \overline{\mathcal{4}x},\overline y + \overline{\mathcal{4}y})-f_{\overline y}'(\overline x,\overline y)\|<\varepsilon</tex>
  
<tex>f_{\overline y}'(\overline x,\overline y)</tex> — матрица, размером <tex>m\times m</tex>. Оператор непрерывно обратим в <tex>(\overline x,\overline y)\Longleftrightarrow</tex> у этой матрицы существует обратная (её детерминант не равен нулю).
+
<tex>f_{\overline y}'(\overline x,\overline y)</tex> — матрица, размером <tex>m\times m</tex>. Оператор непрерывно обратим в <tex>(\overline x,\overline y) </tex>, то есть, у матрицы этого оператора существует обратная (её детерминант не равен нулю).
 +
 
 
{{Теорема
 
{{Теорема
 
|about=
 
|about=
 
О неявном отображении
 
О неявном отображении
 
|statement=
 
|statement=
Пусть для <tex>f</tex> поставлена задача о неявном отображении, с начальными данными <tex>(x_0,y_0)</tex>. Известно, что в окрестности начальных данных<tex>f_{\overline y}'</tex> непрерывно зависит от <tex>\overline x,\overline y</tex>; и в <tex>(x_0,y_0)</tex> она непрерывно обратима. Тогда в некоторой окрестности начальных данных неявное отображение существует.
+
Пусть для <tex>f</tex> поставлена задача о неявном отображении, с начальными данными <tex>(x_0,y_0)</tex>. Известно, что в окрестности начальных данных<tex>f_{\overline y}'</tex> непрерывно зависит от <tex>\overline x,\overline y</tex> и непрерывно обратима в <tex>(x_0,y_0)</tex>. Тогда в некоторой окрестности начальных данных неявное отображение существует.
 
|proof=
 
|proof=
 
Доказательство разбиваем на 2 этапа (и на экзамене они тоже будут спрашиваться по отдельности):
 
Доказательство разбиваем на 2 этапа (и на экзамене они тоже будут спрашиваться по отдельности):
  
<b>1 этап:</b> <tex>\Gamma_0=(f_{\overline y}'(\overline{x_0},\overline{y_0}))^{-1},~f(\overline x, \overline y)=0^m</tex>
+
<b>1 этап:</b>  
 +
 
 +
Пусть <tex>\Gamma_0=(f_{\overline y}'(\overline{x_0},\overline{y_0}))^{-1}</tex>
 +
 
 +
Промежуточное утверждение: <tex>f(\overline x, \overline y)=0^m \Longleftrightarrow\ \overline y = \overline y - \Gamma_0 f(\overline x, \overline y)</tex>.
 +
 
 +
Проверим равносильность:
 +
 
 +
<tex> \Longrightarrow </tex> Пусть <tex>f(\overline x, \overline y) = 0</tex>. <tex>\Gamma_0 f(\overline x, \overline y)=\Gamma_0(0^m)=0,~\overline y = \overline y</tex> — верное в любом случае уравнение.
 +
 
 +
<tex> \Longleftarrow </tex> Пусть теперь <tex>\overline y = \overline y - \Gamma_0 f(\overline x, \overline y)</tex>. Тогда <tex>\Gamma_0 f(\overline x, \overline y)=0^m. \Gamma_0=(f_{\overline y}'(\overline{x_0},\overline{y_0}))^{-1}</tex>, следовательно, <tex>det \Gamma_0 \ne 0</tex>, поэтому соответствующая однородная система уравнений будет иметь только тривиальные решения и <tex>f(\overline x, \overline y)=0^m</tex>
 +
 
 +
Пусть <tex>T(\overline x, \overline y)=\overline y-\Gamma_0 f(\overline x, \overline y)</tex>, тогда <tex>\overline y = T(\overline x,\overline y)</tex>.
 +
 
 +
Для фиксированного <tex> x </tex> получаем задачу на неподвижную точку для отображения <tex>T</tex> по переменной <tex>\overline y</tex> для фиксированного.
  
<tex>\overline y = \overline y - \Gamma_0 f(\overline x, \overline y)</tex>. Проверим равносильность: пусть <tex>f(\overline x, \overline y)=0</tex>. <tex>\Gamma_0 f(\overline x, \overline y)=\Gamma_0(0^m)=0,~\overline y = \overline y</tex> — верное в любом случае уравнение.
+
Воспользуемся для решения принципом сжатия Банаха. Существует ли определённых начальных данных) коэффициент сжатия?
Пусть <tex>\overline y = \overline y - \Gamma_0 f(\overline x, \overline y)</tex>. Тогда <tex>\Gamma_0 f(\overline x, \overline y)=0^m. \Gamma_0=(f_{\overline y}'(\overline{x_0},\overline{y_0}))^{-1}</tex>, следовательно, <tex>det \Gamma_0 \ne 0</tex>, поэтому соответствующая однородная система уравнений будет иметь только тривиальные решения и <tex>f(\overline x, \overline y)=0^m</tex>
 
  
<tex>T(\overline x, \overline y)=\overline y-\Gamma_0 f(\overline x, \overline y)</tex>
+
<tex>T'=J-\Gamma_0f_y';~\Gamma_0f_y'(\overline{x_0},\overline{y_0})=J</tex>. Значит, <tex>T_{\overline y}'(\overline{x_0},\overline{y_0})=0</tex>.
  
<tex>\overline y =T(\overline x,\overline y)</tex>. Нам нужно решить задачу на неподвижную точку для отображения <tex>T</tex> по переменной <tex>\overline y</tex> для фиксированного <tex>\overline x</tex>. Решать мы будем, применяя принцип сжатия Банаха. Существует ли (в определённых начальных данных) коэффициент сжатия?
+
По условию, <tex>f</tex> зависит от <tex>\overline x, \overline y</tex>, следовательно, <tex>T'</tex> — тоже. Тем самым, в определении непрерывности полагаем <tex> \varepsilon=\frac 12,\exists \delta>0 </tex>
  
<tex>T'=J-\Gamma_0f_y';~\Gamma_0f_y'(\overline{x_0},\overline{y_0})=J</tex>. Значит, <tex>T_{\overline y}'(\overline{x_0},\overline{y_0})=0</tex>. По условию <tex>f</tex> зависит от <tex>\overline x, \overline y</tex>, следовательно, <tex>T'</tex> — тоже. Тем самым, в определении непрерывности полагаем <tex>\varepsilon=\frac 12,\exists \delta>0\colon~\|\overline{\mathcal 4 x}\|,\|\overline{\mathcal 4 y}\| \le \delta \Rightarrow \| T_{\overline y}'(\overline{x_0}+\overline{\mathcal 4{x_0}},\overline{y_0}+\overline{\mathcal 4{y_0}})\| \le \frac 12</tex>
+
<tex> \|\overline{\mathcal 4 x}\|,\|\overline{\mathcal 4 y}\| \le \delta \Rightarrow \| T_{\overline y}'(\overline{x_0}+\overline{\mathcal 4{x_0}},\overline{y_0}+\overline{\mathcal 4{y_0}})\| \le \frac 12</tex>
  
<tex>V_{\delta}(\overline{x_0}),~W_{\delta}(\overline{y_0})</tex> такие, что <tex>T_{\overline y}'(\overline x, \overline y) \le \frac 12,~\forall \overline y',\overline y'' \in W_{\delta}(\overline{y_0}),~\forall\overline x\in V_{\delta}(\overline{x_0})</tex>
+
Возьмем <tex>V_{\delta}(\overline{x_0}),\ W_{\delta}(\overline{y_0})</tex> такие, что при <tex>T_{\overline y}'(\overline x, \overline y) \le \frac 12,~\forall \overline y',\overline y'' \in W_{\delta}(\overline{y_0}),~\forall\overline x\in V_{\delta}(\overline{x_0})</tex>
  
 
По неравенству Лагранжа <tex>\|T(\overline x,\overline y'')-T(\overline x,\overline y')\| \le \sup\limits_{\overline z \in \{y',y''\}}\|T_{\overline y}'(\overline x,\overline z)\|\|\overline y''-\overline y'\|</tex>. Но по выбору шаров этот <tex>\sup \le \frac 12</tex> и, таким образом, в наших условиях <tex>\|T(\overline x,\overline y'')-T(\overline x,\overline y')\| \le \frac 12 \|\overline y''-\overline y'\|</tex>.
 
По неравенству Лагранжа <tex>\|T(\overline x,\overline y'')-T(\overline x,\overline y')\| \le \sup\limits_{\overline z \in \{y',y''\}}\|T_{\overline y}'(\overline x,\overline z)\|\|\overline y''-\overline y'\|</tex>. Но по выбору шаров этот <tex>\sup \le \frac 12</tex> и, таким образом, в наших условиях <tex>\|T(\overline x,\overline y'')-T(\overline x,\overline y')\| \le \frac 12 \|\overline y''-\overline y'\|</tex>.
Строка 76: Строка 104:
 
<tex>\overline{y_0}=T(\overline{x_0},\overline{y_0})</tex> (<tex>x_0,y_0</tex> — начальные данные). Тогда:
 
<tex>\overline{y_0}=T(\overline{x_0},\overline{y_0})</tex> (<tex>x_0,y_0</tex> — начальные данные). Тогда:
  
<tex>\|T(\overline x,\overline y)-y_0\|=\|T(\overline x,\overline y)-T(\overline {x_0},\overline {y_0})\|\\=\|(T(\overline x,\overline y)-T(\overline x,\overline {y_0}))+(T(\overline x,\overline {y_0})-T(\overline {x_0},\overline {y_0}))\|\\\le\|T(\overline x,\overline y)-T(\overline x,\overline {y_0})\|+\|T(\overline x,\overline {y_0})-T(\overline {x_0},\overline {y_0})\|\le\frac 12 \|\overline y-\overline{y_0}\|+\|T(\overline x,\overline {y_0})-T(\overline {x_0},\overline {y_0})\|</tex>
+
<tex> \|T(\overline x,\overline y)-y_0\|=\|T(\overline x,\overline y)-T(\overline {x_0},\overline {y_0})\| = </tex>
  
По непрерывности <tex>T</tex> вторая норма разности <tex>\xrightarrow{\overline x \to \overline {x_0}}0</tex>. Полагая в определении непрерывности <tex>\varepsilon=\frac{\delta}2</tex> (<tex>\delta</tex> у нас уже было выбрано), подбираем <tex>\delta':0<\delta'<\delta</tex>, так, чтобы <tex>\|\overline x - \overline{x_0}\|\le\delta' \Rightarrow \|T(\overline x,\overline{y_0})-T(\overline {x_0},\overline{y_0})\|\le\frac{\delta}2</tex>. <tex>\delta'</tex> не зависит от <tex>y</tex>!
+
<tex> = \|(T(\overline x,\overline y)-T(\overline x,\overline {y_0}))+(T(\overline x,\overline {y_0})-T(\overline {x_0},\overline {y_0}))\| \le </tex>
  
<tex>\overline x\in V_{\delta'}(\overline{x_0}),~\forall \overline y, \in W_{\delta}(\overline{y_0}): \|T(x,y)-y_0\|\le\frac 12\|y-\overline{y_0}\|+\frac 12\delta\le\frac 12\delta+\frac 12\delta=\delta:T(x,y)\in W_{\delta}(\overline{y_0})</tex>
+
<tex> \le\|T(\overline x,\overline y)-T(\overline x,\overline {y_0})\|+\|T(\overline x,\overline {y_0})-T(\overline {x_0},\overline {y_0})\|\le </tex>
  
<tex>\forall\overline x\in V_{\delta}(\overline{x_0}),~\forall \overline y, \in W_{\delta}(\overline{y_0}).~T(\overline x,\cdot)\colon W_{\delta}(\overline{y_0})\to W_{\delta}(\overline{y_0})</tex> является сжатием с <tex>q=\frac 12</tex>, по теореме Банаха <tex>\exists y^*\in W_{\delta}(\overline{y_0}):\overline y^*=T(\overline x,\overline y^*)\Longleftrightarrow f(\overline x,\overline y^*)=0^m</tex>. В силу единственности такой точки неявное отображение определено. Пыщь-пыщь, щастье-радость!
+
<tex> \le \frac 12 \|\overline y-\overline{y_0}\|+\|T(\overline x,\overline {y_0})-T(\overline {x_0},\overline {y_0})\|</tex>
 +
 
 +
По непрерывности, <tex>T</tex> вторая норма разности стремится к 0 при <tex> \overline x \rightarrow \overline {x_0} </tex>. Полагая в определении непрерывности <tex>\varepsilon=\frac{\delta}2</tex> (<tex>\delta</tex> у нас уже было выбрано), подбираем <tex>\delta':0<\delta'<\delta</tex>, так, чтобы <tex>\|\overline x - \overline{x_0}\|\le\delta' \Rightarrow \|T(\overline x,\overline{y_0})-T(\overline {x_0},\overline{y_0})\|\le\frac{\delta}2</tex>. <tex>\delta'</tex> не зависит от <tex>y</tex>!
 +
 
 +
<tex>\forall \overline x\in V_{\delta'}(\overline{x_0}),~\forall \overline y, \in W_{\delta}(\overline{y_0}): \|T(x,y)-y_0\|\le\frac 12\|y-\overline{y_0}\|+\frac 12\delta\le\frac 12\delta+\frac 12\delta=\delta:T(x,y)\in W_{\delta}(\overline{y_0})</tex>
 +
 
 +
<tex>\forall\overline x\in V_{\delta}(\overline{x_0}),~\forall \overline y, \in W_{\delta}(\overline{y_0}).~T(\overline x,\cdot)\colon W_{\delta}(\overline{y_0})\to W_{\delta}(\overline{y_0})</tex> является сжатием с <tex>q=\frac 12</tex>.
 +
 
 +
Значит, по теореме Банаха <tex>\exists y^*\in W_{\delta}(\overline{y_0}):\overline y^*=T(\overline x,\overline y^*)\Longleftrightarrow f(\overline x,\overline y^*)=0^m</tex>. В силу единственности такой точки, неявное отображение определено. Пыщь-пыщь, щастье-радость!
 
}}
 
}}
 +
 +
Приведем пример использования неявного отображения.
 +
 +
Дана система уравнений:
 +
 
<tex>\begin{cases} f(x,y,\alpha)=0\\
 
<tex>\begin{cases} f(x,y,\alpha)=0\\
                   g(x,y,\alpha)=0 \end{cases};</tex> отсюда — если существуют <tex>(x_0,y_0,\alpha_0)</tex>, такие, что <tex>\begin{cases} f(x_0,y_0,\alpha_0)=0\\
+
                   g(x,y,\alpha)=0 \end{cases}</tex>  
                   g(x_0,y_0,\alpha_0)=0 \end{cases};</tex> — верно и <tex>\begin{vmatrix} \frac{\delta f}{\delta x}(x_0,y_0,\alpha_0) & \frac{\delta f}{\delta y}(x_0,y_0,\alpha_0) \\ \frac{\delta g}{\delta x}(x_0,y_0,\alpha_0) & \frac{\delta g}{\delta y}(x_0,y_0,\alpha_0)\end{vmatrix}\ne 0</tex>, а сами функции <tex>f</tex> и <tex>g</tex> — непрерывны, то тогда, по доказательству теоремы, можно утверждать, что «возмущённая система уравнений»: <tex>\begin{cases} f(x_0,y_0,\alpha_0+\mathcal 4 \alpha)=0\\
+
 
                  g(x_0,y_0,\alpha_0+\mathcal 4 \alpha)=0 \end{cases};</tex> при некоторых <tex>\delta > 0, |\mathcal 4 \alpha|,|x-x_0|,|y-y_0|<0</tex>, <tex>\forall\alpha</tex> будет иметь единственное решение по переменным <tex>\overline x,\overline y</tex>. Выяснить этот факт для конкретной системы некоторым прямым методом, как правило, невозможно.
+
Если существуют <tex>(x_0,y_0,\alpha_0)</tex>, такие, что  
 +
 
 +
<tex>\begin{cases} f(x_0,y_0,\alpha_0)=0\\
 +
                   g(x_0,y_0,\alpha_0)=0 \end{cases}</tex>
 +
 
 +
А также
  
<u>Важное следствие</u>: Пусть <tex>\exists T\colon\mathbb R^n \to\mathbb R^n ; det(T'(\overline {x_0}))\ne 0</tex>. Тогда это отображение в окрестности этой точки локально обратимо.
+
<tex>\begin{vmatrix} \frac{\delta f}{\delta x}(x_0,y_0,\alpha_0) & \frac{\delta f}{\delta y}(x_0,y_0,\alpha_0) \\ \frac{\delta g}{\delta x}(x_0,y_0,\alpha_0) & \frac{\delta g}{\delta y}(x_0,y_0,\alpha_0)\end{vmatrix}\ne 0</tex>,
  
<tex>\vartriangleright \overline y = T(\overline x),\overline {y_0} = T(\overline {x_0})</tex>. Чтобы обратить <tex>T</tex>, надо в первом равенстве полагать <tex>x</tex> неизвестным, а <tex>y</tex> — заданным. Решение такого уравнения будет (всё в некоторых окрестностях начальных данных). <tex>f(\overline x, \overline y)=\overline y - T(\overline x),f(\overline x, \overline y)=0^n</tex>
+
и указанные выше частные производные непрерывны, то, по только что доказанной теореме, можно утверждать, что «возмущённая система уравнений»:
  
<tex>T^{-1}</tex> — неявное отображение. Локальная обратимость <tex>T</tex> определена непрерывностью <tex>T</tex>, непрерывностью соответствующих частных производных и тем фактом, что <tex>f'_{\overline x}(\overline x,\overline y)=-T'(x).~det(T'(\overline {x_0}))\ne 0\Rightarrow det(f'_{\overline x}(\overline {x_0}))\Rightarrow</tex> условия теоремы о неявном отображении выполнены. <tex>\vartriangleleft</tex>
+
<tex>\begin{cases} f(x_0,y_0,\alpha_0+\mathcal 4 \alpha)=0\\
 +
                  g(x_0,y_0,\alpha_0+\mathcal 4 \alpha)=0 \end{cases};</tex>
 +
 
 +
при некоторых <tex>\delta > 0, |\mathcal 4 \alpha|,|x-x_0|,|y-y_0|<0</tex>, <tex>\forall\alpha</tex> будет иметь единственное решение по переменным <tex>\overline x,\overline y</tex>. Выяснить этот факт для конкретной системы некоторым прямым методом, как правило, невозможно.
 +
 
 +
===Важное следствие===
 +
{{Теорема
 +
|statement=
 +
Пусть <tex>\exists T\colon\mathbb R^n \to\mathbb R^n ; det(T'(\overline {x_0}))\ne 0</tex>. Тогда это отображение в окрестности <tex> \overline {x_0} </tex> локально обратимо.
 +
|proof=
 +
<tex> \overline y = T(\overline x),\overline {y_0} = T(\overline {x_0})</tex>.
 +
 
 +
Чтобы обратить <tex>T</tex>, надо в первом равенстве полагать <tex>x</tex> неизвестным, а <tex>y</tex> — заданным. Мы хотим доказать, что решение у такого уравнения обязательно будет (всё в некоторых окрестностях начальных данных).
 +
 
 +
Рассмотрим <tex>f(\overline x, \overline y)=\overline y - T(\overline x),f(\overline x, \overline y)=0^n</tex>
 +
 
 +
<tex>T^{-1}</tex> — неявное отображение. Локальная обратимость <tex>T</tex> определена непрерывностью <tex>T</tex>, непрерывностью соответствующих частных производных и тем фактом, что <tex>f'_{\overline x}(\overline x,\overline y)=-T'(x). </tex>
 +
 
 +
<tex> det(T'(\overline {x_0}))\ne 0\Rightarrow det(f'_{\overline x}(\overline {x_0})) \ne 0 \Rightarrow</tex> условия теоремы о неявном отображении выполнены, и <tex> T </tex> локально обратимо.
 +
 
 +
}}
  
 
То, что мы установили — нетривиальное обобщение стандартного одномерного факта:
 
То, что мы установили — нетривиальное обобщение стандартного одномерного факта:
Строка 99: Строка 165:
 
Пусть <tex>y=f(x),f'(x_0)\ne 0,f'(x)</tex> — непрерывна.
 
Пусть <tex>y=f(x),f'(x_0)\ne 0,f'(x)</tex> — непрерывна.
  
Если <tex>f'(x_0)>0 \Rightarrow \exists \delta > 0: |x-x_0|\le 0 \Rightarrow f'(x)>0</tex>. Тогда на отрезке <tex>[x_0-\delta;x_0+\delta]~f</tex> возрастает и у неё существует обратная функция.
+
Если <tex>f'(x_0)>0 \Rightarrow \exists \delta > 0: |x-x_0|\le \delta \Rightarrow f'(x)>0</tex>.
 +
 
 +
Тогда на отрезке <tex>[x_0-\delta;x_0+\delta]~f</tex> возрастает, и у неё существует обратная функция.
 +
 
 +
===Задача об условном экстремуме===
  
 
Ещё одним возможным приложением неявных отображений может служить задача об условном экстремуме.
 
Ещё одним возможным приложением неявных отображений может служить задача об условном экстремуме.
Строка 110: Строка 180:
 
               g_m(\overline x,\overline y)=0 \end{cases};</tex>
 
               g_m(\overline x,\overline y)=0 \end{cases};</tex>
  
<tex>(\overline{x_0},\overline{y_0})</tex> — условный максимум функции <tex>f</tex>, если при <tex>\overline x \approx \overline{x_0},~\overline y \approx \overline{y_0}</tex> и <tex>(\overline x,\overline y)</tex>, удовлетворяющих уравнениям связи, выполняется неравенство <tex>f(\overline x,\overline y)\le f(\overline {x_0},\overline {y_0})</tex>. Если же <tex>f(\overline x,\overline y)\ge f(\overline {x_0},\overline {y_0}),~(\overline{x_0},\overline{y_0})</tex> — условный минимум.
+
<tex>(\overline{x_0},\overline{y_0})</tex> — '''условный максимум''' функции <tex>f</tex>, если для всех <tex>\overline x \approx \overline{x_0},~\overline y \approx \overline{y_0}</tex> и <tex>(\overline x,\overline y)</tex>, удовлетворяющих уравнениям связи, выполняется неравенство <tex>f(\overline x,\overline y)\le f(\overline {x_0},\overline {y_0})</tex>. Если же <tex>f(\overline x,\overline y)\ge f(\overline {x_0},\overline {y_0}),~(\overline{x_0},\overline{y_0})</tex> — '''условный минимум'''.
  
 
Пример: пусть на сфере есть две точки, A и B. Тогда кратчайшее расстояние между ними — отрезок. Он будет безусловным экстремумом. Но кратчайшее расстояние между ними вдоль сферы — дуга. Это будет условным экстремумом, так как есть уравнения связи.
 
Пример: пусть на сфере есть две точки, A и B. Тогда кратчайшее расстояние между ними — отрезок. Он будет безусловным экстремумом. Но кратчайшее расстояние между ними вдоль сферы — дуга. Это будет условным экстремумом, так как есть уравнения связи.
  
Для того, чтобы формулировка оказалась математически корректной, надо, чтобы из системы кравнений связи <tex>\overline y</tex> могла выражаться через <tex>\overline x</tex> в некоторой окрестности <tex>(\overline {x_0},\overline {y_0})</tex>. Очевидно, что уравнения связи можно рассмотреть как задачу о неявном отображении. Тогда все g, как и их частные производные — непрерывны. Соответственно, матрица Якоби должна быть обратимой.
+
Для того, чтобы формулировка оказалась математически корректной, надо, чтобы из системы уравнений связи <tex>\overline y</tex> могла выражаться через <tex>\overline x</tex> в некоторой окрестности <tex>(\overline {x_0},\overline {y_0})</tex>. Очевидно, что уравнения связи можно рассмотреть как задачу о неявном отображении. Тогда все <tex> g_i </tex>, как и их частные производные — непрерывны. Соответственно, матрица Якоби должна быть обратимой.
  
<tex>\overline y=\phi(\overline x).~z=f(\overline x,\phi(\overline x))</tex>. Мы получили задачу на безусловный экстреммум для полученного <tex>\overline z</tex>. Т.к. практически неявно отображающую формулу не найти, то можно пытаться составлять некоторую систему соотношения для точек, подобранных для условного экстремума, исходя из инвариантности дифференциалов n-го порядка. По этой инвариантности необходимые условия экстремума:
+
<tex>\overline y=\phi(\overline x),\ \overline z=f(\overline x,\phi(\overline x))</tex>. Мы получили задачу на безусловный экстреммум для <tex>\overline z</tex>. Т.к. практически неявно отображающую формулу не найти, то можно пытаться составлять некоторую систему соотношения для точек, подобранных для условного экстремума, исходя из инвариантности дифференциалов n-го порядка. По этой инвариантности необходимые условия экстремума:
  
 
<tex>dz=0</tex>
 
<tex>dz=0</tex>
Строка 134: Строка 204:
 
Мы получили систему уравнений для полученных точек, похожих на условный экстремум; которую надо решать вместе с уравнениями связи.
 
Мы получили систему уравнений для полученных точек, похожих на условный экстремум; которую надо решать вместе с уравнениями связи.
  
На самом деле этому можно придать более удобную форму, придуманную Лагранжем (метод множителей Лагранжа) (но математической новизны в нём нет!)
+
На самом деле, этому можно придать более удобную форму, придуманную Лагранжем (метод множителей Лагранжа) (но математической новизны в нём нет!)
  
 
'''Метод множителей Лагранжа:'''
 
'''Метод множителей Лагранжа:'''
 +
 
<tex>F(\overline x,\overline y,\overline {\lambda})=f(\overline x,\overline y)+\sum\limits_{k=1}^m \lambda_k g_k(\overline x,\overline y).</tex> Далее составляем систему соотношений так, будто для <tex>F</tex> мы стали искать безусловный экстремум:
 
<tex>F(\overline x,\overline y,\overline {\lambda})=f(\overline x,\overline y)+\sum\limits_{k=1}^m \lambda_k g_k(\overline x,\overline y).</tex> Далее составляем систему соотношений так, будто для <tex>F</tex> мы стали искать безусловный экстремум:
  

Версия 06:36, 10 июня 2011

Принцип сжатия Банаха

Принцип сжатия будем излагать для нормированных пространств, хотя он без изменения переносится на метрические пространства.


Определение:
Пусть [math]X[/math] — B-пространство. Пусть [math]\overline V[/math] — замкнутый шар в [math]X[/math].
[math] \mathcal{T} : \overline V \to \overline V[/math]сжатие на шаре [math]V[/math], если [math]\exists q \in (0;1) \ \forall x',x'' \in \overline V[/math] [math] : \| \mathcal{T}x''-\mathcal{T}x' \| \le q \|x''-x'\|[/math].


Теорема (Банах):
У любого сжимающего отображения существует ровно одна неподвижная точка [math]x^*=\mathcal{T}x^*[/math].
Доказательство:
[math]\triangleright[/math]

[math]\forall x_0 \in \overline V:\ x_{n+1}=\mathcal{T}x_n[/math].

Тогда [math]\|x_{n+1}-x_n\| = \|\mathcal{T}x_n-\mathcal{T}x_{n-1}\|\le q \|x_n-x_{n-1}\| \leq \ldots \leq q^n \|x_1-x_0\|[/math]

Рассмотрим ряд [math]x_1+\sum\limits_{k=1}^\infty (x_{k+1}-x_k)[/math]

Выкинем первое слагаемое и замажорируем этот ряд геометрической прогрессией.

[math]\sum\limits_{k=1}^\infty \|x_{k+1}-x_k\| \le \|x_1-x_0\|\sum\limits_{k=1}^\infty q^k[/math], [math]0\lt q\lt 1[/math].

Последний ряд сходится и ряд из норм тоже сходится.

По свойствам рядов определим [math]S=x_1+\sum\limits_{k=1}^\infty (x_{k+1}-x_k)[/math]. [math]S_n=x_{n+1}[/math]. Если [math] S_n \to S[/math], то [math]x_n \to S[/math]. Но любое сжатие непрерывно(так как оно ограничено). Это позволяет в [math]x_{n+1}=Tx_n[/math] перейти к пределу — [math]S=TS[/math]. Получили неподвижную точку [math] S [/math].

Допустим теперь, что существуют две различных неподвижных точки:

Если [math]Tx'=x', Tx''=x''[/math], то составим норму их разности: [math]\|x''-x'\|=\|Tx''-Tx'\| \le q\|x''-x'\|[/math] и при [math]\|x''-x'\| \ne 0[/math] [math]q \ge 1[/math], что противоречит условию.

Поэтому [math]\|x''-x' \|= 0[/math], следовательно, [math]x''=x'[/math].
[math]\triangleleft[/math]

2

Пусть [math]\overline x \in V \subset \mathbb{R}^n, \overline y \in W \subset \mathbb{R}^m[/math], тогда рассмотрим [math]V\times W=\{(\overline x, \overline y) \in \mathbb R^{n+m},\overline x \in V, \overline y \in W\}[/math].

[math]f\colon V(\overline {x_0})\times W(\overline {y_0}) \to \mathbb{R}^m[/math], [math]f(x_0,y_0)=0^m[/math]. Существуют ли такие [math]\delta_1,\delta_2\gt 0[/math], что для любого [math]\overline x\in V_{\delta_1}(\overline{x_0})[/math] существует единственный [math] \overline y\in W_{\delta_2}(\overline{y_0})\colon f(\overline x,\overline y)=0^m[/math]?

Если это так, то, в силу единственности y, определяем [math]\overline y = \phi(\overline x)[/math] на [math]V_{\delta_1}(\overline{x_0})[/math] так, чтобы [math]f(\overline x,\phi(\overline x))=0^m[/math]. [math]\phi[/math] — неявное отображение, определяется как [math]f(\overline x,\overline y)=0^m,~(x_0,y_0)\colon f(\overline{x_0},\overline{y_0})=0^m[/math]


Пример, единичная окружность:

[math]x,y\in\mathbb{R},f(x,y)=x^2+y^2-1.~f(x,y)=0\Longleftrightarrow x^2+y^2=1[/math]

В малых окрестностях начальных данных вертикаль, проведённая через [math]x[/math], будет давать соответствующий единственный [math]y[/math]. Если решать задачу вне окрестности [math]y_0[/math], получится 2 [math]y[/math], теряется единственность [math]y[/math]. Именно поэтому крайне важно указывать окрестности, в которых мы ищем отображения. [math]y=\sqrt{1-x^2};y=\pm\sqrt{1-x^2}[/math].

Сейчас мы установим условия, при которых неявное отображение будет существовать:

[math]\overline z = f(\overline x,\overline y).~\overline x \in \mathbb R^n;~y,z\in \mathbb R^m.~f_{\overline y}'[/math] — производная отображения [math]f[/math], при фиксированном [math]x[/math] и варьирующемся [math]y[/math].

[math]f_{\overline y}'[/math] зависит и от [math]\overline x[/math], и от [math]\overline y[/math]. [math]f_{\overline y}'[/math] — линейный оператор, поэтому непрерывность [math]f_{\overline y}'[/math] понимается в метрике линейного оператора:

[math]\forall \varepsilon \gt 0 \exists \delta \gt 0\colon~\|\overline{\mathcal{4}x}\|,\|\overline{\mathcal{4}y}\|\lt \delta\Rightarrow\|f_{\overline y}'(\overline x + \overline{\mathcal{4}x},\overline y + \overline{\mathcal{4}y})-f_{\overline y}'(\overline x,\overline y)\|\lt \varepsilon[/math]

[math]f_{\overline y}'(\overline x,\overline y)[/math] — матрица, размером [math]m\times m[/math]. Оператор непрерывно обратим в [math](\overline x,\overline y) [/math], то есть, у матрицы этого оператора существует обратная (её детерминант не равен нулю).

Теорема (О неявном отображении):
Пусть для [math]f[/math] поставлена задача о неявном отображении, с начальными данными [math](x_0,y_0)[/math]. Известно, что в окрестности начальных данных[math]f_{\overline y}'[/math] непрерывно зависит от [math]\overline x,\overline y[/math] и непрерывно обратима в [math](x_0,y_0)[/math]. Тогда в некоторой окрестности начальных данных неявное отображение существует.
Доказательство:
[math]\triangleright[/math]

Доказательство разбиваем на 2 этапа (и на экзамене они тоже будут спрашиваться по отдельности):

1 этап:

Пусть [math]\Gamma_0=(f_{\overline y}'(\overline{x_0},\overline{y_0}))^{-1}[/math]

Промежуточное утверждение: [math]f(\overline x, \overline y)=0^m \Longleftrightarrow\ \overline y = \overline y - \Gamma_0 f(\overline x, \overline y)[/math].

Проверим равносильность:

[math] \Longrightarrow [/math] Пусть [math]f(\overline x, \overline y) = 0[/math]. [math]\Gamma_0 f(\overline x, \overline y)=\Gamma_0(0^m)=0,~\overline y = \overline y[/math] — верное в любом случае уравнение.

[math] \Longleftarrow [/math] Пусть теперь [math]\overline y = \overline y - \Gamma_0 f(\overline x, \overline y)[/math]. Тогда [math]\Gamma_0 f(\overline x, \overline y)=0^m. \Gamma_0=(f_{\overline y}'(\overline{x_0},\overline{y_0}))^{-1}[/math], следовательно, [math]det \Gamma_0 \ne 0[/math], поэтому соответствующая однородная система уравнений будет иметь только тривиальные решения и [math]f(\overline x, \overline y)=0^m[/math]

Пусть [math]T(\overline x, \overline y)=\overline y-\Gamma_0 f(\overline x, \overline y)[/math], тогда [math]\overline y = T(\overline x,\overline y)[/math].

Для фиксированного [math] x [/math] получаем задачу на неподвижную точку для отображения [math]T[/math] по переменной [math]\overline y[/math] для фиксированного.

Воспользуемся для решения принципом сжатия Банаха. Существует ли (в определённых начальных данных) коэффициент сжатия?

[math]T'=J-\Gamma_0f_y';~\Gamma_0f_y'(\overline{x_0},\overline{y_0})=J[/math]. Значит, [math]T_{\overline y}'(\overline{x_0},\overline{y_0})=0[/math].

По условию, [math]f[/math] зависит от [math]\overline x, \overline y[/math], следовательно, [math]T'[/math] — тоже. Тем самым, в определении непрерывности полагаем [math] \varepsilon=\frac 12,\exists \delta\gt 0 [/math]

[math] \|\overline{\mathcal 4 x}\|,\|\overline{\mathcal 4 y}\| \le \delta \Rightarrow \| T_{\overline y}'(\overline{x_0}+\overline{\mathcal 4{x_0}},\overline{y_0}+\overline{\mathcal 4{y_0}})\| \le \frac 12[/math]

Возьмем [math]V_{\delta}(\overline{x_0}),\ W_{\delta}(\overline{y_0})[/math] такие, что при [math]T_{\overline y}'(\overline x, \overline y) \le \frac 12,~\forall \overline y',\overline y'' \in W_{\delta}(\overline{y_0}),~\forall\overline x\in V_{\delta}(\overline{x_0})[/math]

По неравенству Лагранжа [math]\|T(\overline x,\overline y'')-T(\overline x,\overline y')\| \le \sup\limits_{\overline z \in \{y',y''\}}\|T_{\overline y}'(\overline x,\overline z)\|\|\overline y''-\overline y'\|[/math]. Но по выбору шаров этот [math]\sup \le \frac 12[/math] и, таким образом, в наших условиях [math]\|T(\overline x,\overline y'')-T(\overline x,\overline y')\| \le \frac 12 \|\overline y''-\overline y'\|[/math].

2 этап: На первом этапе найден коэффициент сжатия: [math]\frac 12[/math]. Если проверить для [math]T[/math] условия теоремы Банаха по [math]\overline y[/math] в пределах некоторых окрестностей начальных данных, то у [math]T[/math] окажется единственная неподвижная точка, следовательно, она и будет значением неявного отображения и теорема будет доказана.

[math]\forall\overline x\in V_{\delta}(\overline{x_0}),~\forall \overline y, \in W_{\delta}(\overline{y_0})[/math]

[math]\overline{y_0}=T(\overline{x_0},\overline{y_0})[/math] ([math]x_0,y_0[/math] — начальные данные). Тогда:

[math] \|T(\overline x,\overline y)-y_0\|=\|T(\overline x,\overline y)-T(\overline {x_0},\overline {y_0})\| = [/math]

[math] = \|(T(\overline x,\overline y)-T(\overline x,\overline {y_0}))+(T(\overline x,\overline {y_0})-T(\overline {x_0},\overline {y_0}))\| \le [/math]

[math] \le\|T(\overline x,\overline y)-T(\overline x,\overline {y_0})\|+\|T(\overline x,\overline {y_0})-T(\overline {x_0},\overline {y_0})\|\le [/math]

[math] \le \frac 12 \|\overline y-\overline{y_0}\|+\|T(\overline x,\overline {y_0})-T(\overline {x_0},\overline {y_0})\|[/math]

По непрерывности, [math]T[/math] вторая норма разности стремится к 0 при [math] \overline x \rightarrow \overline {x_0} [/math]. Полагая в определении непрерывности [math]\varepsilon=\frac{\delta}2[/math] ([math]\delta[/math] у нас уже было выбрано), подбираем [math]\delta':0\lt \delta'\lt \delta[/math], так, чтобы [math]\|\overline x - \overline{x_0}\|\le\delta' \Rightarrow \|T(\overline x,\overline{y_0})-T(\overline {x_0},\overline{y_0})\|\le\frac{\delta}2[/math]. [math]\delta'[/math] не зависит от [math]y[/math]!

[math]\forall \overline x\in V_{\delta'}(\overline{x_0}),~\forall \overline y, \in W_{\delta}(\overline{y_0}): \|T(x,y)-y_0\|\le\frac 12\|y-\overline{y_0}\|+\frac 12\delta\le\frac 12\delta+\frac 12\delta=\delta:T(x,y)\in W_{\delta}(\overline{y_0})[/math]

[math]\forall\overline x\in V_{\delta}(\overline{x_0}),~\forall \overline y, \in W_{\delta}(\overline{y_0}).~T(\overline x,\cdot)\colon W_{\delta}(\overline{y_0})\to W_{\delta}(\overline{y_0})[/math] является сжатием с [math]q=\frac 12[/math].

Значит, по теореме Банаха [math]\exists y^*\in W_{\delta}(\overline{y_0}):\overline y^*=T(\overline x,\overline y^*)\Longleftrightarrow f(\overline x,\overline y^*)=0^m[/math]. В силу единственности такой точки, неявное отображение определено. Пыщь-пыщь, щастье-радость!
[math]\triangleleft[/math]

Приведем пример использования неявного отображения.

Дана система уравнений:

[math]\begin{cases} f(x,y,\alpha)=0\\ g(x,y,\alpha)=0 \end{cases}[/math]

Если существуют [math](x_0,y_0,\alpha_0)[/math], такие, что

[math]\begin{cases} f(x_0,y_0,\alpha_0)=0\\ g(x_0,y_0,\alpha_0)=0 \end{cases}[/math]

А также

[math]\begin{vmatrix} \frac{\delta f}{\delta x}(x_0,y_0,\alpha_0) & \frac{\delta f}{\delta y}(x_0,y_0,\alpha_0) \\ \frac{\delta g}{\delta x}(x_0,y_0,\alpha_0) & \frac{\delta g}{\delta y}(x_0,y_0,\alpha_0)\end{vmatrix}\ne 0[/math],

и указанные выше частные производные непрерывны, то, по только что доказанной теореме, можно утверждать, что «возмущённая система уравнений»:

[math]\begin{cases} f(x_0,y_0,\alpha_0+\mathcal 4 \alpha)=0\\ g(x_0,y_0,\alpha_0+\mathcal 4 \alpha)=0 \end{cases};[/math]

при некоторых [math]\delta \gt 0, |\mathcal 4 \alpha|,|x-x_0|,|y-y_0|\lt 0[/math], [math]\forall\alpha[/math] будет иметь единственное решение по переменным [math]\overline x,\overline y[/math]. Выяснить этот факт для конкретной системы некоторым прямым методом, как правило, невозможно.

Важное следствие

Теорема:
Пусть [math]\exists T\colon\mathbb R^n \to\mathbb R^n ; det(T'(\overline {x_0}))\ne 0[/math]. Тогда это отображение в окрестности [math] \overline {x_0} [/math] локально обратимо.
Доказательство:
[math]\triangleright[/math]

[math] \overline y = T(\overline x),\overline {y_0} = T(\overline {x_0})[/math].

Чтобы обратить [math]T[/math], надо в первом равенстве полагать [math]x[/math] неизвестным, а [math]y[/math] — заданным. Мы хотим доказать, что решение у такого уравнения обязательно будет (всё в некоторых окрестностях начальных данных).

Рассмотрим [math]f(\overline x, \overline y)=\overline y - T(\overline x),f(\overline x, \overline y)=0^n[/math]

[math]T^{-1}[/math] — неявное отображение. Локальная обратимость [math]T[/math] определена непрерывностью [math]T[/math], непрерывностью соответствующих частных производных и тем фактом, что [math]f'_{\overline x}(\overline x,\overline y)=-T'(x). [/math]

[math] det(T'(\overline {x_0}))\ne 0\Rightarrow det(f'_{\overline x}(\overline {x_0})) \ne 0 \Rightarrow[/math] условия теоремы о неявном отображении выполнены, и [math] T [/math] локально обратимо.
[math]\triangleleft[/math]

То, что мы установили — нетривиальное обобщение стандартного одномерного факта:

Пусть [math]y=f(x),f'(x_0)\ne 0,f'(x)[/math] — непрерывна.

Если [math]f'(x_0)\gt 0 \Rightarrow \exists \delta \gt 0: |x-x_0|\le \delta \Rightarrow f'(x)\gt 0[/math].

Тогда на отрезке [math][x_0-\delta;x_0+\delta]~f[/math] возрастает, и у неё существует обратная функция.

Задача об условном экстремуме

Ещё одним возможным приложением неявных отображений может служить задача об условном экстремуме.

[math]z=f(\overline x, \overline y),~\overline x=(x_1,\dots x_n),~\overline y=(y_1,\dots y_m)[/math]. Пусть заданы «уравнения связи» в количестве m:

[math]\begin{cases} g_1(\overline x,\overline y)=0\\ g_2(\overline x,\overline y)=0\\ \dots\\ g_m(\overline x,\overline y)=0 \end{cases};[/math]

[math](\overline{x_0},\overline{y_0})[/math]условный максимум функции [math]f[/math], если для всех [math]\overline x \approx \overline{x_0},~\overline y \approx \overline{y_0}[/math] и [math](\overline x,\overline y)[/math], удовлетворяющих уравнениям связи, выполняется неравенство [math]f(\overline x,\overline y)\le f(\overline {x_0},\overline {y_0})[/math]. Если же [math]f(\overline x,\overline y)\ge f(\overline {x_0},\overline {y_0}),~(\overline{x_0},\overline{y_0})[/math]условный минимум.

Пример: пусть на сфере есть две точки, A и B. Тогда кратчайшее расстояние между ними — отрезок. Он будет безусловным экстремумом. Но кратчайшее расстояние между ними вдоль сферы — дуга. Это будет условным экстремумом, так как есть уравнения связи.

Для того, чтобы формулировка оказалась математически корректной, надо, чтобы из системы уравнений связи [math]\overline y[/math] могла выражаться через [math]\overline x[/math] в некоторой окрестности [math](\overline {x_0},\overline {y_0})[/math]. Очевидно, что уравнения связи можно рассмотреть как задачу о неявном отображении. Тогда все [math] g_i [/math], как и их частные производные — непрерывны. Соответственно, матрица Якоби должна быть обратимой.

[math]\overline y=\phi(\overline x),\ \overline z=f(\overline x,\phi(\overline x))[/math]. Мы получили задачу на безусловный экстреммум для [math]\overline z[/math]. Т.к. практически неявно отображающую формулу не найти, то можно пытаться составлять некоторую систему соотношения для точек, подобранных для условного экстремума, исходя из инвариантности дифференциалов n-го порядка. По этой инвариантности необходимые условия экстремума:

[math]dz=0[/math]

[math]\sum\limits_{j=1}^n \frac {\delta f}{\delta x_j}(\overline x,\overline y)dx_j+\sum\limits_{i=1}^m \frac {\delta f}{\delta y_i}(\overline x,\overline y)dy_i\equiv 0\qquad (*)[/math]

Но так как [math]\overline y=\phi(\overline x)[/math], то, в отличие от безусловного экстремума, в котором мы могли бы все частные производные приравнять к нулю и получить систему, мы так решать не можем, ибо [math]dy_i[/math] зависит от [math]dx_1,\dots dx_n[/math]. Но, в отличие от [math]\phi[/math], эту зависимость можно найти явно. У нас должны выполняться следующие условия:

[math]g_k(\overline x,\overline y)=0, k=\overline{1,m}[/math]

[math]\sum\limits_{j=1}^n \frac {\delta g_k}{\delta x_j}dx_j+\sum\limits_{i=1}^m \frac {\delta g_k}{\delta y_i}dy_i\equiv 0[/math]

В результате мы получаем СЛАУ для зависимости дифференциалов. Её матрицей будет матрица Якоби [math]g'_{\overline y}(\overline x,\overline y)[/math]. Раз она обратима в [math](x_0,y_0)[/math], то по непрерывности она будет обратима в окрестности этой точки, следовательно, [math]dy[/math] можно выразить через [math]dx[/math], формулы будут линейны.

[math]dy_1=\sum\limits_{j=1}^n A_{1j}dx_j[/math]. Тогда, подставляя эти форулы в [math](*)[/math], получим [math]\sum\limits_{j=1}^m B_j dx_j=0 \Rightarrow B_j=0[/math].

Мы получили систему уравнений для полученных точек, похожих на условный экстремум; которую надо решать вместе с уравнениями связи.

На самом деле, этому можно придать более удобную форму, придуманную Лагранжем (метод множителей Лагранжа) (но математической новизны в нём нет!)

Метод множителей Лагранжа:

[math]F(\overline x,\overline y,\overline {\lambda})=f(\overline x,\overline y)+\sum\limits_{k=1}^m \lambda_k g_k(\overline x,\overline y).[/math] Далее составляем систему соотношений так, будто для [math]F[/math] мы стали искать безусловный экстремум:

[math]\begin{cases} \frac {\delta F}{\delta x_j}=0\\ \frac {\delta F}{\delta y_i}=0\\ \frac {\delta F}{\delta \lambda_k}=0 \Longleftrightarrow g_k(\overline x,\overline y)=0\end{cases};[/math]

Если всё это раскрыть, получим то, о чём мы говорили выше, но эта запись более компактна.