Локальная теорема о неявном отображении — различия между версиями

Версия 01:46, 9 июня 2011

Принцип сжатия Банаха

Пусть [math]X[/math] — B-пространство. Пусть [math]\overline V[/math] — замкнутый шар в [math]X[/math].

{{Определение |definition= \mathcal{T} : \overline V \to \overline V</tex> — сжатие на шаре [math]V[/math], если

Теорема (Банах):

У любого сжимающего отображения существует неподвижная точка .

Доказательство:

. Тогда

Рассмотрим ряд

Выкинем первое слагаемое и замажорируем этот ряд геометрической прогрессией.

, [math]0\lt q\lt 1[/math].

Последний ряд сходится и ряд из норм тоже сходится. По свойствам рядов определим . . Если , то . Но любое сжатие непрерывно. Это позволяет в перейти к пределу — . Если , то составим норму их разности: и при — противоречие. , следовательно, .

2

; .

, [math]f(x_0,y_0)=0^m[/math]. Существуют ли такие [math]\delta_1,\delta_2\gt 0[/math], что ?

Если это так, то в силу единственности y определяем на так, чтобы . [math]\phi[/math] — неявное отображение, определяется как

Пример, единичная окружность:

В малых окрестностях начальных данных вертикаль, проведённая через [math]x[/math], будет давать соответствующий единственный [math]y[/math]. Если решать задачу вне окрестности [math]y_0[/math], получится 2 [math]y[/math], теряется единственность [math]y[/math]. Именно поэтому крайне важно указывать окрестности, в которых мы ищем отображения. .

Сейчас мы установим условия, при которых неявное отображение будет существовать:

— произвольное отображение [math]f[/math], при фиксированном [math]x[/math] и варьирующемся [math]y[/math].

(зависит и от [math]\overline x[/math], и от [math]\overline y[/math]). Непрерывность [math]f_{\overline y}'[/math]: производная — линейный оператор, поэтому непрерывность понимается в метрике линейного оператора:

— матрица, размером [math]m\times m[/math]. Оператор непрерывно обратим в у этой матрицы существует обратная (её детерминант не равен нулю).

Теорема (О неявном отображении):

Пусть для поставлена задача о неявном отображении, с начальными данными . Известно, что в окрестности начальных данных непрерывно зависит от ; и в она непрерывно обратима. Тогда в некоторой окрестности начальных данных неявное отображение существует.

Доказательство:

Доказательство разбиваем на 2 этапа (и на экзамене они тоже будут спрашиваться по отдельности):

1 этап:

. Проверим равносильность: пусть . — верное в любом случае уравнение. Пусть . Тогда , следовательно, [math]det \Gamma_0 \ne 0[/math], поэтому соответствующая однородная система уравнений будет иметь только тривиальные решения и

. Нам нужно решить задачу на неподвижную точку для отображения [math]T[/math] по переменной [math]\overline y[/math] для фиксированного [math]\overline x[/math]. Решать мы будем, применяя принцип сжатия Банаха. Существует ли (в определённых начальных данных) коэффициент сжатия?

. Значит, . По условию [math]f[/math] зависит от [math]\overline x, \overline y[/math], следовательно, [math]T'[/math] — тоже. Тем самым, в определении непрерывности полагаем

такие, что

По неравенству Лагранжа . Но по выбору шаров этот [math]\sup \le \frac 12[/math] и, таким образом, в наших условиях .

2 этап: На первом этапе найден коэффициент сжатия: [math]\frac 12[/math]. Если проверить для [math]T[/math] условия теоремы Банаха по [math]\overline y[/math] в пределах некоторых окрестностей начальных данных, то у [math]T[/math] окажется единственная неподвижная точка, следовательно, она и будет значением неявного отображения и теорема будет доказана.

([math]x_0,y_0[/math] — начальные данные). Тогда:

По непрерывности [math]T[/math] вторая норма разности . Полагая в определении непрерывности [math]\varepsilon=\frac{\delta}2[/math] ([math]\delta[/math] у нас уже было выбрано), подбираем , так, чтобы . [math]\delta'[/math] не зависит от [math]y[/math]!

является сжатием с , по теореме Банаха . В силу единственности такой точки неявное отображение определено. Пыщь-пыщь, щастье-радость!

отсюда — если существуют [math](x_0,y_0,\alpha_0)[/math], такие, что — верно и , а сами функции [math]f[/math] и [math]g[/math] — непрерывны, то тогда, по доказательству теоремы, можно утверждать, что «возмущённая система уравнений»: при некоторых , [math]\forall\alpha[/math] будет иметь единственное решение по переменным [math]\overline x,\overline y[/math]. Выяснить этот факт для конкретной системы некоторым прямым методом, как правило, невозможно.

Важное следствие: Пусть . Тогда это отображение в окрестности этой точки локально обратимо.

. Чтобы обратить [math]T[/math], надо в первом равенстве полагать [math]x[/math] неизвестным, а [math]y[/math] — заданным. Решение такого уравнения будет (всё в некоторых окрестностях начальных данных).

[math]T^{-1}[/math] — неявное отображение. Локальная обратимость [math]T[/math] определена непрерывностью [math]T[/math], непрерывностью соответствующих частных производных и тем фактом, что условия теоремы о неявном отображении выполнены. [math]\vartriangleleft[/math]

То, что мы установили — нетривиальное обобщение стандартного одномерного факта:

Пусть [math]y=f(x),f'(x_0)\ne 0,f'(x)[/math] — непрерывна.

Если . Тогда на отрезке [math][x_0-\delta;x_0+\delta]~f[/math] возрастает и у неё существует обратная функция.

Ещё одним возможным приложением неявных отображений может служить задача об условном экстремуме.

. Пусть заданы «уравнения связи» в количестве m:

— условный максимум функции [math]f[/math], если при и [math](\overline x,\overline y)[/math], удовлетворяющих уравнениям связи, выполняется неравенство . Если же — условный минимум.

Пример: пусть на сфере есть две точки, A и B. Тогда кратчайшее расстояние между ними — отрезок. Он будет безусловным экстремумом. Но кратчайшее расстояние между ними вдоль сферы — дуга. Это будет условным экстремумом, так как есть уравнения связи.

Для того, чтобы формулировка оказалась математически корректной, надо, чтобы из системы кравнений связи [math]\overline y[/math] могла выражаться через [math]\overline x[/math] в некоторой окрестности . Очевидно, что уравнения связи можно рассмотреть как задачу о неявном отображении. Тогда все g, как и их частные производные — непрерывны. Соответственно, матрица Якоби должна быть обратимой.

. Мы получили задачу на безусловный экстреммум для полученного [math]\overline z[/math]. Т.к. практически неявно отображающую формулу не найти, то можно пытаться составлять некоторую систему соотношения для точек, подобранных для условного экстремума, исходя из инвариантности дифференциалов n-го порядка. По этой инвариантности необходимые условия экстремума:

[math]dz=0[/math]

Но так как , то, в отличие от безусловного экстремума, в котором мы могли бы все частные производные приравнять к нулю и получить систему, мы так решать не можем, ибо [math]dy_i[/math] зависит от [math]dx_1,\dots dx_n[/math]. Но, в отличие от [math]\phi[/math], эту зависимость можно найти явно. У нас должны выполняться следующие условия:

В результате мы получаем СЛАУ для зависимости дифференциалов. Её матрицей будет матрица Якоби . Раз она обратима в [math](x_0,y_0)[/math], то по непрерывности она будет обратима в окрестности этой точки, следовательно, [math]dy[/math] можно выразить через [math]dx[/math], формулы будут линейны.

. Тогда, подставляя эти форулы в [math](*)[/math], получим .

Мы получили систему уравнений для полученных точек, похожих на условный экстремум; которую надо решать вместе с уравнениями связи.

На самом деле этому можно придать более удобную форму, придуманную Лагранжем (метод множителей Лагранжа) (но математической новизны в нём нет!)

Метод множителей Лагранжа: Далее составляем систему соотношений так, будто для [math]F[/math] мы стали искать безусловный экстремум:

Если всё это раскрыть, получим то, о чём мы говорили выше, но эта запись более компактна.

@@ Строка 4: / Строка 4: @@
 {{Определение
-|definition=
+|definition= \mathcal{T} : \overline V \to \overline V</tex> {{---}} ''сжатие'' на шаре <tex>V</tex>, если <tex>\exists q \in (0;1) \ \forall x',x'' \in \overline V</tex> <tex> : \| \mathcal{T}x''-\mathcal{T}x' \| \le q \|x''-x'\|</tex>
-<tex>\mathcal{T} : \overline V \to \overline V</tex> {{---}} ''сжатие'' на шаре <tex>V</tex>, если <tex>\exists q \in (0;1) \ \forall x',x'' \in \overline V</tex> <tex> : \| \mathcal{T}x''-\mathcal{T}x' \| \le q \|x''-x'\|</tex>
-}}
 {{Теорема
 |author=Банах
@@ Строка 70: / Строка 67: @@
 <tex>V_{\delta}(\overline{x_0}),~W_{\delta}(\overline{y_0})</tex> такие, что <tex>T_{\overline y}'(\overline x, \overline y) \le \frac 12,~\forall \overline y',\overline y'' \in W_{\delta}(\overline{y_0}),~\forall\overline x\in V_{\delta}(\overline{x_0})</tex>
-По неравенству Лаг
+По неравенству Лагранжа <tex>\|T(\overline x,\overline y'')-T(\overline x,\overline y')\| \le \sup\limits_{\overline z \in \{y',y''\}}\|T_{\overline y}'(\overline x,\overline z)\|\|\overline y''-\overline y'\|</tex>. Но по выбору шаров этот <tex>\sup \le \frac 12</tex> и, таким образом, в наших условиях <tex>\|T(\overline x,\overline y'')-T(\overline x,\overline y')\| \le \frac 12 \|\overline y''-\overline y'\|</tex>.
+<b>2 этап:</b> На первом этапе найден коэффициент сжатия: <tex>\frac 12</tex>. Если проверить для <tex>T</tex> условия теоремы Банаха по <tex>\overline y</tex> в пределах некоторых окрестностей начальных данных, то у <tex>T</tex> окажется единственная неподвижная точка, следовательно, она и будет значением неявного отображения и теорема будет доказана.
+<tex>\forall\overline x\in V_{\delta}(\overline{x_0}),~\forall \overline y, \in W_{\delta}(\overline{y_0})</tex>
+<tex>\overline{y_0}=T(\overline{x_0},\overline{y_0})</tex> (<tex>x_0,y_0</tex> — начальные данные). Тогда:
+<tex>\|T(\overline x,\overline y)-y_0\|=\|T(\overline x,\overline y)-T(\overline {x_0},\overline {y_0})\|\\=\|(T(\overline x,\overline y)-T(\overline x,\overline {y_0}))+(T(\overline x,\overline {y_0})-T(\overline {x_0},\overline {y_0}))\|\\\le\|T(\overline x,\overline y)-T(\overline x,\overline {y_0})\|+\|T(\overline x,\overline {y_0})-T(\overline {x_0},\overline {y_0})\|\le\frac 12 \|\overline y-\overline{y_0}\|+\|T(\overline x,\overline {y_0})-T(\overline {x_0},\overline {y_0})\|</tex>
+По непрерывности <tex>T</tex> вторая норма разности <tex>\xrightarrow{\overline x \to \overline {x_0}}0</tex>. Полагая в определении непрерывности <tex>\varepsilon=\frac{\delta}2</tex> (<tex>\delta</tex> у нас уже было выбрано), подбираем <tex>\delta':0<\delta'<\delta</tex>, так, чтобы <tex>\|\overline x - \overline{x_0}\|\le\delta' \Rightarrow \|T(\overline x,\overline{y_0})-T(\overline {x_0},\overline{y_0})\|\le\frac{\delta}2</tex>. <tex>\delta'</tex> не зависит от <tex>y</tex>!
+<tex>\overline x\in V_{\delta'}(\overline{x_0}),~\forall \overline y, \in W_{\delta}(\overline{y_0}): \|T(x,y)-y_0\|\le\frac 12\|y-\overline{y_0}\|+\frac 12\delta\le\frac 12\delta+\frac 12\delta=\delta:T(x,y)\in W_{\delta}(\overline{y_0})</tex>
+<tex>\forall\overline x\in V_{\delta}(\overline{x_0}),~\forall \overline y, \in W_{\delta}(\overline{y_0}).~T(\overline x,\cdot)\colon W_{\delta}(\overline{y_0})\to W_{\delta}(\overline{y_0})</tex> является сжатием с <tex>q=\frac 12</tex>, по теореме Банаха <tex>\exists y^*\in W_{\delta}(\overline{y_0}):\overline y^*=T(\overline x,\overline y^*)\Longleftrightarrow f(\overline x,\overline y^*)=0^m</tex>. В силу единственности такой точки неявное отображение определено. Пыщь-пыщь, щастье-радость!
+}}
+<tex>\begin{cases} f(x,y,\alpha)=0\\
+                   g(x,y,\alpha)=0 \end{cases};</tex> отсюда — если существуют <tex>(x_0,y_0,\alpha_0)</tex>, такие, что <tex>\begin{cases} f(x_0,y_0,\alpha_0)=0\\
+                   g(x_0,y_0,\alpha_0)=0 \end{cases};</tex> — верно и <tex>\begin{vmatrix} \frac{\delta f}{\delta x}(x_0,y_0,\alpha_0) & \frac{\delta f}{\delta y}(x_0,y_0,\alpha_0) \\ \frac{\delta g}{\delta x}(x_0,y_0,\alpha_0) & \frac{\delta g}{\delta y}(x_0,y_0,\alpha_0)\end{vmatrix}\ne 0</tex>, а сами функции <tex>f</tex> и <tex>g</tex> — непрерывны, то тогда, по доказательству теоремы, можно утверждать, что «возмущённая система уравнений»: <tex>\begin{cases} f(x_0,y_0,\alpha_0+\mathcal 4 \alpha)=0\\
+                   g(x_0,y_0,\alpha_0+\mathcal 4 \alpha)=0 \end{cases};</tex> при некоторых <tex>\delta > 0, |\mathcal 4 \alpha|,|x-x_0|,|y-y_0|<0</tex>, <tex>\forall\alpha</tex> будет иметь единственное решение по переменным <tex>\overline x,\overline y</tex>. Выяснить этот факт для конкретной системы некоторым прямым методом, как правило, невозможно.
+<u>Важное следствие</u>: Пусть <tex>\exists T\colon\mathbb R^n \to\mathbb R^n ; det(T'(\overline {x_0}))\ne 0</tex>. Тогда это отображение в окрестности этой точки локально обратимо.
+<tex>\vartriangleright \overline y = T(\overline x),\overline {y_0} = T(\overline {x_0})</tex>. Чтобы обратить <tex>T</tex>, надо в первом равенстве полагать <tex>x</tex> неизвестным, а <tex>y</tex> — заданным. Решение такого уравнения будет (всё в некоторых окрестностях начальных данных). <tex>f(\overline x, \overline y)=\overline y - T(\overline x),f(\overline x, \overline y)=0^n</tex>
+<tex>T^{-1}</tex> — неявное отображение. Локальная обратимость <tex>T</tex> определена непрерывностью <tex>T</tex>, непрерывностью соответствующих частных производных и тем фактом, что <tex>f'_{\overline x}(\overline x,\overline y)=-T'(x).~det(T'(\overline {x_0}))\ne 0\Rightarrow det(f'_{\overline x}(\overline {x_0}))\Rightarrow</tex> условия теоремы о неявном отображении выполнены. <tex>\vartriangleleft</tex>
+То, что мы установили — нетривиальное обобщение стандартного одномерного факта:
+Пусть <tex>y=f(x),f'(x_0)\ne 0,f'(x)</tex> — непрерывна.
+Если <tex>f'(x_0)>0 \Rightarrow \exists \delta > 0: |x-x_0|\le 0 \Rightarrow f'(x)>0</tex>. Тогда на отрезке <tex>[x_0-\delta;x_0+\delta]~f</tex> возрастает и у неё существует обратная функция.
+Ещё одним возможным приложением неявных отображений может служить задача об условном экстремуме.
+<tex>z=f(\overline x, \overline y),~\overline x=(x_1,\dots x_n),~\overline y=(y_1,\dots y_m)</tex>. Пусть заданы «уравнения связи» в количестве m:
+<tex>\begin{cases} g_1(\overline x,\overline y)=0\\
+              g_2(\overline x,\overline y)=0\\
+              \dots\\
+              g_m(\overline x,\overline y)=0 \end{cases};</tex>
+<tex>(\overline{x_0},\overline{y_0})</tex> — условный максимум функции <tex>f</tex>, если при <tex>\overline x \approx \overline{x_0},~\overline y \approx \overline{y_0}</tex> и <tex>(\overline x,\overline y)</tex>, удовлетворяющих уравнениям связи, выполняется неравенство <tex>f(\overline x,\overline y)\le f(\overline {x_0},\overline {y_0})</tex>. Если же <tex>f(\overline x,\overline y)\ge f(\overline {x_0},\overline {y_0}),~(\overline{x_0},\overline{y_0})</tex> — условный минимум.
+Пример: пусть на сфере есть две точки, A и B. Тогда кратчайшее расстояние между ними — отрезок. Он будет безусловным экстремумом. Но кратчайшее расстояние между ними вдоль сферы — дуга. Это будет условным экстремумом, так как есть уравнения связи.
+Для того, чтобы формулировка оказалась математически корректной, надо, чтобы из системы кравнений связи <tex>\overline y</tex> могла выражаться через <tex>\overline x</tex> в некоторой окрестности <tex>(\overline {x_0},\overline {y_0})</tex>. Очевидно, что уравнения связи можно рассмотреть как задачу о неявном отображении. Тогда все g, как и их частные производные — непрерывны. Соответственно, матрица Якоби должна быть обратимой.
+<tex>\overline y=\phi(\overline x).~z=f(\overline x,\phi(\overline x))</tex>. Мы получили задачу на безусловный экстреммум для полученного <tex>\overline z</tex>. Т.к. практически неявно отображающую формулу не найти, то можно пытаться составлять некоторую систему соотношения для точек, подобранных для условного экстремума, исходя из инвариантности дифференциалов n-го порядка. По этой инвариантности необходимые условия экстремума:
+<tex>dz=0</tex>
+<tex>\sum\limits_{j=1}^n \frac {\delta f}{\delta x_j}(\overline x,\overline y)dx_j+\sum\limits_{i=1}^m \frac {\delta f}{\delta y_i}(\overline x,\overline y)dy_i\equiv 0\qquad (*)</tex>
+Но так как <tex>\overline y=\phi(\overline x)</tex>, то, в отличие от безусловного экстремума, в котором мы могли бы все частные производные приравнять к нулю и получить систему, мы так решать не можем, ибо <tex>dy_i</tex> зависит от <tex>dx_1,\dots dx_n</tex>. Но, в отличие от <tex>\phi</tex>, эту зависимость можно найти явно. У нас должны выполняться следующие условия:
+<tex>g_k(\overline x,\overline y)=0, k=\overline{1,m}</tex>
+<tex>\sum\limits_{j=1}^n \frac {\delta g_k}{\delta x_j}dx_j+\sum\limits_{i=1}^m \frac {\delta g_k}{\delta y_i}dy_i\equiv 0</tex>
+В результате мы получаем СЛАУ для зависимости дифференциалов. Её матрицей будет матрица Якоби <tex>g'_{\overline y}(\overline x,\overline y)</tex>. Раз она обратима в <tex>(x_0,y_0)</tex>, то по непрерывности она будет обратима в окрестности этой точки, следовательно, <tex>dy</tex> можно выразить через <tex>dx</tex>, формулы будут линейны.
+<tex>dy_1=\sum\limits_{j=1}^n A_{1j}dx_j</tex>. Тогда, подставляя эти форулы в <tex>(*)</tex>, получим <tex>\sum\limits_{j=1}^m B_j dx_j=0 \Rightarrow B_j=0</tex>.
+Мы получили систему уравнений для полученных точек, похожих на условный экстремум; которую надо решать вместе с уравнениями связи.
+На самом деле этому можно придать более удобную форму, придуманную Лагранжем (метод множителей Лагранжа) (но математической новизны в нём нет!)
+'''Метод множителей Лагранжа:'''
+<tex>F(\overline x,\overline y,\overline {\lambda})=f(\overline x,\overline y)+\sum\limits_{k=1}^m \lambda_k g_k(\overline x,\overline y).</tex> Далее составляем систему соотношений так, будто для <tex>F</tex> мы стали искать безусловный экстремум:
+<tex>\begin{cases} \frac {\delta F}{\delta x_j}=0\\
+                   \frac {\delta F}{\delta y_i}=0\\
+                   \frac {\delta F}{\delta \lambda_k}=0 \Longleftrightarrow g_k(\overline x,\overline y)=0\end{cases};</tex>
+Если всё это раскрыть, получим то, о чём мы говорили выше, но эта запись более компактна.
+[[Категория: Математический анализ 1 курс]]

Локальная теорема о неявном отображении — различия между версиями

Версия 01:46, 9 июня 2011

Принцип сжатия Банаха

2

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты