Локальная теорема о неявном отображении — различия между версиями
(→Принцип сжатия Банаха) |
м (rollbackEdits.php mass rollback) |
||
(не показано 7 промежуточных версий 5 участников) | |||
Строка 89: | Строка 89: | ||
<tex> \Longleftarrow </tex> Пусть теперь <tex>\overline y = \overline y - \Gamma_0 f(\overline x, \overline y)</tex>. Тогда <tex>\Gamma_0 f(\overline x, \overline y)=0^m. \Gamma_0=(f_{\overline y}'(\overline{x_0},\overline{y_0}))^{-1}</tex>, следовательно, <tex>det \Gamma_0 \ne 0</tex>, поэтому соответствующая однородная система уравнений будет иметь только тривиальные решения и <tex>f(\overline x, \overline y)=0^m</tex> | <tex> \Longleftarrow </tex> Пусть теперь <tex>\overline y = \overline y - \Gamma_0 f(\overline x, \overline y)</tex>. Тогда <tex>\Gamma_0 f(\overline x, \overline y)=0^m. \Gamma_0=(f_{\overline y}'(\overline{x_0},\overline{y_0}))^{-1}</tex>, следовательно, <tex>det \Gamma_0 \ne 0</tex>, поэтому соответствующая однородная система уравнений будет иметь только тривиальные решения и <tex>f(\overline x, \overline y)=0^m</tex> | ||
− | Пусть <tex>T(\overline x, \overline y) = \overline y - \Gamma_0 f(\overline x, \overline y)</tex>, тогда <tex>\overline y = T(\overline x,\overline y)</tex>. | + | Пусть <tex>T(\overline x, \overline y) = \overline y - \Gamma_0 f(\overline x, \overline y)</tex>, тогда <tex>\overline y = T(\overline x,\overline y)</tex> для <tex> f(x, y) = 0 </tex>. |
− | Для фиксированного <tex> x </tex> получаем задачу на неподвижную точку для отображения <tex>T</tex> по переменной <tex>\overline y</tex> | + | Для фиксированного <tex> x </tex> получаем задачу на неподвижную точку для отображения <tex>T</tex> по переменной <tex>\overline y</tex>. |
Воспользуемся для решения принципом сжатия Банаха. Существует ли (в определённых начальных данных) коэффициент сжатия? | Воспользуемся для решения принципом сжатия Банаха. Существует ли (в определённых начальных данных) коэффициент сжатия? | ||
− | <tex>T_{\overline y}' = J - \Gamma_0 f_{\overline y}';~\Gamma_0 f_{\overline y}'(\overline{x_0},\overline{y_0})=J</tex> | + | <tex>T_{\overline y}' = J - \Gamma_0 f_{\overline y}';~\Gamma_0 f_{\overline y}'(\overline{x_0},\overline{y_0})=J</tex> по определению <tex> \Gamma_0 </tex>. Значит, <tex>T_{\overline y}'(\overline{x_0},\overline{y_0})=0</tex>. |
По условию, <tex>f</tex> зависит от <tex>\overline x, \overline y</tex>, следовательно, <tex>T'</tex> — тоже. Тем самым, в определении непрерывности полагаем <tex> \varepsilon=\frac 12,\exists \delta>0 </tex> | По условию, <tex>f</tex> зависит от <tex>\overline x, \overline y</tex>, следовательно, <tex>T'</tex> — тоже. Тем самым, в определении непрерывности полагаем <tex> \varepsilon=\frac 12,\exists \delta>0 </tex> | ||
Строка 104: | Строка 104: | ||
<tex> \| T_{\overline y}'(\overline x, \overline y) \| \le \frac 12 </tex> | <tex> \| T_{\overline y}'(\overline x, \overline y) \| \le \frac 12 </tex> | ||
− | Тогда по неравенству Лагранжа <tex>\|T(\overline x,\overline y'')-T(\overline x,\overline y')\| \le \sup\limits_{\overline z \in | + | Тогда по неравенству Лагранжа <tex>\|T(\overline x,\overline y'')-T(\overline x,\overline y')\| \le \sup\limits_{\overline z \in [y',y'']}\|T_{\overline y}'(\overline x,\overline z)\|\|\overline y''-\overline y'\|</tex>. Но по выбору шаров этот <tex>\sup \le \frac 12</tex> и, таким образом, в наших условиях <tex>\|T(\overline x,\overline y'')-T(\overline x,\overline y')\| \le \frac 12 \|\overline y''-\overline y'\|</tex>. |
− | <b>2 этап:</b> На первом этапе найден коэффициент сжатия: <tex>\frac 12</tex>. Если проверить для <tex>T</tex> условия теоремы Банаха по <tex>\overline y</tex> в пределах некоторых окрестностей начальных данных, то у <tex>T</tex> окажется единственная неподвижная точка, следовательно, она и будет значением неявного отображения и теорема будет доказана. | + | <b>2 этап:</b> На первом этапе найден коэффициент сжатия: <tex>\frac 12</tex>. Если проверить для <tex>T</tex> условия теоремы Банаха по <tex>\overline y</tex> в пределах некоторых окрестностей начальных данных, то у <tex>T</tex> окажется единственная неподвижная точка, следовательно, она и будет значением неявного отображения, и теорема будет доказана. |
<tex>\forall\overline x\in V_{\delta}(\overline{x_0}),~\forall \overline y, \in W_{\delta}(\overline{y_0})</tex> | <tex>\forall\overline x\in V_{\delta}(\overline{x_0}),~\forall \overline y, \in W_{\delta}(\overline{y_0})</tex> | ||
Строка 190: | Строка 190: | ||
<tex>(\overline{x_0},\overline{y_0})</tex> — '''условный максимум''' функции <tex>f</tex>, если для всех <tex>\overline x \approx \overline{x_0},~\overline y \approx \overline{y_0}</tex> и <tex>(\overline x,\overline y)</tex>, удовлетворяющих уравнениям связи, выполняется неравенство <tex>f(\overline x,\overline y)\le f(\overline {x_0},\overline {y_0})</tex>. Если же <tex>f(\overline x,\overline y)\ge f(\overline {x_0},\overline {y_0}),~(\overline{x_0},\overline{y_0})</tex> — '''условный минимум'''. | <tex>(\overline{x_0},\overline{y_0})</tex> — '''условный максимум''' функции <tex>f</tex>, если для всех <tex>\overline x \approx \overline{x_0},~\overline y \approx \overline{y_0}</tex> и <tex>(\overline x,\overline y)</tex>, удовлетворяющих уравнениям связи, выполняется неравенство <tex>f(\overline x,\overline y)\le f(\overline {x_0},\overline {y_0})</tex>. Если же <tex>f(\overline x,\overline y)\ge f(\overline {x_0},\overline {y_0}),~(\overline{x_0},\overline{y_0})</tex> — '''условный минимум'''. | ||
− | |||
− | + | Допустим все <tex> g_i </tex>, как и их частные производные — непрерывны, и матрица Якоби должна быть обратимой. Тогда <tex>\overline y</tex> выражается через <tex>\overline x</tex> в некоторой окрестности <tex>(\overline {x_0},\overline {y_0})</tex>. | |
<tex>\overline y=\phi(\overline x),\ \overline z=f(\overline x,\phi(\overline x))</tex>. Мы получили задачу на безусловный экстреммум для <tex>\overline z</tex>. Т.к. практически неявно отображающую формулу не найти, то можно пытаться составлять некоторую систему соотношения для точек, подобранных для условного экстремума, исходя из инвариантности дифференциалов n-го порядка. По этой инвариантности необходимые условия экстремума: | <tex>\overline y=\phi(\overline x),\ \overline z=f(\overline x,\phi(\overline x))</tex>. Мы получили задачу на безусловный экстреммум для <tex>\overline z</tex>. Т.к. практически неявно отображающую формулу не найти, то можно пытаться составлять некоторую систему соотношения для точек, подобранных для условного экстремума, исходя из инвариантности дифференциалов n-го порядка. По этой инвариантности необходимые условия экстремума: | ||
Строка 198: | Строка 197: | ||
<tex>dz=0</tex> | <tex>dz=0</tex> | ||
− | <tex>\sum\limits_{j=1}^n \frac {\ | + | <tex>\sum\limits_{j=1}^n \frac {\partial f}{\partial x_j}(\overline x,\overline y)dx_j+\sum\limits_{i=1}^m \frac {\partial f}{\partial y_i}(\overline x,\overline y)dy_i = 0\qquad (*)</tex> |
Но так как <tex>\overline y=\phi(\overline x)</tex>, то, в отличие от безусловного экстремума, в котором мы могли бы все частные производные приравнять к нулю и получить систему, мы так решать не можем, ибо <tex>dy_i</tex> зависит от <tex>dx_1,\dots dx_n</tex>. Но, в отличие от <tex>\phi</tex>, эту зависимость можно найти явно. У нас должны выполняться следующие условия: | Но так как <tex>\overline y=\phi(\overline x)</tex>, то, в отличие от безусловного экстремума, в котором мы могли бы все частные производные приравнять к нулю и получить систему, мы так решать не можем, ибо <tex>dy_i</tex> зависит от <tex>dx_1,\dots dx_n</tex>. Но, в отличие от <tex>\phi</tex>, эту зависимость можно найти явно. У нас должны выполняться следующие условия: | ||
Строка 204: | Строка 203: | ||
<tex>g_k(\overline x,\overline y)=0, k=\overline{1,m}</tex> | <tex>g_k(\overline x,\overline y)=0, k=\overline{1,m}</tex> | ||
− | <tex>\sum\limits_{j=1}^n \frac {\ | + | <tex>\sum\limits_{j=1}^n \frac {\partial g_k}{\partial x_j}dx_j+\sum\limits_{i=1}^m \frac {\partial g_k}{\partial y_i}dy_i = 0</tex> |
В результате мы получаем СЛАУ для зависимости дифференциалов. Её матрицей будет матрица Якоби <tex>g'_{\overline y}(\overline x,\overline y)</tex>. Раз она обратима в <tex>(x_0,y_0)</tex>, то по непрерывности она будет обратима в окрестности этой точки, следовательно, <tex>dy</tex> можно выразить через <tex>dx</tex>, формулы будут линейны. | В результате мы получаем СЛАУ для зависимости дифференциалов. Её матрицей будет матрица Якоби <tex>g'_{\overline y}(\overline x,\overline y)</tex>. Раз она обратима в <tex>(x_0,y_0)</tex>, то по непрерывности она будет обратима в окрестности этой точки, следовательно, <tex>dy</tex> можно выразить через <tex>dx</tex>, формулы будут линейны. | ||
− | <tex>dy_1=\sum\limits_{j=1}^n A_{1j}dx_j</tex>. Тогда, подставляя эти форулы в <tex>(*)</tex>, получим <tex>\sum\limits_{j=1}^ | + | <tex>dy_1=\sum\limits_{j=1}^n A_{1j}dx_j</tex>. Тогда, подставляя эти форулы в <tex>(*)</tex>, получим <tex>\sum\limits_{j=1}^n B_j dx_j=0 \Rightarrow \forall j : B_j = 0</tex>, так как дифференцируются независимые переменные. |
Мы получили систему уравнений для полученных точек, похожих на условный экстремум; которую надо решать вместе с уравнениями связи. | Мы получили систему уравнений для полученных точек, похожих на условный экстремум; которую надо решать вместе с уравнениями связи. | ||
Строка 218: | Строка 217: | ||
<tex>F(\overline x,\overline y,\overline {\lambda})=f(\overline x,\overline y)+\sum\limits_{k=1}^m \lambda_k g_k(\overline x,\overline y).</tex> Далее составляем систему соотношений так, будто для <tex>F</tex> мы стали искать безусловный экстремум: | <tex>F(\overline x,\overline y,\overline {\lambda})=f(\overline x,\overline y)+\sum\limits_{k=1}^m \lambda_k g_k(\overline x,\overline y).</tex> Далее составляем систему соотношений так, будто для <tex>F</tex> мы стали искать безусловный экстремум: | ||
− | <tex>\begin{cases} \frac {\ | + | <tex>\begin{cases} \frac {\partial F}{\partial x_j}=0\\ |
− | \frac {\ | + | \frac {\partial F}{\partial y_i}=0\\ |
− | \frac {\ | + | \frac {\partial F}{\partial \lambda_k}=0 \Longleftrightarrow g_k(\overline x,\overline y)=0\end{cases};</tex> |
Если всё это раскрыть, получим то, о чём мы говорили выше, но эта запись более компактна. | Если всё это раскрыть, получим то, о чём мы говорили выше, но эта запись более компактна. |
Текущая версия на 19:21, 4 сентября 2022
Содержание
Принцип сжатия Банаха
Принцип сжатия будем излагать для нормированных пространств, хотя он без изменения переносится на метрические пространства.
Определение: |
Пусть — сжатие на шаре , если . | — B-пространство. Пусть — замкнутый шар в .
Теорема (Банах): |
У любого сжимающего отображения существует ровно одна неподвижная точка . |
Доказательство: |
. Тогда Рассмотрим ряд Выкинем первое слагаемое и замажорируем этот ряд геометрической прогрессией. , . Последний ряд сходится и ряд из норм тоже сходится. По свойствам рядов определим . . Если , то . Но любое сжатие непрерывно (в определении равномерной непрерывности подставить ). Это позволяет в перейти к пределу — . Получили неподвижную точку .Допустим теперь, что существуют две различных неподвижных точки: Если Поэтому , то составим норму их разности: и при , что противоречит условию. , следовательно, . |
Теорема о неявном отображении
Пусть
, тогда рассмотрим ., . Существуют ли такие , что для любого существует единственный ?
Если это так, то, в силу единственности y, определяем
на так, чтобы . — неявное отображение, определяется как
Пример, единичная окружность:
В малых окрестностях начальных данных вертикаль, проведённая через
, будет давать соответствующий единственный . Если решать задачу вне окрестности , получится 2 , теряется единственность . Именно поэтому крайне важно указывать окрестности, в которых мы ищем отображения. .Сейчас мы установим условия, при которых неявное отображение будет существовать:
— производная отображения , при фиксированном и варьирующемся .
зависит и от , и от . — линейный оператор, поэтому непрерывность понимается в метрике линейного оператора:
Определение: |
Непрерывность линейного оператора: |
— матрица, размером . Оператор непрерывно обратим в , то есть, у матрицы этого оператора существует обратная (её детерминант не равен нулю).
Теорема (О неявном отображении): |
Пусть для поставлена задача о неявном отображении, с начальными данными . Известно, что в окрестности начальных данных непрерывно зависит от и непрерывно обратима в . Тогда в некоторой окрестности начальных данных неявное отображение существует. |
Доказательство: |
Доказательство разбиваем на 2 этапа (и на экзамене они тоже будут спрашиваться по отдельности): 1 этап: Пусть Промежуточное утверждение: .Проверим равносильность: Пусть . — верное в любом случае уравнение. Пусть теперь . Тогда , следовательно, , поэтому соответствующая однородная система уравнений будет иметь только тривиальные решения и Пусть , тогда для .Для фиксированного получаем задачу на неподвижную точку для отображения по переменной .Воспользуемся для решения принципом сжатия Банаха. Существует ли (в определённых начальных данных) коэффициент сжатия? по определению . Значит, . По условию, зависит от , следовательно, — тоже. Тем самым, в определении непрерывности полагаем
Возьмем такие, что приТогда по неравенству Лагранжа . Но по выбору шаров этот и, таким образом, в наших условиях .2 этап: На первом этапе найден коэффициент сжатия: . Если проверить для условия теоремы Банаха по в пределах некоторых окрестностей начальных данных, то у окажется единственная неподвижная точка, следовательно, она и будет значением неявного отображения, и теорема будет доказана.
( — начальные данные). Тогда:
По непрерывности, вторая норма разности стремится к 0 при . Полагая в определении непрерывности ( у нас уже было выбрано), подбираем , так, чтобы . не зависит от !
Значит, по теореме Банаха является сжатием с . . В силу единственности такой точки, неявное отображение определено. Пыщь-пыщь, щастье-радость! |
Приведем пример использования неявного отображения.
Дана система уравнений:
Если существуют
, такие, что
А также
,
и указанные выше частные производные непрерывны, то, по только что доказанной теореме, можно утверждать, что «возмущённая система уравнений»:
при некоторых
, будет иметь единственное решение по переменным . Выяснить этот факт для конкретной системы некоторым прямым методом, как правило, невозможно.Важное следствие
Теорема: |
Пусть . Тогда это отображение в окрестности локально обратимо. |
Доказательство: |
. Чтобы обратить , надо в первом равенстве полагать неизвестным, а — заданным. Мы хотим доказать, что решение у такого уравнения обязательно будет (всё в некоторых окрестностях начальных данных).Рассмотрим — неявное отображение. Локальная обратимость определена непрерывностью , непрерывностью соответствующих частных производных и тем фактом, что условия теоремы о неявном отображении выполнены, и локально обратимо. |
То, что мы установили — нетривиальное обобщение стандартного одномерного факта:
Пусть
— непрерывна.Если
.Тогда на отрезке
возрастает, и у неё существует обратная функция.Задача об условном экстремуме
Ещё одним возможным приложением неявных отображений может служить задача об условном экстремуме.
. Пусть заданы «уравнения связи» в количестве m:
— условный максимум функции , если для всех и , удовлетворяющих уравнениям связи, выполняется неравенство . Если же — условный минимум.
Допустим все , как и их частные производные — непрерывны, и матрица Якоби должна быть обратимой. Тогда выражается через в некоторой окрестности .
. Мы получили задачу на безусловный экстреммум для . Т.к. практически неявно отображающую формулу не найти, то можно пытаться составлять некоторую систему соотношения для точек, подобранных для условного экстремума, исходя из инвариантности дифференциалов n-го порядка. По этой инвариантности необходимые условия экстремума:
Но так как
, то, в отличие от безусловного экстремума, в котором мы могли бы все частные производные приравнять к нулю и получить систему, мы так решать не можем, ибо зависит от . Но, в отличие от , эту зависимость можно найти явно. У нас должны выполняться следующие условия:
В результате мы получаем СЛАУ для зависимости дифференциалов. Её матрицей будет матрица Якоби
. Раз она обратима в , то по непрерывности она будет обратима в окрестности этой точки, следовательно, можно выразить через , формулы будут линейны.. Тогда, подставляя эти форулы в , получим , так как дифференцируются независимые переменные.
Мы получили систему уравнений для полученных точек, похожих на условный экстремум; которую надо решать вместе с уравнениями связи.
На самом деле, этому можно придать более удобную форму, придуманную Лагранжем (метод множителей Лагранжа) (но математической новизны в нём нет!)
Метод множителей Лагранжа:
Далее составляем систему соотношений так, будто для мы стали искать безусловный экстремум:
Если всё это раскрыть, получим то, о чём мы говорили выше, но эта запись более компактна.