Дифференцируемые отображения в нормированных пространствах — различия между версиями

Материал из Викиконспекты
Перейти к: навигация, поиск
м (вроде должен быть столбик а не строчка)
м (rollbackEdits.php mass rollback)
 
(не показано 20 промежуточных версий 7 участников)
Строка 1: Строка 1:
 +
[[Линейные операторы в нормированных пространствах|<<]] [[Формула Тейлора для функций многих переменных|>>]]
 +
__TOC__
 +
 +
== Производная Фреше ==
 +
 
{{Определение
 
{{Определение
 
|definition=
 
|definition=
Пусть <tex>V_{r}(x)</tex> {{---}}шар в <tex>X, \quad \mathcal{F} : V_r(x) \to Y </tex>. <tex>\mathcal{F}</tex> {{---}} '''дифференцируема''' в точке <tex>x</tex>, если существует зависящий от <tex> x </tex> ограниченный линейный оператор <tex>\mathcal{A} : X \to Y</tex>, такой, что если <tex>\left \| \Delta x \right \| < r (x + \Delta x \in V_r(x))</tex>, то:
+
Пусть <tex>V_{r}(x)</tex> {{---}}шар в <tex>X, \quad \mathcal{F} : V_r(x) \to Y </tex>. <tex>\mathcal{F}</tex> {{---}} '''дифференцируема''' в точке <tex>x</tex>, если существует зависящий от <tex> x </tex> ограниченный линейный оператор <tex>\mathcal{A} : X \to Y</tex>, такой, что если <tex>\left \| \Delta x \right \| < r</tex>, <tex>(x + \Delta x) \in V_r(x)</tex>, то:
  
 
<tex> \mathcal{F}(x + \Delta x) - \mathcal{F}(x) = \mathcal{A}(\Delta x) + \alpha(\Delta x) \left \| \Delta x \right \| </tex>,  
 
<tex> \mathcal{F}(x + \Delta x) - \mathcal{F}(x) = \mathcal{A}(\Delta x) + \alpha(\Delta x) \left \| \Delta x \right \| </tex>,  
Строка 8: Строка 13:
 
Тогда <tex>\mathcal{A}(x) = \mathcal{F}'(x)</tex> {{---}} '''производная Фреше''' отображения <tex>\mathcal{F}</tex> в точке <tex>x</tex>.
 
Тогда <tex>\mathcal{A}(x) = \mathcal{F}'(x)</tex> {{---}} '''производная Фреше''' отображения <tex>\mathcal{F}</tex> в точке <tex>x</tex>.
 
}}
 
}}
 
+
При <tex> X = Y = \mathbb{R} </tex> получаем определение дифференциала и производной функции одной переменной.
При <tex> X = Y = \mathcal{R} </tex> получаем определение дифференциала и производной функции одной переменной.
 
  
 
Установим теорему, обобщающую классическое правило дифференцирования сложной функции :
 
Установим теорему, обобщающую классическое правило дифференцирования сложной функции :
Строка 19: Строка 23:
 
|proof=
 
|proof=
 
Доказательство копирует классическое доказательство, с заменой знака модуля на знак нормы.
 
Доказательство копирует классическое доказательство, с заменой знака модуля на знак нормы.
{{TODO|t=Вот и неплохо бы скопировать его сюда.}}
+
 
 +
Вот же оно!
 +
 
 +
По определению дифференциала
 +
<tex>\Delta z = g(y_0 + \Delta y) - g(y_0) = g'(y_0)\Delta y + o(\Delta y)</tex> и
 +
<tex>\Delta y = f(x_0 + \Delta x) - f(x_0) = f'(x_0)\Delta x + o(\Delta x)</tex>
 +
 
 +
<tex>g</tex> определена в окрестности точки <tex>y_0</tex>. Так как <tex>\Delta y \to 0</tex> при <tex>\Delta x \to 0</tex> и <tex>y_0 = f(x_0)</tex>, то
 +
при <tex>\Delta x \to 0</tex>, <tex>f(x_0 + \Delta x)</tex> принадлежит окрестности точки <tex>y_0</tex>.
 +
 
 +
Тогда функция <tex>z = g(f(x))</tex> при <tex>x = x_0 + \Delta x, \ \Delta x \to 0</tex> корректно определена.
 +
 
 +
<tex>\Delta y = f(x_0 + \Delta x) - f(x_0)</tex>
 +
 
 +
<tex>\Delta g = g(f(x_0) + (f(x_0 + \Delta x) - f(x_0))) - g(f(x_0)) = </tex>
 +
<tex>g(f(x_0 + \Delta x)) - g(f(x_0)) = </tex>
 +
(по определению дифференциала для <tex>g(y)</tex>)
 +
<tex>g'(y_0)(f(x_0 + \Delta x) - f(x_0)) + o(\Delta y) =</tex>
 +
(по определению дифференциала для <tex>f(x)</tex>)
 +
<tex>g'(y_0)f'(x_0)\Delta x+ g'(y_0) o(\Delta x) + o(\Delta y)</tex>
 +
 
 +
Итого получаем:
 +
<tex>\Delta g = g'(y_0)f'(x_0)\Delta x + g'(y_0)o(\Delta x) + o(\Delta y)</tex>
 +
 
 +
Устремляя <tex>\Delta x \to 0</tex>, получаем <tex>dz = g'(y_0)f'(x_0)\Delta x</tex>
 +
 
 +
Для полного счастья осталось доказать, что <tex>o(\Delta x) = o(\Delta y)</tex>.
 +
 
 +
{{Утверждение
 +
|statement=
 +
<tex>o(\Delta x) = o(\Delta y)</tex>
 +
|proof=
 +
По определению <tex>o(\Delta y)</tex>, получаем:
 +
<tex>\forall \varepsilon > 0 \  \exists \delta > 0 : \ |\Delta y| < \delta \Rightarrow \left|\frac{o(\Delta y)}{\Delta y}\right| \leq \varepsilon</tex>
 +
 
 +
Последнее неравенство равносильно следующему: <tex>|o(\Delta y)| \leq \varepsilon |\Delta y|</tex>
 +
 
 +
<tex>\Delta y = f(x_0 + \Delta x) - f(x_0) = f'(x_0)\Delta x + o(\Delta x) = \Delta x(f'(x_0) + o(1)) </tex>, где <tex>o(1) = \frac{o(\Delta x)}{\Delta x}</tex>, что стремится к <tex>0</tex>.
 +
 
 +
Из всего этого следует, что при <tex>\Delta x \to 0</tex>, <tex>\Delta y \to 0</tex> для имеющегося <tex>\delta > 0</tex>.
 +
 
 +
Так как <tex>f(x)</tex> &mdash; непрерывна, то существует <tex>\delta_1 > 0: \ |\Delta x| < \delta_1 \Rightarrow |\Delta y| < \delta
 +
\Rightarrow |o(\Delta y)| < \varepsilon |\Delta y| = \varepsilon \Delta x |f'(x_0) + o(1)|
 +
</tex>.
 +
 
 +
Тогда получаем, что
 +
<tex>\forall \varepsilon > 0 \ \exists \delta_1 > 0: \ |\Delta x| < \delta_1 \Rightarrow
 +
o(\Delta y) \leq M \varepsilon |\Delta x| \Rightarrow o(\Delta y) = o(\Delta x)
 +
</tex>, где <tex>M = |f'(x_0) + o(1)|</tex>.
 
}}
 
}}
 +
конец теоремы, далее следует продолжение конспекта про отображения в НП
 +
 +
}}
 +
  
 
Из дифференцируемости следует непрерывность :
 
Из дифференцируемости следует непрерывность :
  
<tex>\left|| \mathcal{F}'(x)\Delta x |\right| \le \left|| \mathcal{F}'(x)|\right| \left|| \Delta x |\right|</tex>.
+
<tex>\left\| \mathcal{F}'(x)\Delta x |\right| \le \left\| \mathcal{F}'(x)|\right| \left\| \Delta x |\right|</tex>.
  
 
Исходя из неравенства треугольника и определения производной,
 
Исходя из неравенства треугольника и определения производной,
Строка 32: Строка 88:
 
Правая часть этого выражения стремится к нулю при <tex> \Delta x \rightarrow 0 </tex>, следовательно, <tex>\mathcal{F}</tex> {{---}} непрерывна в точке <tex> x </tex>.
 
Правая часть этого выражения стремится к нулю при <tex> \Delta x \rightarrow 0 </tex>, следовательно, <tex>\mathcal{F}</tex> {{---}} непрерывна в точке <tex> x </tex>.
  
Найдем вид матрицы производной Фреше при <tex>\mathcal{F} : V_r(x) \subset \mathbb{R}^n \to \mathbb{R}^m</tex>. Пусть <tex>\mathcal{F}'(\overline{x}) = A_{ij}</tex>
+
Найдем вид матрицы производной Фреше при <tex>\mathcal{F} : V_r(x) \subset \mathbb{R}^n \to \mathbb{R}^m</tex>. Пусть <tex>\mathcal{F}'(\overline{x}) = A</tex>
  
По условию <tex>\mathcal{F}(\overline{x} + \Delta\overline{x}) - \mathcal{F}(\overline{x}) = \mathcal{F}'(\overline{x})\Delta\overline{x} + \alpha(\Delta\overline{x})\left||\Delta\overline{x}|\right|</tex>
+
По условию <tex>\mathcal{F}(\overline{x} + \Delta\overline{x}) - \mathcal{F}(\overline{x}) = \mathcal{F}'(\overline{x})\Delta\overline{x} + \alpha(\Delta\overline{x})\left\|\Delta\overline{x}|\right|</tex>
  
<tex>\mathcal{F} = (\mathcal{F}_1,...,\mathcal{F}_n), \quad \mathcal{F}_i(\overline{x} + \Delta\overline{x}) - \mathcal{F}_i(\overline{x}) = \sum\limits_{j = 1}^{n}A_{ij} \Delta x_j + \alpha_i(\Delta\overline{x})\left||\Delta\overline{x}|\right|</tex>
+
<tex>\mathcal{F} = (\mathcal{F}_1,...,\mathcal{F}_n), \quad \mathcal{F}_i(\overline{x} + \Delta\overline{x}) - \mathcal{F}_i(\overline{x}) = \sum\limits_{j = 1}^{n}A_{ij} \Delta x_j + \alpha_i(\Delta\overline{x})\left\|\Delta\overline{x}|\right|</tex>
  
 
<tex> \Delta x = h \cdot e_j = (0, 0,..,h,..,0), \quad \forall h \in \mathbb{R}</tex>
 
<tex> \Delta x = h \cdot e_j = (0, 0,..,h,..,0), \quad \forall h \in \mathbb{R}</tex>
Строка 94: Строка 150:
 
</tex>
 
</tex>
  
 +
== Дифференцирование композиции функций ==
 
Существование всех частных производных координатных функции отнюдь не гарантирует дифференцируемость <tex>\mathcal{F}</tex>. Для указания достаточных условий предварительно рассмотрим один частный случай {{---}} дифференцирование композиций.
 
Существование всех частных производных координатных функции отнюдь не гарантирует дифференцируемость <tex>\mathcal{F}</tex>. Для указания достаточных условий предварительно рассмотрим один частный случай {{---}} дифференцирование композиций.
  
Строка 140: Строка 197:
 
<tex>\varphi_j(t) = ta_j + (1-t)b_j, \quad \varphi'_{j}(t) = a_j - b_j</tex>
 
<tex>\varphi_j(t) = ta_j + (1-t)b_j, \quad \varphi'_{j}(t) = a_j - b_j</tex>
  
<tex>g</tex> {{---}}непрерывна на <tex>[0,1]</tex> и дифференцируема на нем. Значит, к ней применима формула Лагранжа конечных приращений : <tex>g(1) - g(0) = g'(\Theta), \quad \Theta \in [0,1]</tex>
+
<tex>g</tex> {{---}}непрерывна на <tex>[0,1]</tex> и дифференцируема на нем. Значит, к ней применима формула Лагранжа конечных приращений : <tex>g(1) - g(0) = g'(\theta), \quad \theta \in [0,1]</tex>
  
 
Заменяя <tex>g</tex> и <tex>g'</tex> по найденным формулам, получаем :
 
Заменяя <tex>g</tex> и <tex>g'</tex> по найденным формулам, получаем :
  
<tex>f(\overline{a}) - f(\overline{b}) = \sum\limits_{j = 1}^{n}(a_j-b_j)\frac{\partial f}{\partial x_j}(\Theta\overline{a} + (1-\Theta)\overline{b}) = f'(\Theta\overline{a}+(1-\Theta)\overline{b})(\overline{a} -\overline{b})</tex>
+
<tex>f(\overline{a}) - f(\overline{b}) = \sum\limits_{j = 1}^{n}(a_j-b_j)\frac{\partial f}{\partial x_j}(\theta\overline{a} + (1-\theta)\overline{b}) = f'(\theta\overline{a}+(1-\theta)\overline{b})(\overline{a} -\overline{b})</tex>
  
Мы пришли к следующему обобщению формулы Лагранжа конечных приращений:
+
=== Обобщение формулы Лагранжа конечных приращений ===
  
пусть <tex>f</tex> {{---}}дифференцируема в <tex>V</tex>. Тогда <tex>\forall a, b \in V : f(\overline{a}) - f(\overline{b}) = f'(\Theta\overline{a}+(1-\Theta)\overline{b})(\overline{a}-\overline{b}),\quad \Theta \in (0,1)</tex>
+
пусть <tex>f</tex> {{---}}дифференцируема в <tex>V</tex>. Тогда <tex>\forall a, b \in V : f(\overline{a}) - f(\overline{b}) = f'(\theta\overline{a}+(1-\theta)\overline{b})(\overline{a}-\overline{b}),\quad \theta \in (0,1)</tex>
  
 
Для <tex>\mathcal{F} : V \to \mathbb{R}^m, \quad V \in \mathbb{R}^n, m > 1</tex> {{---}}формула Лагранжа становится неверной. Невозможно подобрать <tex>\Theta</tex>, обслуживающее все координатные функции сразу.
 
Для <tex>\mathcal{F} : V \to \mathbb{R}^m, \quad V \in \mathbb{R}^n, m > 1</tex> {{---}}формула Лагранжа становится неверной. Невозможно подобрать <tex>\Theta</tex>, обслуживающее все координатные функции сразу.
Строка 154: Строка 211:
 
<tex>\mathcal{F} = (\mathcal{F}_1,...,\mathcal{F}_n)</tex>
 
<tex>\mathcal{F} = (\mathcal{F}_1,...,\mathcal{F}_n)</tex>
  
<tex>\mathcal{F}_i(\overline{a}) - \mathcal{F}_i(\overline{b} = \mathcal{F}'_i(\Theta_i\overline{a}+(1-\Theta_i)\overline{b})(\overline{a}-\overline{b})</tex>.
+
<tex>\mathcal{F}_i(\overline{a}) - \mathcal{F}_i(\overline{b}) = \mathcal{F}'_i(\theta_i\overline{a}+(1-\theta_i)\overline{b})(\overline{a}-\overline{b})</tex>.
  
Для разных <tex>i</tex> {{---}}разные <tex>\Theta_i</tex>. Впрочем, для отдельных координат формулу писать все равно можно. Однако формула Лагранжа допускает распространение и на абстрактную ситуацию, но в несколько другом виде.
+
Для разных <tex>i</tex> {{---}}разные <tex>\theta_i</tex>. Впрочем, для отдельных координат формулу писать все равно можно. Однако формула Лагранжа допускает распространение и на абстрактную ситуацию, но в несколько другом виде.
  
 
{{Теорема
 
{{Теорема
|author=
+
|about=
 
Неравенство Лагранжа
 
Неравенство Лагранжа
 
|statement=
 
|statement=
Строка 166: Строка 223:
 
<tex>\forall  \overline{a},\overline{b} \in V : \left|\left| \mathcal{F}(\overline{b}) - \mathcal{F}(\overline{a})\right|\right| \le M\left|\left|\overline{b}-\overline{a}\right|\right|</tex>, где <tex>M = \sup\limits_{x \in [\overline{a},\overline{b}]} \left|\left|\mathcal{F}'(\overline{x})\right|\right| </tex>
 
<tex>\forall  \overline{a},\overline{b} \in V : \left|\left| \mathcal{F}(\overline{b}) - \mathcal{F}(\overline{a})\right|\right| \le M\left|\left|\overline{b}-\overline{a}\right|\right|</tex>, где <tex>M = \sup\limits_{x \in [\overline{a},\overline{b}]} \left|\left|\mathcal{F}'(\overline{x})\right|\right| </tex>
 
|proof=
 
|proof=
По доказанному ранее, для <tex>\mathcal{F}(\overline{b}) - \mathcal{F}(\overline{a}) \in \mathbb{R}^m </tex> существует линейный непрерывный функционал <tex>\varphi : \varphi(\mathcal{F}(\overline{a}) - \mathcal{F}(\overline{b})) = \left|\left|\mathcal{F}(\overline{a}) - \mathcal{F}(\overline{b})\right|\right|, \quad ||\varphi|| = 1</tex>
+
По доказанному ранее, для <tex>\mathcal{F}(\overline{b}) - \mathcal{F}(\overline{a}) \in \mathbb{R}^m </tex> существует линейный непрерывный функционал <tex>\varphi : \varphi(\mathcal{F}(\overline{a}) - \mathcal{F}(\overline{b})) = \left|\left|\mathcal{F}(\overline{a}) - \mathcal{F}(\overline{b})\right|\right|, \quad \|\varphi\| = 1</tex>
 +
 
 +
Докажем, что <tex>\varphi = \varphi'</tex>. Так как <tex>\varphi</tex> {{---}} линейный оператор, то <tex>\varphi(\bar x) = \varphi(x_1, x_2, \ldots, x_n) = \sum\limits_{k=1}^n a_k x_k</tex>. То есть, оператор <tex>\varphi</tex> можно представить как строку <tex>(a_1, a_2, \ldots, a_n)</tex>.
 +
 
 +
Рассмотрим <tex>\varphi'</tex>. Построим матрицу Якоби для производной. <tex>\varphi' = (\frac{\partial f}{\partial x_1}, \frac{\partial f}{\partial x_2}, \ldots, \frac{\partial f}{\partial x_n} )</tex>.
  
<tex> \varphi' = \varphi </tex>
+
Посчитаем первую координату производной <tex>\frac{\partial f}{\partial x_1} = \frac{\partial}{\partial x_1} \sum\limits_{k=1}^n a_k x_k = \sum\limits_{k=1}^n \frac{a_k \partial x_k}{x_1} = a_1 \frac{\partial x_1}{\partial x_1} = a_1</tex>. Мы получили полное благорастворение! Первая координата оператора и его производной совпали. Аналогично совпадают остальные координаты. Значит, <tex>\varphi = \varphi'</tex>.
  
<tex>g(t) = \varphi(\mathcal{F}(\overline{a} + t(\overline{b} - \overline{a})), \quad t \in [0, 1]</tex>
+
<tex>g(t) = \varphi(\mathcal{F}(\overline{a} + t(\overline{b} - \overline{a}))), \quad t \in [0, 1]</tex>
  
 
Так как шар {{---}} выпуклый, то всё корректно определено.  
 
Так как шар {{---}} выпуклый, то всё корректно определено.  
  
Значит, <tex>g</tex> на <tex>[0,1]</tex> удовлетворяет классической формуле Лагранжа конечных приращений : <tex>g(1) - g(0) = g'(\Theta), \quad \Theta \in (0,1)</tex>
+
Значит, <tex>g</tex> на <tex>[0,1]</tex> удовлетворяет классической формуле Лагранжа конечных приращений : <tex>g(1) - g(0) = g'(\theta), \quad \theta \in (0,1)</tex>
  
 
По построению, <tex>g(1) - g(0) = \varphi(\mathcal{F}(\overline{b})) - \varphi(\mathcal{F}(\overline{a})) = \varphi(\mathcal{F}(\overline{b}) - \mathcal{F}(\overline{a})) = \left|\left|\mathcal{F}(\overline{b}) - \mathcal{F}(\overline{a})\right|\right|</tex>
 
По построению, <tex>g(1) - g(0) = \varphi(\mathcal{F}(\overline{b})) - \varphi(\mathcal{F}(\overline{a})) = \varphi(\mathcal{F}(\overline{b}) - \mathcal{F}(\overline{a})) = \left|\left|\mathcal{F}(\overline{b}) - \mathcal{F}(\overline{a})\right|\right|</tex>
  
Тогда <tex>\left|\left|\mathcal{F}(\overline{b}) - \mathcal{F}(\overline{a}) \right|\right| = g'(\Theta)</tex>
+
Тогда <tex>\left|\left|\mathcal{F}(\overline{b}) - \mathcal{F}(\overline{a}) \right|\right| = g'(\theta)</tex>
  
 
По правилу дифференцирования сложной функции, <tex>g'(t) = \varphi'\mathcal{F}'(\overline{a}+t(\overline{b}-\overline{a}))(\overline{b}-\overline{a})</tex>
 
По правилу дифференцирования сложной функции, <tex>g'(t) = \varphi'\mathcal{F}'(\overline{a}+t(\overline{b}-\overline{a}))(\overline{b}-\overline{a})</tex>
  
<tex>||g'(t)||  \le ||\varphi'||\cdot ||\mathcal{F}'(\overline{a} + t(\overline{b} - \overline{a}))||\cdot ||\overline{b} - \overline{a}|| \le 1 \cdot M \cdot ||\overline{b}-\overline{a}||</tex>
+
<tex>|g'(t)|  \le \|\varphi'\|\cdot \|\mathcal{F}'(\overline{a} + t(\overline{b} - \overline{a}))\|\cdot \|\overline{b} - \overline{a}\| \le 1 \cdot M \cdot \|\overline{b}-\overline{a}\|</tex>
  
Подставляя это в формулу конечных приращений Лагранжа: <tex>g(1) - g(0) = g'(\Theta)</tex>, приходим к неравенству Лагранжа.
+
Подставляя это в формулу конечных приращений Лагранжа: <tex>g(1) - g(0) = g'(\theta)</tex>, приходим к неравенству Лагранжа.
 
}}
 
}}
 +
 +
== Достаточное условие дифференцируемости функций многих переменных ==
 +
 
Базируясь на соотношениях конечных приращений, установим достаточное условие для дифференцируемости функций многих переменных.
 
Базируясь на соотношениях конечных приращений, установим достаточное условие для дифференцируемости функций многих переменных.
 
{{Теорема
 
{{Теорема
 
|statement=
 
|statement=
Пусть <tex>V(a) \subset \mathbb{R}^n</tex> <tex>y = f(x_1,...,x_n)</tex>, <tex>y : V \to \mathbb{R}</tex><br>
+
Пусть <tex>V(a) \subset \mathbb{R}^n</tex> <tex>y = f(x_1,...,x_n)</tex>, <tex>y : V \to \mathbb{R}</tex>
  
 
<tex>\forall x \in V: \ \exists \frac{\partial f}{\partial x_j}</tex>, каждая из которых, как функция <tex>n</tex> переменных, непрерывна в <tex>\overline{a} :\lim\limits_{\overline{x} \to \overline{a}}\frac{\partial f}{\partial x_j}(\overline{x})  
 
<tex>\forall x \in V: \ \exists \frac{\partial f}{\partial x_j}</tex>, каждая из которых, как функция <tex>n</tex> переменных, непрерывна в <tex>\overline{a} :\lim\limits_{\overline{x} \to \overline{a}}\frac{\partial f}{\partial x_j}(\overline{x})  
= \frac{\partial f}{\partial x_j}(\overline{a})</tex>.<br>
+
= \frac{\partial f}{\partial x_j}(\overline{a})</tex>.
  
 
Тогда существует дифференциал этой функции в точке <tex>a</tex>.
 
Тогда существует дифференциал этой функции в точке <tex>a</tex>.
Строка 203: Строка 267:
 
Для этого отрезка применим формулу Лагранжа конечных приращений, доказанную ранее :
 
Для этого отрезка применим формулу Лагранжа конечных приращений, доказанную ранее :
  
<tex dpi = "140">f(\overline{a} + \Delta\overline{a}) - f(\overline{a}) = \sum\limits_{j = 1}^{n}\frac{\partial f}{\partial x_j}(\overline{a} + \Theta\Delta a_j), \quad \Theta \in (0,1)</tex>
+
<tex dpi = "140">f(\overline{a} + \Delta\overline{a}) - f(\overline{a}) = \sum\limits_{j = 1}^{n}\frac{\partial f}{\partial x_j}(\overline{a} + \Theta \Delta\overline{a}) \Delta a_j, \ \Theta \in (0,1) </tex>
  
<tex dpi = "140">\frac{\partial f}{\partial x_j}(\overline{a} + \Theta\Delta\overline{a}) = \frac{\partial f}{\partial x_j}(\overline{a} + \alpha_j(\Delta\overline{a}))</tex>, все <tex>\alpha_j \to 0</tex> при <tex>\Delta\overline{a} \to 0</tex>
+
<tex dpi = "140">\frac{\partial f}{\partial x_j}(\overline{a} + \Theta \Delta\overline{a}) = \frac{\partial f}{\partial x_j}(\overline{a}) + \alpha_j(\Delta\overline{a})</tex>, все <tex>\alpha_j(\Delta \overline a) \to 0</tex> при <tex>\Delta\overline{a} \to 0</tex> - из непрерывности <tex> f' </tex>
  
<tex>f(\overline{a} + \Delta\overline{a}) - f(\overline{a}) = \sum\limits_{j = 1}^{n}\frac{\partial f}{\partial x_j}(\overline{x})\Delta a_j + \sum\limits_{j = 1}^{n}\alpha_j(\Delta \overline{a})\cdot\Delta a_j</tex>
+
<tex>f(\overline{a} + \Delta\overline{a}) - f(\overline{a}) = \sum\limits_{j = 1}^{n}\frac{\partial f}{\partial x_j}(\overline{a})\Delta a_j + \sum\limits_{j = 1}^{n}\alpha_j(\Delta \overline{a})\cdot\Delta a_j</tex>
  
 
Нужно доказать, что вторая сумма {{---}} <tex>o(\Delta a)</tex>, ибо первая сумма и есть формально записанный дифференциал. По неравенству Коши для сумм :
 
Нужно доказать, что вторая сумма {{---}} <tex>o(\Delta a)</tex>, ибо первая сумма и есть формально записанный дифференциал. По неравенству Коши для сумм :
  
<tex>\left|\sum\limits_{j = 1}^{n}\alpha_j(\Delta\overline{a})\cdot\Delta a_j\right| \le \sqrt{\sum\limits_{j = 1}^{n}\alpha_j^2(\Delta \overline{a})}||\Delta \overline{a}_j||</tex>
+
<tex>\left|\sum\limits_{j = 1}^{n}\alpha_j(\Delta\overline{a})\cdot\Delta a_j\right| \le \sqrt{\sum\limits_{j = 1}^{n}\alpha_j^2(\Delta \overline{a})}\|\Delta \overline{a}\|</tex>
  
 
Выражение под корнем стремится к нулю, таким образом, получаем требуемое.
 
Выражение под корнем стремится к нулю, таким образом, получаем требуемое.
 
}}
 
}}
  
 +
[[Линейные операторы в нормированных пространствах|<<]] [[Формула Тейлора для функций многих переменных|>>]]
 
[[Категория:Математический анализ 1 курс]]
 
[[Категория:Математический анализ 1 курс]]

Текущая версия на 19:22, 4 сентября 2022

<< >>

Производная Фреше

Определение:
Пусть [math]V_{r}(x)[/math] —шар в [math]X, \quad \mathcal{F} : V_r(x) \to Y [/math]. [math]\mathcal{F}[/math]дифференцируема в точке [math]x[/math], если существует зависящий от [math] x [/math] ограниченный линейный оператор [math]\mathcal{A} : X \to Y[/math], такой, что если [math]\left \| \Delta x \right \| \lt r[/math], [math](x + \Delta x) \in V_r(x)[/math], то:

[math] \mathcal{F}(x + \Delta x) - \mathcal{F}(x) = \mathcal{A}(\Delta x) + \alpha(\Delta x) \left \| \Delta x \right \| [/math], причем [math] \alpha(\Delta x) \rightarrow 0[/math] при [math]\Delta x \rightarrow 0[/math]

Тогда [math]\mathcal{A}(x) = \mathcal{F}'(x)[/math]производная Фреше отображения [math]\mathcal{F}[/math] в точке [math]x[/math].

При [math] X = Y = \mathbb{R} [/math] получаем определение дифференциала и производной функции одной переменной.

Установим теорему, обобщающую классическое правило дифференцирования сложной функции :

Теорема:
Композиция дифференцируемых отображений дифференцируема. Производная Фреше равна композиции производных Фреше отображений. Пусть [math]\mathcal{F} : V_r(x) \to Y, y = \mathcal{F}(x), \mathcal{G} : V_{r_1}(y) \to Z \quad \exists \mathcal{F}'(x), \mathcal{G}'(y), \mathcal{T} = \mathcal{G} \circ \mathcal{F}[/math], тогда [math]\exists \mathcal{T}'(x) = \mathcal{G}'(y)\mathcal{F}'(x)[/math]
Доказательство:
[math]\triangleright[/math]

Доказательство копирует классическое доказательство, с заменой знака модуля на знак нормы.

Вот же оно!

По определению дифференциала [math]\Delta z = g(y_0 + \Delta y) - g(y_0) = g'(y_0)\Delta y + o(\Delta y)[/math] и [math]\Delta y = f(x_0 + \Delta x) - f(x_0) = f'(x_0)\Delta x + o(\Delta x)[/math]

[math]g[/math] определена в окрестности точки [math]y_0[/math]. Так как [math]\Delta y \to 0[/math] при [math]\Delta x \to 0[/math] и [math]y_0 = f(x_0)[/math], то при [math]\Delta x \to 0[/math], [math]f(x_0 + \Delta x)[/math] принадлежит окрестности точки [math]y_0[/math].

Тогда функция [math]z = g(f(x))[/math] при [math]x = x_0 + \Delta x, \ \Delta x \to 0[/math] корректно определена.

[math]\Delta y = f(x_0 + \Delta x) - f(x_0)[/math]

[math]\Delta g = g(f(x_0) + (f(x_0 + \Delta x) - f(x_0))) - g(f(x_0)) = [/math] [math]g(f(x_0 + \Delta x)) - g(f(x_0)) = [/math] (по определению дифференциала для [math]g(y)[/math]) [math]g'(y_0)(f(x_0 + \Delta x) - f(x_0)) + o(\Delta y) =[/math] (по определению дифференциала для [math]f(x)[/math]) [math]g'(y_0)f'(x_0)\Delta x+ g'(y_0) o(\Delta x) + o(\Delta y)[/math]

Итого получаем: [math]\Delta g = g'(y_0)f'(x_0)\Delta x + g'(y_0)o(\Delta x) + o(\Delta y)[/math]

Устремляя [math]\Delta x \to 0[/math], получаем [math]dz = g'(y_0)f'(x_0)\Delta x[/math]

Для полного счастья осталось доказать, что [math]o(\Delta x) = o(\Delta y)[/math].

Утверждение:
[math]o(\Delta x) = o(\Delta y)[/math]
[math]\triangleright[/math]

По определению [math]o(\Delta y)[/math], получаем: [math]\forall \varepsilon \gt 0 \ \exists \delta \gt 0 : \ |\Delta y| \lt \delta \Rightarrow \left|\frac{o(\Delta y)}{\Delta y}\right| \leq \varepsilon[/math]

Последнее неравенство равносильно следующему: [math]|o(\Delta y)| \leq \varepsilon |\Delta y|[/math]

[math]\Delta y = f(x_0 + \Delta x) - f(x_0) = f'(x_0)\Delta x + o(\Delta x) = \Delta x(f'(x_0) + o(1)) [/math], где [math]o(1) = \frac{o(\Delta x)}{\Delta x}[/math], что стремится к [math]0[/math].

Из всего этого следует, что при [math]\Delta x \to 0[/math], [math]\Delta y \to 0[/math] для имеющегося [math]\delta \gt 0[/math].

Так как [math]f(x)[/math] — непрерывна, то существует [math]\delta_1 \gt 0: \ |\Delta x| \lt \delta_1 \Rightarrow |\Delta y| \lt \delta \Rightarrow |o(\Delta y)| \lt \varepsilon |\Delta y| = \varepsilon \Delta x |f'(x_0) + o(1)| [/math].

Тогда получаем, что

[math]\forall \varepsilon \gt 0 \ \exists \delta_1 \gt 0: \ |\Delta x| \lt \delta_1 \Rightarrow o(\Delta y) \leq M \varepsilon |\Delta x| \Rightarrow o(\Delta y) = o(\Delta x) [/math], где [math]M = |f'(x_0) + o(1)|[/math].
[math]\triangleleft[/math]
конец теоремы, далее следует продолжение конспекта про отображения в НП
[math]\triangleleft[/math]


Из дифференцируемости следует непрерывность :

[math]\left\| \mathcal{F}'(x)\Delta x |\right| \le \left\| \mathcal{F}'(x)|\right| \left\| \Delta x |\right|[/math].

Исходя из неравенства треугольника и определения производной,

[math] \| \mathcal{F}(x + \Delta x) - \mathcal{F}(x) \| = \| \mathcal{A}(\Delta x) + \alpha(\Delta x) \| \Delta x \|\| \le \| \mathcal{F}'(x) \| \|\Delta x \| + \| \alpha(\Delta x)\| \|\Delta x\|[/math]

Правая часть этого выражения стремится к нулю при [math] \Delta x \rightarrow 0 [/math], следовательно, [math]\mathcal{F}[/math] — непрерывна в точке [math] x [/math].

Найдем вид матрицы производной Фреше при [math]\mathcal{F} : V_r(x) \subset \mathbb{R}^n \to \mathbb{R}^m[/math]. Пусть [math]\mathcal{F}'(\overline{x}) = A[/math]

По условию [math]\mathcal{F}(\overline{x} + \Delta\overline{x}) - \mathcal{F}(\overline{x}) = \mathcal{F}'(\overline{x})\Delta\overline{x} + \alpha(\Delta\overline{x})\left\|\Delta\overline{x}|\right|[/math]

[math]\mathcal{F} = (\mathcal{F}_1,...,\mathcal{F}_n), \quad \mathcal{F}_i(\overline{x} + \Delta\overline{x}) - \mathcal{F}_i(\overline{x}) = \sum\limits_{j = 1}^{n}A_{ij} \Delta x_j + \alpha_i(\Delta\overline{x})\left\|\Delta\overline{x}|\right|[/math]

[math] \Delta x = h \cdot e_j = (0, 0,..,h,..,0), \quad \forall h \in \mathbb{R}[/math]

[math]\mathcal{F}_i(\overline{x} + h\overline{e_j}) - \mathcal{F}_i(\overline{x}) = A_{ij}h + \alpha_i(h\overline{e_j})|h|[/math]

[math]\frac{\mathcal{F}_i(\overline{x} + h\overline{e_j}) - \mathcal{F}_i(x)}{h} = A_{ij} + \alpha_i(h e_j) \frac{|h|}{h}[/math]

У дроби справа будет предел, т.к [math]\alpha_i(h e_j) \to 0[/math] при [math]h \to 0[/math] и [math]\left| \frac{|h|}{h} \right | \le 1[/math]

[math]A_{ij} = \lim\limits_{h \to 0} \frac{\mathcal{F}_i(\overline{x} + h\overline{e_j}) - \mathcal{F}_i(x)}{h}[/math]


Определение:
Данный предел называется частной производной первого порядка функции [math]\mathcal{F}_i[/math] по переменной [math]x_j[/math]. [math]A_{ij} = \lim\limits_{h \to 0} \frac{\mathcal{F}_i(\overline{x} + h\overline{e_j}) - \mathcal{F}_i(x)}{h} = \frac{\partial \mathcal{F}_i}{\partial x_j}[/math]


Определение:
Матрица, составленная из элементов [math]A_{ij}[/math]матрица Якоби отображения [math]\mathcal{F} \quad[/math] . [math] A = (\mathcal{F}'(x)) = \begin{pmatrix} \frac{\partial \mathcal{F}_1}{\partial x_1} & \frac{\partial \mathcal{F}_1}{\partial x_2} &\ldots&\frac{\partial \mathcal{F}_1}{\partial x_n}\\ \frac{\partial \mathcal{F}_2}{\partial x_1} & \frac{\partial \mathcal{F}_2}{\partial x_2} &\ldots&\frac{\partial \mathcal{F}_2}{\partial x_n}\\ \vdots&\vdots&\ddots&\vdots\\ \frac{\partial \mathcal{F}_m}{\partial x_1} & \frac{\partial \mathcal{F}_m}{\partial x_1} &\ldots&\frac{\partial \mathcal{F}_m}{\partial x_n} \end{pmatrix} [/math]


Определение:
При [math]n = m[/math] определитель этой матрицы — якобиан.

Пример : [math] \mathcal{F} : \mathbb{R}^2 \to \mathbb{R}^3 \quad \mathcal{F} = \left\{ \begin{aligned} y_1 &= x_1 + x_2 \\ y_2 &= x_1x_2 \\ y_3 &= x_1 - x_2 \end{aligned} \right. [/math]

[math] \mathcal{F}' = \begin{pmatrix} 1 & 1\\ x_2 & x_1 \\ 1 & -1 \end{pmatrix} [/math]

Дифференцирование композиции функций

Существование всех частных производных координатных функции отнюдь не гарантирует дифференцируемость [math]\mathcal{F}[/math]. Для указания достаточных условий предварительно рассмотрим один частный случай — дифференцирование композиций.

Пусть [math]f : \mathbb{R}^n \to \mathbb{R}[/math] —функция [math]n[/math] переменных, [math]y = f(x_1, x_2,...,x_n) [/math].

Пусть также [math]x_j = \varphi_j(t), \quad t \in \mathbb{R}[/math].

[math]y = g(t) = f(\varphi_1(t), \varphi_2(t),...,\varphi_n(t))[/math]

Пусть существует [math]f'(\overline{x}), \quad \varphi_j'(t)[/math]

[math] (f'(\overline{x})) = (\frac{\partial f}{\partial x_1}, \frac{\partial f}{\partial x_2},...,\frac{\partial f}{\partial x_n})[/math]

[math] (\overline{\varphi}(t)) = \begin{pmatrix} \varphi_1(t) \\ \varphi_2(t) \\ \dots \\ \varphi_n(t) \end{pmatrix} [/math]

[math] (\overline{\varphi'}(t)) = \begin{pmatrix} \varphi_{1}'(t) \\ \varphi_{2}'(t) \\ \dots \\ \varphi_{n}'(t) \\ \end{pmatrix} [/math]

[math](\mathcal{BA}) = (\mathcal{B})(\mathcal{A})[/math], поэтому:

[math]g'(t) = (f'(\overline{x}))(\overline{\varphi}'(t)) = \sum\limits_{j = 1}^{n} \frac{\partial f}{\partial x_j}(\overline{x})\cdot \varphi'_{j}(t)[/math].


Теперь, пусть [math]V[/math] — шар в [math]\mathbb{R}^n, \quad f : V \to \mathbb{R}[/math]. Пусть [math]\forall x \in V \quad f(x)[/math] — дифференцируема.

Так как шар — выпуклое множество, то для [math]\overline{a}, \overline{b} \in V[/math] выполняется [math] \forall t \in [0,1] \quad t\overline{a}+(1-t)\overline{b} \in V[/math];

[math]g(t) = f(t\overline{a}+(1-t)\overline{b}), \quad g'(t) = \sum\limits_{j = 1}^{n}(a_j - b_j)\frac{\partial f}{\partial x_j}(t\overline{a} + (1-t)\overline{b})[/math]

[math]\varphi_j(t) = ta_j + (1-t)b_j, \quad \varphi'_{j}(t) = a_j - b_j[/math]

[math]g[/math] —непрерывна на [math][0,1][/math] и дифференцируема на нем. Значит, к ней применима формула Лагранжа конечных приращений : [math]g(1) - g(0) = g'(\theta), \quad \theta \in [0,1][/math]

Заменяя [math]g[/math] и [math]g'[/math] по найденным формулам, получаем :

[math]f(\overline{a}) - f(\overline{b}) = \sum\limits_{j = 1}^{n}(a_j-b_j)\frac{\partial f}{\partial x_j}(\theta\overline{a} + (1-\theta)\overline{b}) = f'(\theta\overline{a}+(1-\theta)\overline{b})(\overline{a} -\overline{b})[/math]

Обобщение формулы Лагранжа конечных приращений

пусть [math]f[/math] —дифференцируема в [math]V[/math]. Тогда [math]\forall a, b \in V : f(\overline{a}) - f(\overline{b}) = f'(\theta\overline{a}+(1-\theta)\overline{b})(\overline{a}-\overline{b}),\quad \theta \in (0,1)[/math]

Для [math]\mathcal{F} : V \to \mathbb{R}^m, \quad V \in \mathbb{R}^n, m \gt 1[/math] —формула Лагранжа становится неверной. Невозможно подобрать [math]\Theta[/math], обслуживающее все координатные функции сразу.

[math]\mathcal{F} = (\mathcal{F}_1,...,\mathcal{F}_n)[/math]

[math]\mathcal{F}_i(\overline{a}) - \mathcal{F}_i(\overline{b}) = \mathcal{F}'_i(\theta_i\overline{a}+(1-\theta_i)\overline{b})(\overline{a}-\overline{b})[/math].

Для разных [math]i[/math] —разные [math]\theta_i[/math]. Впрочем, для отдельных координат формулу писать все равно можно. Однако формула Лагранжа допускает распространение и на абстрактную ситуацию, но в несколько другом виде.

Теорема (Неравенство Лагранжа):
Пусть [math]V[/math] — шар в [math]\mathbb{R}^n, \quad \mathcal{F} : V \to \mathbb{R}^m, \quad \mathcal{F}[/math] —дифференцируема в каждой точке шара, тогда:
[math]\forall \overline{a},\overline{b} \in V : \left|\left| \mathcal{F}(\overline{b}) - \mathcal{F}(\overline{a})\right|\right| \le M\left|\left|\overline{b}-\overline{a}\right|\right|[/math], где [math]M = \sup\limits_{x \in [\overline{a},\overline{b}]} \left|\left|\mathcal{F}'(\overline{x})\right|\right| [/math]
Доказательство:
[math]\triangleright[/math]

По доказанному ранее, для [math]\mathcal{F}(\overline{b}) - \mathcal{F}(\overline{a}) \in \mathbb{R}^m [/math] существует линейный непрерывный функционал [math]\varphi : \varphi(\mathcal{F}(\overline{a}) - \mathcal{F}(\overline{b})) = \left|\left|\mathcal{F}(\overline{a}) - \mathcal{F}(\overline{b})\right|\right|, \quad \|\varphi\| = 1[/math]

Докажем, что [math]\varphi = \varphi'[/math]. Так как [math]\varphi[/math] — линейный оператор, то [math]\varphi(\bar x) = \varphi(x_1, x_2, \ldots, x_n) = \sum\limits_{k=1}^n a_k x_k[/math]. То есть, оператор [math]\varphi[/math] можно представить как строку [math](a_1, a_2, \ldots, a_n)[/math].

Рассмотрим [math]\varphi'[/math]. Построим матрицу Якоби для производной. [math]\varphi' = (\frac{\partial f}{\partial x_1}, \frac{\partial f}{\partial x_2}, \ldots, \frac{\partial f}{\partial x_n} )[/math].

Посчитаем первую координату производной [math]\frac{\partial f}{\partial x_1} = \frac{\partial}{\partial x_1} \sum\limits_{k=1}^n a_k x_k = \sum\limits_{k=1}^n \frac{a_k \partial x_k}{x_1} = a_1 \frac{\partial x_1}{\partial x_1} = a_1[/math]. Мы получили полное благорастворение! Первая координата оператора и его производной совпали. Аналогично совпадают остальные координаты. Значит, [math]\varphi = \varphi'[/math].

[math]g(t) = \varphi(\mathcal{F}(\overline{a} + t(\overline{b} - \overline{a}))), \quad t \in [0, 1][/math]

Так как шар — выпуклый, то всё корректно определено.

Значит, [math]g[/math] на [math][0,1][/math] удовлетворяет классической формуле Лагранжа конечных приращений : [math]g(1) - g(0) = g'(\theta), \quad \theta \in (0,1)[/math]

По построению, [math]g(1) - g(0) = \varphi(\mathcal{F}(\overline{b})) - \varphi(\mathcal{F}(\overline{a})) = \varphi(\mathcal{F}(\overline{b}) - \mathcal{F}(\overline{a})) = \left|\left|\mathcal{F}(\overline{b}) - \mathcal{F}(\overline{a})\right|\right|[/math]

Тогда [math]\left|\left|\mathcal{F}(\overline{b}) - \mathcal{F}(\overline{a}) \right|\right| = g'(\theta)[/math]

По правилу дифференцирования сложной функции, [math]g'(t) = \varphi'\mathcal{F}'(\overline{a}+t(\overline{b}-\overline{a}))(\overline{b}-\overline{a})[/math]

[math]|g'(t)| \le \|\varphi'\|\cdot \|\mathcal{F}'(\overline{a} + t(\overline{b} - \overline{a}))\|\cdot \|\overline{b} - \overline{a}\| \le 1 \cdot M \cdot \|\overline{b}-\overline{a}\|[/math]

Подставляя это в формулу конечных приращений Лагранжа: [math]g(1) - g(0) = g'(\theta)[/math], приходим к неравенству Лагранжа.
[math]\triangleleft[/math]

Достаточное условие дифференцируемости функций многих переменных

Базируясь на соотношениях конечных приращений, установим достаточное условие для дифференцируемости функций многих переменных.

Теорема:
Пусть [math]V(a) \subset \mathbb{R}^n[/math] [math]y = f(x_1,...,x_n)[/math], [math]y : V \to \mathbb{R}[/math]

[math]\forall x \in V: \ \exists \frac{\partial f}{\partial x_j}[/math], каждая из которых, как функция [math]n[/math] переменных, непрерывна в [math]\overline{a} :\lim\limits_{\overline{x} \to \overline{a}}\frac{\partial f}{\partial x_j}(\overline{x}) = \frac{\partial f}{\partial x_j}(\overline{a})[/math].

Тогда существует дифференциал этой функции в точке [math]a[/math].
Доказательство:
[math]\triangleright[/math]

Рассмотрим [math]\overline{a}, \quad \overline{a} + \Delta\overline{a} \in V(\overline{a})[/math]

[math]\overline{x}(t) = \overline{a} + \Delta\overline{a}t, \quad t \in [0, 1], \quad \overline{x}(t) \in V[/math]

Для этого отрезка применим формулу Лагранжа конечных приращений, доказанную ранее :

[math]f(\overline{a} + \Delta\overline{a}) - f(\overline{a}) = \sum\limits_{j = 1}^{n}\frac{\partial f}{\partial x_j}(\overline{a} + \Theta \Delta\overline{a}) \Delta a_j, \ \Theta \in (0,1) [/math]

[math]\frac{\partial f}{\partial x_j}(\overline{a} + \Theta \Delta\overline{a}) = \frac{\partial f}{\partial x_j}(\overline{a}) + \alpha_j(\Delta\overline{a})[/math], все [math]\alpha_j(\Delta \overline a) \to 0[/math] при [math]\Delta\overline{a} \to 0[/math] - из непрерывности [math] f' [/math]

[math]f(\overline{a} + \Delta\overline{a}) - f(\overline{a}) = \sum\limits_{j = 1}^{n}\frac{\partial f}{\partial x_j}(\overline{a})\Delta a_j + \sum\limits_{j = 1}^{n}\alpha_j(\Delta \overline{a})\cdot\Delta a_j[/math]

Нужно доказать, что вторая сумма — [math]o(\Delta a)[/math], ибо первая сумма и есть формально записанный дифференциал. По неравенству Коши для сумм :

[math]\left|\sum\limits_{j = 1}^{n}\alpha_j(\Delta\overline{a})\cdot\Delta a_j\right| \le \sqrt{\sum\limits_{j = 1}^{n}\alpha_j^2(\Delta \overline{a})}\|\Delta \overline{a}\|[/math]

Выражение под корнем стремится к нулю, таким образом, получаем требуемое.
[math]\triangleleft[/math]

<< >>