Так же, как и ранее, считаем, что все частные производные исследуемой функции непрерывны.
Определение: |
Пусть задан линейный функционал [math]y = f(x_1, x_2, \dots, x_n) [/math] на [math] V(\overline{a}) \subset R^n [/math].
Если при [math]\| \Delta \overline{a} \| \le \delta[/math], [math]\delta \approx 0 \Rightarrow f(\overline{a} + \Delta \overline{a}) \le f(\overline{a})[/math], то [math]a[/math] — точка локального максимума. Аналогично определяется точка локального минимума. |
Теорема (Аналог теоремы Ферма): |
Пусть [math]f[/math] дифференцируема в точке локального экстремума [math]a[/math]. Тогда [math]\forall j = 1..n : \frac{\partial{f}}{\partial{x_j}} \overline{a} = 0[/math] |
Доказательство: |
[math]\triangleright[/math] |
[math]f(\overline{a} + \Delta \overline{a}) - f(\overline{a})[/math]
[math]=\sum\limits_{j = 1}^{n} \frac{\partial f}{\partial x_j}(\overline{a}) \Delta a_j + o(\Delta \overline{a})[/math]
Пусть [math]\Delta \overline{a} = h \overline{e_j}[/math], где [math] \overline{e_j} [/math] - базисный вектор.
Тогда [math]\frac{f(\overline{a} + h \overline{e_j}) - f(\overline{a})}{h}[/math]
[math]= \frac{\partial f}{\partial x_j}(\overline{a}) + \frac{o(h \overline{e_j})}{h}[/math]
Последнее слагаемое стремится к 0 при [math]h[/math] стремящемся к 0.
Числитель дроби в левой части сохраняет знак из-за экстремальности точки [math]a[/math], поэтому предел дроби имеет разные знаки в зависимости от стремления к нулю(справа или слева), но по единственности предела: [math]\frac{\partial f}{\partial x_j} (\overline{a}) = 0[/math]. |
[math]\triangleleft[/math] |
Пусть [math]y = f(\overline{x})[/math], исследуем на экстремум в [math]\overline{a}[/math].
Составляем систему:
[math]\begin{cases}
\frac{\partial f}{\partial x_1} \overline{a} = 0\\
\dots\\
\frac{\partial f}{\partial x_n} \overline{a} = 0
\end{cases}[/math]
Решения — стационарные точки, включают в себя экстремальные.
Если [math]a[/math] — стационарна, то по формуле Тейлора:
[math]f(\overline{a} + \Delta \overline{a}) - f(\overline{a})[/math]
[math]= \frac12 \sum\limits_{i,j = 1}^n \frac{\partial^2 f}{\partial x_i \partial x_j } (\overline{a} + \theta \Delta \overline{a}) \Delta a_i \Delta a_j[/math]
Записывая [math]\frac{\partial^2 f}{\partial x_i \partial x_j } (\overline{a} + \theta \Delta \overline{a})[/math] как [math]A_{ij} + \alpha_{ij}[/math], если [math]A_{ij} = \frac{\partial^2 f}{\partial x_i \partial x_j } \overline{a}[/math]:
[math]\Delta f(\overline{a}, \Delta \overline{a})[/math]
[math]= \frac12 \sum\limits_{i,j = 1}^{n} A_{ij} \Delta a_i \Delta a_j +\frac12 \sum\limits_{i,j = 1}^{n} \alpha_{ij} \Delta a_i \Delta a_j[/math]
[math]\xi_i = \frac{\Delta a_i}{\| \Delta \overline{a} \|}[/math], приходим к записи:
[math]\Delta f(\overline{a}, \Delta \overline{a})[/math]
[math]= \frac12 {\| \Delta \overline{a} \|}^2 \left( \sum\limits_{i,j = 1}^{n} A_{ij} \Delta \xi_i \Delta \xi_j +\sum\limits_{i,j = 1}^{n} \alpha_{ij} \Delta \xi_i \Delta \xi_j \right)[/math](*)
Обращаем внимание, что [math]\sum\limits_{i = 1}^{n} \xi_i^2 = 1[/math], то есть [math]\xi = (\xi_1, \dots ,\xi_n) \in \delta_n [/math] — замкнутая сфера единичного радиуса, то есть ограниченное замкнутое множество, которое является компактом в [math]R^n[/math].
Так как все частные производные непрерывны, то все [math]\alpha_{ij}[/math] стремятся к 0, если [math]\Delta a[/math] стремится к 0.
Воспользуемся тем, что квадратичные формы можно классифицировать по знаку их значений.
Форма является строго положительно определенной, если при [math]\xi_i \ne 0[/math] знак суммы [math]A_{ij} \xi_i \xi_j \gt 0[/math] (например,[math]\xi_1^2 + \dots + \xi_n^2[/math]).
Будем считать, что интересующая нас форма именно такая. Но на [math]\delta_n[/math] она — непрерывная функция, а координаты на сфере все координаты не могут быть равны нулю одновременно.
По теореме Вейерштрасса форма принимает минимальное значение [math]m \gt 0[/math].
Вывод: [math]\forall \overline{\xi} \in \delta_n \Rightarrow \sum\limits_{i,j = 1}^{n} \alpha_{ij} \xi_i \xi_j[/math], где [math]\alpha_{ij}[/math] стремится к 0, а [math]\xi_i, \xi_j[/math] ограничены. Приходим к выводу что сумма стремится к нулю.
Значит: [math]\exists \delta \gt 0 : \| \Delta \overline{a} \| \lt \delta \Rightarrow \sum \alpha_{ij} \xi_i \xi_j \gt -\frac12 m[/math]
При таких [math]\Delta \overline{a} : \sum A_{ij} \xi_i \xi_j + \sum \alpha_{ij} \xi_i \xi_j\gt \frac12 m \gt 0[/math]
Используя все в соотношении(*), получаем, что
[math]\Delta f(\overline{a}, \Delta \overline{a}) \gt \frac14 m {\|\Delta \overline{a} \|}^2 \gt 0 \Rightarrow \overline{a}[/math] — точка локального минимума.
В результате: если [math]df(\overline{a}) = 0[/math], а [math]d^2 f(\overline{a}, \Delta \overline{a})[/math] как квадратичная форма строго положительно определенная, то [math]a[/math] — точка локального минимума.
Аналогично, если квадратичная форма строго отрицательно определена, то [math]a[/math] — точка локального максимума.
Той же техникой показывают, что если [math]d^2f(\overline{a}, \Delta \overline{a})[/math] незнакоопределённая, то в точке [math]a[/math] в ней локального экстремума нет.
Остается ситуация: [math]d^2 f(\overline{a}, \Delta \overline{a}) \ge 0[/math] или [math]\le 0[/math] (нестрого знакоопределённая) — тогда проблема требует дополнительного исследования.