Безусловный экстремум функции многих переменных

Материал из Викиконспекты
Перейти к: навигация, поиск

Так же, как и ранее, считаем, что все частные производные исследуемой функции непрерывны.


Определение:
Пусть задан линейный функционал [math]y = f(x_1, x_2, \dots, x_n) [/math] на [math] V(\overline{a}) \subset R^n [/math]. Если при [math]\| \Delta \overline{a} \| \le \delta[/math], [math]\delta \approx 0 \Rightarrow f(\overline{a} + \Delta \overline{a}) \le f(\overline{a})[/math], то [math]a[/math]точка локального максимума. Аналогично определяется точка локального минимума.


Теорема (Аналог теоремы Ферма):
Пусть [math]f[/math] дифференцируема в точке локального экстремума [math]a[/math]. Тогда [math]\forall j = 1..n : \frac{\partial{f}}{\partial{x_j}} \overline{a} = 0[/math]
Доказательство:
[math]\triangleright[/math]

[math]f(\overline{a} + \Delta \overline{a}) - f(\overline{a})[/math] [math]=\sum\limits_{j = 1}^{n} \frac{\partial f}{\partial x_j}(\overline{a}) \Delta a_j + o(\Delta \overline{a})[/math]

Пусть [math]\Delta \overline{a} = h \overline{e_j}[/math], где [math] \overline{e_j} [/math] - базисный вектор.

Тогда [math]\frac{f(\overline{a} + h \overline{e_j}) - f(\overline{a})}{h}[/math] [math]= \frac{\partial f}{\partial x_j}(\overline{a}) + \frac{o(h \overline{e_j})}{h}[/math]

Последнее слагаемое стремится к 0 при [math]h[/math] стремящемся к 0.

Числитель дроби в левой части сохраняет знак из-за экстремальности точки [math]a[/math], поэтому предел дроби имеет разные знаки в зависимости от стремления к нулю(справа или слева), но по единственности предела: [math]\frac{\partial f}{\partial x_j} (\overline{a}) = 0[/math].
[math]\triangleleft[/math]

Пусть [math]y = f(\overline{x})[/math], исследуем на экстремум в [math]\overline{a}[/math].

Составляем систему:

[math]\begin{cases} \frac{\partial f}{\partial x_1} \overline{a} = 0\\ \dots\\ \frac{\partial f}{\partial x_n} \overline{a} = 0 \end{cases}[/math]

Решения — стационарные точки, включают в себя экстремальные. Если [math]a[/math] — стационарна, то по формуле Тейлора: [math]f(\overline{a} + \Delta \overline{a}) - f(\overline{a})[/math] [math]= \frac12 \sum\limits_{i,j = 1}^n \frac{\partial^2 f}{\partial x_i \partial x_j } (\overline{a} + \theta \Delta \overline{a}) \Delta a_i \Delta a_j[/math]

Записывая [math]\frac{\partial^2 f}{\partial x_i \partial x_j } (\overline{a} + \theta \Delta \overline{a})[/math] как [math]A_{ij} + \alpha_{ij}[/math], если [math]A_{ij} = \frac{\partial^2 f}{\partial x_i \partial x_j } \overline{a}[/math]:

[math]\Delta f(\overline{a}, \Delta \overline{a})[/math] [math]= \frac12 \sum\limits_{i,j = 1}^{n} A_{ij} \Delta a_i \Delta a_j +\frac12 \sum\limits_{i,j = 1}^{n} \alpha_{ij} \Delta a_i \Delta a_j[/math]

[math]\xi_i = \frac{\Delta a_i}{\| \Delta \overline{a} \|}[/math], приходим к записи: [math]\Delta f(\overline{a}, \Delta \overline{a})[/math] [math]= \frac12 {\| \Delta \overline{a} \|}^2 \left( \sum\limits_{i,j = 1}^{n} A_{ij} \Delta \xi_i \Delta \xi_j +\sum\limits_{i,j = 1}^{n} \alpha_{ij} \Delta \xi_i \Delta \xi_j \right)[/math](*)

Обращаем внимание, что [math]\sum\limits_{i = 1}^{n} \xi_i^2 = 1[/math], то есть [math]\xi = (\xi_1, \dots ,\xi_n) \in \delta_n [/math] — замкнутая сфера единичного радиуса, то есть ограниченное замкнутое множество, которое является компактом в [math]R^n[/math].

Так как все частные производные непрерывны, то все [math]\alpha_{ij}[/math] стремятся к 0, если [math]\Delta a[/math] стремится к 0.


Воспользуемся тем, что квадратичные формы можно классифицировать по знаку их значений. Форма является строго положительно определенной, если при [math]\xi_i \ne 0[/math] знак суммы [math]A_{ij} \xi_i \xi_j \gt 0[/math] (например,[math]\xi_1^2 + \dots + \xi_n^2[/math]).

Будем считать, что интересующая нас форма именно такая. Но на [math]\delta_n[/math] она — непрерывная функция, а координаты на сфере все координаты не могут быть равны нулю одновременно.

По теореме Вейерштрасса форма принимает минимальное значение [math]m \gt 0[/math].

Вывод: [math]\forall \overline{\xi} \in \delta_n \Rightarrow \sum\limits_{i,j = 1}^{n} \alpha_{ij} \xi_i \xi_j[/math], где [math]\alpha_{ij}[/math] стремится к 0, а [math]\xi_i, \xi_j[/math] ограничены. Приходим к выводу что сумма стремится к нулю.

Значит: [math]\exists \delta \gt 0 : \| \Delta \overline{a} \| \lt \delta \Rightarrow \sum \alpha_{ij} \xi_i \xi_j \gt -\frac12 m[/math]

При таких [math]\Delta \overline{a} : \sum A_{ij} \xi_i \xi_j + \sum \alpha_{ij} \xi_i \xi_j\gt \frac12 m \gt 0[/math]

Используя все в соотношении(*), получаем, что [math]\Delta f(\overline{a}, \Delta \overline{a}) \gt \frac14 m {\|\Delta \overline{a} \|}^2 \gt 0 \Rightarrow \overline{a}[/math] — точка локального минимума.

В результате: если [math]df(\overline{a}) = 0[/math], а [math]d^2 f(\overline{a}, \Delta \overline{a})[/math] как квадратичная форма строго положительно определенная, то [math]a[/math] — точка локального минимума.

Аналогично, если квадратичная форма строго отрицательно определена, то [math]a[/math] — точка локального максимума.

Той же техникой показывают, что если [math]d^2f(\overline{a}, \Delta \overline{a})[/math] незнакоопределённая, то в точке [math]a[/math] в ней локального экстремума нет.

Остается ситуация: [math]d^2 f(\overline{a}, \Delta \overline{a}) \ge 0[/math] или [math]\le 0[/math] (нестрого знакоопределённая) — тогда проблема требует дополнительного исследования.