Безусловный экстремум функции многих переменных — различия между версиями

Материал из Викиконспекты
Перейти к: навигация, поиск
м (наведение красоты)
м (rollbackEdits.php mass rollback)
 
(не показаны 4 промежуточные версии 4 участников)
Строка 1: Строка 1:
Считаем что <tex> \forall j : \frac{\partial f}{\partial x_j} \in C^0 </tex>(непрерывная)
+
[[Формула Тейлора для функций многих переменных|<<]] [[Локальная теорема о неявном отображении|>>]]
  
<tex>y = f(x_1, x_2, \dots, x_n) $ в $ V(\overline{a}) \subset R^n </tex>
+
Так же, как и ранее, считаем, что все частные производные исследуемой функции непрерывны.
  
Если <tex>\| \Delta \overline{a} \| \le \delta</tex>, <tex>\delta \approx 0 \Rightarrow f(\overline{a} + \Delta \overline{a}) \le f(\overline{a})</tex>, то <tex>a</tex> {{---}} точка локального максимума. Аналогично определяется точка локального минимума.
+
 
 +
{{Определение
 +
|definition=
 +
Пусть задан линейный функционал <tex>y = f(x_1, x_2, \dots, x_n) </tex> на <tex> V(\overline{a}) \subset R^n </tex>.
 +
Если при <tex>\| \Delta \overline{a} \| \le \delta</tex>, <tex>\delta \approx 0 \Rightarrow f(\overline{a} + \Delta \overline{a}) \le f(\overline{a})</tex>, то <tex>a</tex> {{---}} '''точка локального максимума'''. Аналогично определяется точка локального минимума.
 +
}}
  
 
{{Теорема
 
{{Теорема
|about=Аналог теоремы Ферма
+
|about=
 +
Аналог теоремы Ферма
 
|statement=
 
|statement=
 
Пусть <tex>f</tex> дифференцируема в точке локального экстремума <tex>a</tex>. Тогда <tex>\forall j = 1..n : \frac{\partial{f}}{\partial{x_j}} \overline{a} = 0</tex>
 
Пусть <tex>f</tex> дифференцируема в точке локального экстремума <tex>a</tex>. Тогда <tex>\forall j = 1..n : \frac{\partial{f}}{\partial{x_j}} \overline{a} = 0</tex>
Строка 13: Строка 19:
 
<tex>=\sum\limits_{j = 1}^{n} \frac{\partial f}{\partial x_j}(\overline{a}) \Delta a_j + o(\Delta \overline{a})</tex>
 
<tex>=\sum\limits_{j = 1}^{n} \frac{\partial f}{\partial x_j}(\overline{a}) \Delta a_j + o(\Delta \overline{a})</tex>
  
<tex>\Delta \overline{a} = h \overline{e_j} :</tex>  
+
Пусть <tex>\Delta \overline{a} = h \overline{e_j}</tex>, где <tex> \overline{e_j} </tex> - базисный вектор.
(сохраняет знак из-за экстремальности точки <tex>a</tex>) <tex>\frac{f(\overline{a} + h \overline{e_j}) - f(\overline{a})}{h}</tex>
+
 
<tex>= \frac{\partial f}{\partial x_j}(\overline{a}) + \frac{o(h \overline{e_j})}{h}</tex> {{---}} стремится к 0 при <tex>h</tex> стремящемся к 0.
+
Тогда <tex>\frac{f(\overline{a} + h \overline{e_j}) - f(\overline{a})}{h}</tex>
 +
<tex>= \frac{\partial f}{\partial x_j}(\overline{a}) + \frac{o(h \overline{e_j})}{h}</tex>  
  
Поэтому предел слева имеет разные знаки в зависимости от стремления к нулю(справа или слева), но по единственности предела: <tex>\frac{\partial f}{\partial x_j} (\overline{a}) = 0</tex>.
+
Последнее слагаемое стремится к 0 при <tex>h</tex> стремящемся к 0.
 +
Числитель дроби в левой части сохраняет знак из-за экстремальности точки <tex>a</tex>, поэтому предел дроби имеет разные знаки в зависимости от стремления к нулю(справа или слева), но по единственности предела: <tex>\frac{\partial f}{\partial x_j} (\overline{a}) = 0</tex>.
 +
}}
  
 
Пусть <tex>y = f(\overline{x})</tex>, исследуем на экстремум в <tex>\overline{a}</tex>.
 
Пусть <tex>y = f(\overline{x})</tex>, исследуем на экстремум в <tex>\overline{a}</tex>.
Строка 41: Строка 50:
 
<tex>\xi_i = \frac{\Delta a_i}{\| \Delta \overline{a} \|}</tex>, приходим к записи:
 
<tex>\xi_i = \frac{\Delta a_i}{\| \Delta \overline{a} \|}</tex>, приходим к записи:
 
<tex>\Delta f(\overline{a}, \Delta \overline{a})</tex>
 
<tex>\Delta f(\overline{a}, \Delta \overline{a})</tex>
<tex>= \frac12 {\| \Delta \overline{a} \|}^2 \left( \sum\limits_{i,j = 1}^{n} A_{ij} \Delta \xi_i \Delta \xi_j +\sum\limits_{i,j = 1}^{n} \alpha_{ij} \Delta \xi_i \Delta \xi_j \right)</tex>(*)
+
<tex>= \frac12 {\| \Delta \overline{a} \|}^2 \left( \sum\limits_{i,j = 1}^{n} A_{ij} \xi_i \xi_j +\sum\limits_{i,j = 1}^{n} \alpha_{ij} \xi_i \xi_j \right)</tex>(*)
  
Обращаем внимание, что <tex>\sum\limits_{i = 1}^{n} \xi_i^2 = 1</tex>, то есть <tex>\xi = (\xi_1, \dots ,\xi_n) \in \delta_n</tex> {{---}} ограниченное замкнутое множество, а, значит, компактно в <tex>R^n</tex>.
+
Обращаем внимание, что <tex>\sum\limits_{i = 1}^{n} \xi_i^2 = 1</tex>, то есть <tex>\xi = (\xi_1, \dots ,\xi_n) \in \delta_n </tex> {{---}} замкнутая сфера единичного радиуса, то есть ограниченное замкнутое множество, которое является компактом в <tex>\mathbb{R}^n</tex>.
  
 
Так как все частные производные непрерывны, то все <tex>\alpha_{ij}</tex> стремятся к 0, если <tex>\Delta a</tex> стремится к 0.
 
Так как все частные производные непрерывны, то все <tex>\alpha_{ij}</tex> стремятся к 0, если <tex>\Delta a</tex> стремится к 0.
Строка 49: Строка 58:
  
 
Воспользуемся тем, что квадратичные формы можно классифицировать по знаку их значений.
 
Воспользуемся тем, что квадратичные формы можно классифицировать по знаку их значений.
Форма является строго положительно определенной, если при <tex>\xi_i \ne 0</tex> знак суммы <tex>A_{ij} \xi_i \xi_j > 0</tex> (например,<tex>\xi_1^2 + \dots + \xi_n^2</tex>).
+
Форма является строго положительно определенной, если при <tex>\forall \bar \xi  \ne 0</tex> знак суммы <tex>A_{ij} \xi_i \xi_j > 0</tex> (например,<tex>\xi_1^2 + \dots + \xi_n^2</tex>).
  
Будем считать, что интересующая нас форма именно такая. Но на <tex>\delta_n</tex> она {{---}} непрерывная функция, а координаты на сфере все не равны нулю.
+
Будем считать, что интересующая нас форма именно такая. Но на <tex>\delta_n</tex> она {{---}} непрерывная функция, а координаты на сфере все координаты не могут быть равны нулю одновременно.
  
 
По теореме Вейерштрасса форма принимает минимальное значение <tex>m > 0</tex>.
 
По теореме Вейерштрасса форма принимает минимальное значение <tex>m > 0</tex>.
Строка 65: Строка 74:
  
 
В результате: если <tex>df(\overline{a}) = 0</tex>, а <tex>d^2 f(\overline{a}, \Delta \overline{a})</tex> как квадратичная форма строго положительно определенная, то <tex>a</tex> {{---}} точка локального минимума.
 
В результате: если <tex>df(\overline{a}) = 0</tex>, а <tex>d^2 f(\overline{a}, \Delta \overline{a})</tex> как квадратичная форма строго положительно определенная, то <tex>a</tex> {{---}} точка локального минимума.
}}
 
 
  
 
Аналогично, если квадратичная форма строго отрицательно определена, то <tex>a</tex> {{---}} точка локального максимума.
 
Аналогично, если квадратичная форма строго отрицательно определена, то <tex>a</tex> {{---}} точка локального максимума.
Строка 74: Строка 81:
 
Остается ситуация: <tex>d^2 f(\overline{a}, \Delta \overline{a}) \ge 0</tex> или <tex>\le 0</tex> (нестрого знакоопределённая) {{---}} тогда проблема требует дополнительного исследования.
 
Остается ситуация: <tex>d^2 f(\overline{a}, \Delta \overline{a}) \ge 0</tex> или <tex>\le 0</tex> (нестрого знакоопределённая) {{---}} тогда проблема требует дополнительного исследования.
  
 +
[[Формула Тейлора для функций многих переменных|<<]] [[Локальная теорема о неявном отображении|>>]]
 
[[Категория: Математический анализ 1 курс]]
 
[[Категория: Математический анализ 1 курс]]

Текущая версия на 19:22, 4 сентября 2022

<< >>

Так же, как и ранее, считаем, что все частные производные исследуемой функции непрерывны.


Определение:
Пусть задан линейный функционал [math]y = f(x_1, x_2, \dots, x_n) [/math] на [math] V(\overline{a}) \subset R^n [/math]. Если при [math]\| \Delta \overline{a} \| \le \delta[/math], [math]\delta \approx 0 \Rightarrow f(\overline{a} + \Delta \overline{a}) \le f(\overline{a})[/math], то [math]a[/math]точка локального максимума. Аналогично определяется точка локального минимума.


Теорема (Аналог теоремы Ферма):
Пусть [math]f[/math] дифференцируема в точке локального экстремума [math]a[/math]. Тогда [math]\forall j = 1..n : \frac{\partial{f}}{\partial{x_j}} \overline{a} = 0[/math]
Доказательство:
[math]\triangleright[/math]

[math]f(\overline{a} + \Delta \overline{a}) - f(\overline{a})[/math] [math]=\sum\limits_{j = 1}^{n} \frac{\partial f}{\partial x_j}(\overline{a}) \Delta a_j + o(\Delta \overline{a})[/math]

Пусть [math]\Delta \overline{a} = h \overline{e_j}[/math], где [math] \overline{e_j} [/math] - базисный вектор.

Тогда [math]\frac{f(\overline{a} + h \overline{e_j}) - f(\overline{a})}{h}[/math] [math]= \frac{\partial f}{\partial x_j}(\overline{a}) + \frac{o(h \overline{e_j})}{h}[/math]

Последнее слагаемое стремится к 0 при [math]h[/math] стремящемся к 0.

Числитель дроби в левой части сохраняет знак из-за экстремальности точки [math]a[/math], поэтому предел дроби имеет разные знаки в зависимости от стремления к нулю(справа или слева), но по единственности предела: [math]\frac{\partial f}{\partial x_j} (\overline{a}) = 0[/math].
[math]\triangleleft[/math]

Пусть [math]y = f(\overline{x})[/math], исследуем на экстремум в [math]\overline{a}[/math].

Составляем систему:

[math]\begin{cases} \frac{\partial f}{\partial x_1} \overline{a} = 0\\ \dots\\ \frac{\partial f}{\partial x_n} \overline{a} = 0 \end{cases}[/math]

Решения — стационарные точки, включают в себя экстремальные. Если [math]a[/math] — стационарна, то по формуле Тейлора: [math]f(\overline{a} + \Delta \overline{a}) - f(\overline{a})[/math] [math]= \frac12 \sum\limits_{i,j = 1}^n \frac{\partial^2 f}{\partial x_i \partial x_j } (\overline{a} + \theta \Delta \overline{a}) \Delta a_i \Delta a_j[/math]

Записывая [math]\frac{\partial^2 f}{\partial x_i \partial x_j } (\overline{a} + \theta \Delta \overline{a})[/math] как [math]A_{ij} + \alpha_{ij}[/math], если [math]A_{ij} = \frac{\partial^2 f}{\partial x_i \partial x_j } \overline{a}[/math]:

[math]\Delta f(\overline{a}, \Delta \overline{a})[/math] [math]= \frac12 \sum\limits_{i,j = 1}^{n} A_{ij} \Delta a_i \Delta a_j +\frac12 \sum\limits_{i,j = 1}^{n} \alpha_{ij} \Delta a_i \Delta a_j[/math]

[math]\xi_i = \frac{\Delta a_i}{\| \Delta \overline{a} \|}[/math], приходим к записи: [math]\Delta f(\overline{a}, \Delta \overline{a})[/math] [math]= \frac12 {\| \Delta \overline{a} \|}^2 \left( \sum\limits_{i,j = 1}^{n} A_{ij} \xi_i \xi_j +\sum\limits_{i,j = 1}^{n} \alpha_{ij} \xi_i \xi_j \right)[/math](*)

Обращаем внимание, что [math]\sum\limits_{i = 1}^{n} \xi_i^2 = 1[/math], то есть [math]\xi = (\xi_1, \dots ,\xi_n) \in \delta_n [/math] — замкнутая сфера единичного радиуса, то есть ограниченное замкнутое множество, которое является компактом в [math]\mathbb{R}^n[/math].

Так как все частные производные непрерывны, то все [math]\alpha_{ij}[/math] стремятся к 0, если [math]\Delta a[/math] стремится к 0.


Воспользуемся тем, что квадратичные формы можно классифицировать по знаку их значений. Форма является строго положительно определенной, если при [math]\forall \bar \xi \ne 0[/math] знак суммы [math]A_{ij} \xi_i \xi_j \gt 0[/math] (например,[math]\xi_1^2 + \dots + \xi_n^2[/math]).

Будем считать, что интересующая нас форма именно такая. Но на [math]\delta_n[/math] она — непрерывная функция, а координаты на сфере все координаты не могут быть равны нулю одновременно.

По теореме Вейерштрасса форма принимает минимальное значение [math]m \gt 0[/math].

Вывод: [math]\forall \overline{\xi} \in \delta_n \Rightarrow \sum\limits_{i,j = 1}^{n} \alpha_{ij} \xi_i \xi_j[/math], где [math]\alpha_{ij}[/math] стремится к 0, а [math]\xi_i, \xi_j[/math] ограничены. Приходим к выводу что сумма стремится к нулю.

Значит: [math]\exists \delta \gt 0 : \| \Delta \overline{a} \| \lt \delta \Rightarrow \sum \alpha_{ij} \xi_i \xi_j \gt -\frac12 m[/math]

При таких [math]\Delta \overline{a} : \sum A_{ij} \xi_i \xi_j + \sum \alpha_{ij} \xi_i \xi_j\gt \frac12 m \gt 0[/math]

Используя все в соотношении(*), получаем, что [math]\Delta f(\overline{a}, \Delta \overline{a}) \gt \frac14 m {\|\Delta \overline{a} \|}^2 \gt 0 \Rightarrow \overline{a}[/math] — точка локального минимума.

В результате: если [math]df(\overline{a}) = 0[/math], а [math]d^2 f(\overline{a}, \Delta \overline{a})[/math] как квадратичная форма строго положительно определенная, то [math]a[/math] — точка локального минимума.

Аналогично, если квадратичная форма строго отрицательно определена, то [math]a[/math] — точка локального максимума.

Той же техникой показывают, что если [math]d^2f(\overline{a}, \Delta \overline{a})[/math] незнакоопределённая, то в точке [math]a[/math] в ней локального экстремума нет.

Остается ситуация: [math]d^2 f(\overline{a}, \Delta \overline{a}) \ge 0[/math] или [math]\le 0[/math] (нестрого знакоопределённая) — тогда проблема требует дополнительного исследования.

<< >>