Безусловный экстремум функции многих переменных — различия между версиями

Материал из Викиконспекты
Перейти к: навигация, поиск
м
 
(не показано 5 промежуточных версий 5 участников)
Строка 1: Строка 1:
<wikitex>
+
[[Формула Тейлора для функций многих переменных|<<]] [[Локальная теорема о неявном отображении|>>]]
  
Считаем что $ \forall \frac{\partial f}{\partial x_j} \in C^0 $(непрерывная)
+
Так же, как и ранее, считаем, что все частные производные исследуемой функции непрерывны.
  
$ y = f(x_1, x_2, \dots, x_n) $ в $ V(\overline{a}) \in R^n $
 
  
Если $ \| \Delta \overline{a} \| \le \delta, \quad \delta \approx 0 \Rightarrow f(\overline{a} + \Delta \overline{a}) \le f(\overline{a}) $ , то $ a $ - точка локального максимума. Аналогично, точка локального минимума.
+
{{Определение
 +
|definition=
 +
Пусть задан линейный функционал <tex>y = f(x_1, x_2, \dots, x_n) </tex> на <tex> V(\overline{a}) \subset R^n </tex>.
 +
Если при <tex>\| \Delta \overline{a} \| \le \delta</tex>, <tex>\delta \approx 0 \Rightarrow f(\overline{a} + \Delta \overline{a}) \le f(\overline{a})</tex>, то <tex>a</tex> {{---}} '''точка локального максимума'''. Аналогично определяется точка локального минимума.
 +
}}
  
 
{{Теорема
 
{{Теорема
|about = Аналог теоремы Ферма
+
|about=
|statement =
+
Аналог теоремы Ферма
Существует f, дифференциируемая в точке a, которая - локальный экстремум, тогда $ \forall j = 1..n $ все $ \frac{\partial{f}}{\partial{x_j}} \overline{a} = 0 $
+
|statement=
|proof =  
+
Пусть <tex>f</tex> дифференцируема в точке локального экстремума <tex>a</tex>. Тогда <tex>\forall j = 1..n : \frac{\partial{f}}{\partial{x_j}} \overline{a} = 0</tex>
$ f(\overline{a} + \Delta \overline{a}) - f(\overline{a}) =
+
|proof=  
\sum\limits_{j = 1}^{n} \frac{\partial f}{\partial x_j}(\overline{a}) \Delta a_j + o(\Delta \overline{a}) $
+
<tex>f(\overline{a} + \Delta \overline{a}) - f(\overline{a})</tex>
 +
<tex>=\sum\limits_{j = 1}^{n} \frac{\partial f}{\partial x_j}(\overline{a}) \Delta a_j + o(\Delta \overline{a})</tex>
  
$ \Delta \overline{a} = h \overline{e_j} \quad $ :
+
Пусть <tex>\Delta \overline{a} = h \overline{e_j}</tex>, где <tex> \overline{e_j} </tex> - базисный вектор.
(сохраняет знак из-за экстремальности точки a) $ \quad \frac{f(\overline{a} + h \overline{e_j}) - f(\overline{a})}{h}
 
= \frac{\partial f}{\partial x_j}(\overline{a}) + \frac{o(h \overline{e_j})}{h} $ - стремится к 0 при h стремящемся к 0
 
  
Поэтому предел слева имеет разные знаки в зависимости от стремления к нулю(справа или слева), но по единственности предела: $ \frac{\partial f}{\partial x_j} (\overline{a}) = 0 $
+
Тогда <tex>\frac{f(\overline{a} + h \overline{e_j}) - f(\overline{a})}{h}</tex>
 +
<tex>= \frac{\partial f}{\partial x_j}(\overline{a}) + \frac{o(h \overline{e_j})}{h}</tex>
  
Пусть $ y = f(\overline{x}) $, исследуем на экстремум $\overline{a} $.
+
Последнее слагаемое стремится к 0 при <tex>h</tex> стремящемся к 0.
 +
Числитель дроби в левой части сохраняет знак из-за экстремальности точки <tex>a</tex>, поэтому предел дроби имеет разные знаки в зависимости от стремления к нулю(справа или слева), но по единственности предела: <tex>\frac{\partial f}{\partial x_j} (\overline{a}) = 0</tex>.
 +
}}
 +
 
 +
Пусть <tex>y = f(\overline{x})</tex>, исследуем на экстремум в <tex>\overline{a}</tex>.
  
 
Составляем систему:
 
Составляем систему:
  
$ \begin{cases} \frac{\partial f}{\partial x_1} \overline{a} = 0\\
+
<tex>\begin{cases}  
                \dots\\
+
  \frac{\partial f}{\partial x_1} \overline{a} = 0\\
                \frac{\partial f}{\partial x_n} \overline{a} = 0
+
  \dots\\
  \end{cases} $
+
  \frac{\partial f}{\partial x_n} \overline{a} = 0
 +
\end{cases}</tex>
  
Решения - стационаоные точки, включают в сеья экстремальные.  
+
Решения {{---}} стационарные точки, включают в себя экстремальные.  
Если a - стационарна - то по формуле Тейлора:
+
Если <tex>a</tex> {{---}} стационарна, то по формуле Тейлора:
$ f(\overline{a} + \Delta \overline{a}) - f(\overline{a})
+
<tex>f(\overline{a} + \Delta \overline{a}) - f(\overline{a})</tex>
= \frac12 \sum\limits_{i,j = 1}^n \frac{\partial^2 f}{\partial x_i \partial x_j } (\overline{a} + \theta \Delta \overline{a}) \Delta a_i \Delta a_j $
+
<tex>= \frac12 \sum\limits_{i,j = 1}^n \frac{\partial^2 f}{\partial x_i \partial x_j } (\overline{a} + \theta \Delta \overline{a}) \Delta a_i \Delta a_j</tex>
  
Записывая $ \frac{\partial^2 f}{\partial x_i  \partial x_j } (\overline{a} + \theta \Delta \overline{a}) $ как $A_{ij} + \alpha_{ij} $, если $ A_{ij} = \frac{\partial^2 f}{\partial x_i  \partial x_j } \overline{a} $:
+
Записывая <tex>\frac{\partial^2 f}{\partial x_i  \partial x_j } (\overline{a} + \theta \Delta \overline{a})</tex> как <tex>A_{ij} + \alpha_{ij}</tex>, если <tex>A_{ij} = \frac{\partial^2 f}{\partial x_i  \partial x_j } \overline{a}</tex>:
  
$ \Delta f(\overline{a}, \Delta \overline{a})
+
<tex>\Delta f(\overline{a}, \Delta \overline{a})</tex>
= \frac12 \sum\limits_{i,j = 1}^{n} A_{ij} \Delta a_i \Delta a_j +\frac12 \sum\limits_{i,j = 1}^{n} \alpha_{ij} \Delta a_i \Delta a_j $
+
<tex>= \frac12 \sum\limits_{i,j = 1}^{n} A_{ij} \Delta a_i \Delta a_j +\frac12 \sum\limits_{i,j = 1}^{n} \alpha_{ij} \Delta a_i \Delta a_j</tex>
  
$ \xi_i = \frac{\Delta a_i}{\| \Delta \overline{a} \|} $, приходим к записи:
+
<tex>\xi_i = \frac{\Delta a_i}{\| \Delta \overline{a} \|}</tex>, приходим к записи:
$ \Delta f(\overline{a}, \Delta \overline{a})
+
<tex>\Delta f(\overline{a}, \Delta \overline{a})</tex>
= \frac12 {\| \Delta \overline{a} \|}^2 \left( \sum\limits_{i,j = 1}^{n} A_{ij} \Delta \xi_i \Delta \xi_j +\sum\limits_{i,j = 1}^{n} \alpha_{ij} \Delta \xi_i \Delta \xi_j \right) $ (*)
+
<tex>= \frac12 {\| \Delta \overline{a} \|}^2 \left( \sum\limits_{i,j = 1}^{n} A_{ij} \xi_i \xi_j +\sum\limits_{i,j = 1}^{n} \alpha_{ij} \xi_i \xi_j \right)</tex>(*)
  
Обращаем внимание, что $ \sum\limits_{i = 1}^{n} \xi_i^2 = 1 $, то есть $ \xi = (\xi_1, \dots ,\xi_n) \in \delta_n $ - ограниченное замкнутое множество, а, значит, компакто в $ R^n $.
+
Обращаем внимание, что <tex>\sum\limits_{i = 1}^{n} \xi_i^2 = 1</tex>, то есть <tex>\xi = (\xi_1, \dots ,\xi_n) \in \delta_n </tex> {{---}} замкнутая сфера единичного радиуса, то есть ограниченное замкнутое множество, которое является компактом в <tex>\mathbb{R}^n</tex>.
  
Так как все частные производные непрерывны, то все $ \alpha_{ij} $ стремятся к 0, если $ \Delta a стремится к 0.
+
Так как все частные производные непрерывны, то все <tex>\alpha_{ij}</tex> стремятся к 0, если <tex>\Delta a</tex> стремится к 0.
  
  
 
Воспользуемся тем, что квадратичные формы можно классифицировать по знаку их значений.
 
Воспользуемся тем, что квадратичные формы можно классифицировать по знаку их значений.
Форма является строго положительно определенной, если при $ \xi_i \ne 0 $ знак суммы $ A_{ij} \xi_i \xi_j > 0 $ (например, $ \xi_1^2 + \dots + \xi_n^2 $ ).
+
Форма является строго положительно определенной, если при <tex>\forall \bar \xi  \ne 0</tex> знак суммы <tex>A_{ij} \xi_i \xi_j > 0</tex> (например,<tex>\xi_1^2 + \dots + \xi_n^2</tex>).
  
Будем считать, что интересующая нас форма именно такая. Но на $ \delta_n $ она - непрерывная функция, а координаты на сфере все не равны нулю.
+
Будем считать, что интересующая нас форма именно такая. Но на <tex>\delta_n</tex> она {{---}} непрерывная функция, а координаты на сфере все координаты не могут быть равны нулю одновременно.
  
По теореме Вейерштрасса форма принимает минимальное значение $ m > 0 $.
+
По теореме Вейерштрасса форма принимает минимальное значение <tex>m > 0</tex>.
  
Вывод: $ \forall \overline{\xi} \in \delta_n \Rightarrow \sum\limits_{i,j = 1}^{n} \alpha_{ij} \xi_i \xi_j $, где $ \alpha_{ij} $ - стремится к 0, а $\xi_i, \xi_j $ - ограничены - приходим к выводу что сумма стремится к нулю.
+
Вывод: <tex>\forall \overline{\xi} \in \delta_n \Rightarrow \sum\limits_{i,j = 1}^{n} \alpha_{ij} \xi_i \xi_j</tex>, где <tex>\alpha_{ij}</tex> стремится к 0, а <tex>\xi_i, \xi_j</tex> ограничены. Приходим к выводу что сумма стремится к нулю.
  
Значит: $ \exists \delta > 0 : \| \Delta \overline{a} \| < \delta \Rightarrow \sum \alpha_{ij} \xi_i \xi_j > -\frac12 m $
+
Значит: <tex>\exists \delta > 0 : \| \Delta \overline{a} \| < \delta \Rightarrow \sum \alpha_{ij} \xi_i \xi_j > -\frac12 m</tex>
  
При таких $ \Delta \overline{a} $ : $ \sum A_{ij} \xi_i \xi_j + \sum \alpha_{ij} \xi_i \xi_j> \frac12 m > 0 $
+
При таких <tex>\Delta \overline{a} : \sum A_{ij} \xi_i \xi_j + \sum \alpha_{ij} \xi_i \xi_j> \frac12 m > 0</tex>
  
 
Используя все в соотношении(*), получаем, что
 
Используя все в соотношении(*), получаем, что
$ \Delta f(\overline{a}, \Delta \overline{a}) > \frac14 m {\|\Delta \overline{a} \|}^2 > 0 \Rightarrow \overline{a} $ - точка локального минимума.
+
<tex>\Delta f(\overline{a}, \Delta \overline{a}) > \frac14 m {\|\Delta \overline{a} \|}^2 > 0 \Rightarrow \overline{a}</tex> {{---}} точка локального минимума.
 
 
В результате: если $ df(\overline{a}) = 0$ , а $ d^2 f(\overline{a}, \Delta \overline{a}) $, как квадратичная форма строго положительно определенная, то a - точка локального минимума.
 
}}
 
  
 +
В результате: если <tex>df(\overline{a}) = 0</tex>, а <tex>d^2 f(\overline{a}, \Delta \overline{a})</tex> как квадратичная форма строго положительно определенная, то <tex>a</tex> {{---}} точка локального минимума.
  
Аналогично, если квадратичеая форма строго отрицательно определена, то a - точка локального максимума.
+
Аналогично, если квадратичная форма строго отрицательно определена, то <tex>a</tex> {{---}} точка локального максимума.
  
Той же техникой показывают, что если $d^2f(\overline{a}, \Delta \overline{a})$ незнакоопредленная, то в точке a в ней локального экстремума нет.
+
Той же техникой показывают, что если <tex>d^2f(\overline{a}, \Delta \overline{a})</tex> незнакоопределённая, то в точке <tex>a</tex> в ней локального экстремума нет.
  
Остается ситуация: $ d^2 f(\overline{a}, \Delta \overline{a}) \ge 0 $ или $ \le 0 $ (нестрого знакоопределенная) - тогда проблема требует дополнительного исследования.
+
Остается ситуация: <tex>d^2 f(\overline{a}, \Delta \overline{a}) \ge 0</tex> или <tex>\le 0</tex> (нестрого знакоопределённая) {{---}} тогда проблема требует дополнительного исследования.
  
</wikitex>
+
[[Формула Тейлора для функций многих переменных|<<]] [[Локальная теорема о неявном отображении|>>]]
 
[[Категория: Математический анализ 1 курс]]
 
[[Категория: Математический анализ 1 курс]]

Текущая версия на 01:15, 13 июня 2011

<< >>

Так же, как и ранее, считаем, что все частные производные исследуемой функции непрерывны.


Определение:
Пусть задан линейный функционал [math]y = f(x_1, x_2, \dots, x_n) [/math] на [math] V(\overline{a}) \subset R^n [/math]. Если при [math]\| \Delta \overline{a} \| \le \delta[/math], [math]\delta \approx 0 \Rightarrow f(\overline{a} + \Delta \overline{a}) \le f(\overline{a})[/math], то [math]a[/math]точка локального максимума. Аналогично определяется точка локального минимума.


Теорема (Аналог теоремы Ферма):
Пусть [math]f[/math] дифференцируема в точке локального экстремума [math]a[/math]. Тогда [math]\forall j = 1..n : \frac{\partial{f}}{\partial{x_j}} \overline{a} = 0[/math]
Доказательство:
[math]\triangleright[/math]

[math]f(\overline{a} + \Delta \overline{a}) - f(\overline{a})[/math] [math]=\sum\limits_{j = 1}^{n} \frac{\partial f}{\partial x_j}(\overline{a}) \Delta a_j + o(\Delta \overline{a})[/math]

Пусть [math]\Delta \overline{a} = h \overline{e_j}[/math], где [math] \overline{e_j} [/math] - базисный вектор.

Тогда [math]\frac{f(\overline{a} + h \overline{e_j}) - f(\overline{a})}{h}[/math] [math]= \frac{\partial f}{\partial x_j}(\overline{a}) + \frac{o(h \overline{e_j})}{h}[/math]

Последнее слагаемое стремится к 0 при [math]h[/math] стремящемся к 0.

Числитель дроби в левой части сохраняет знак из-за экстремальности точки [math]a[/math], поэтому предел дроби имеет разные знаки в зависимости от стремления к нулю(справа или слева), но по единственности предела: [math]\frac{\partial f}{\partial x_j} (\overline{a}) = 0[/math].
[math]\triangleleft[/math]

Пусть [math]y = f(\overline{x})[/math], исследуем на экстремум в [math]\overline{a}[/math].

Составляем систему:

[math]\begin{cases} \frac{\partial f}{\partial x_1} \overline{a} = 0\\ \dots\\ \frac{\partial f}{\partial x_n} \overline{a} = 0 \end{cases}[/math]

Решения — стационарные точки, включают в себя экстремальные. Если [math]a[/math] — стационарна, то по формуле Тейлора: [math]f(\overline{a} + \Delta \overline{a}) - f(\overline{a})[/math] [math]= \frac12 \sum\limits_{i,j = 1}^n \frac{\partial^2 f}{\partial x_i \partial x_j } (\overline{a} + \theta \Delta \overline{a}) \Delta a_i \Delta a_j[/math]

Записывая [math]\frac{\partial^2 f}{\partial x_i \partial x_j } (\overline{a} + \theta \Delta \overline{a})[/math] как [math]A_{ij} + \alpha_{ij}[/math], если [math]A_{ij} = \frac{\partial^2 f}{\partial x_i \partial x_j } \overline{a}[/math]:

[math]\Delta f(\overline{a}, \Delta \overline{a})[/math] [math]= \frac12 \sum\limits_{i,j = 1}^{n} A_{ij} \Delta a_i \Delta a_j +\frac12 \sum\limits_{i,j = 1}^{n} \alpha_{ij} \Delta a_i \Delta a_j[/math]

[math]\xi_i = \frac{\Delta a_i}{\| \Delta \overline{a} \|}[/math], приходим к записи: [math]\Delta f(\overline{a}, \Delta \overline{a})[/math] [math]= \frac12 {\| \Delta \overline{a} \|}^2 \left( \sum\limits_{i,j = 1}^{n} A_{ij} \xi_i \xi_j +\sum\limits_{i,j = 1}^{n} \alpha_{ij} \xi_i \xi_j \right)[/math](*)

Обращаем внимание, что [math]\sum\limits_{i = 1}^{n} \xi_i^2 = 1[/math], то есть [math]\xi = (\xi_1, \dots ,\xi_n) \in \delta_n [/math] — замкнутая сфера единичного радиуса, то есть ограниченное замкнутое множество, которое является компактом в [math]\mathbb{R}^n[/math].

Так как все частные производные непрерывны, то все [math]\alpha_{ij}[/math] стремятся к 0, если [math]\Delta a[/math] стремится к 0.


Воспользуемся тем, что квадратичные формы можно классифицировать по знаку их значений. Форма является строго положительно определенной, если при [math]\forall \bar \xi \ne 0[/math] знак суммы [math]A_{ij} \xi_i \xi_j \gt 0[/math] (например,[math]\xi_1^2 + \dots + \xi_n^2[/math]).

Будем считать, что интересующая нас форма именно такая. Но на [math]\delta_n[/math] она — непрерывная функция, а координаты на сфере все координаты не могут быть равны нулю одновременно.

По теореме Вейерштрасса форма принимает минимальное значение [math]m \gt 0[/math].

Вывод: [math]\forall \overline{\xi} \in \delta_n \Rightarrow \sum\limits_{i,j = 1}^{n} \alpha_{ij} \xi_i \xi_j[/math], где [math]\alpha_{ij}[/math] стремится к 0, а [math]\xi_i, \xi_j[/math] ограничены. Приходим к выводу что сумма стремится к нулю.

Значит: [math]\exists \delta \gt 0 : \| \Delta \overline{a} \| \lt \delta \Rightarrow \sum \alpha_{ij} \xi_i \xi_j \gt -\frac12 m[/math]

При таких [math]\Delta \overline{a} : \sum A_{ij} \xi_i \xi_j + \sum \alpha_{ij} \xi_i \xi_j\gt \frac12 m \gt 0[/math]

Используя все в соотношении(*), получаем, что [math]\Delta f(\overline{a}, \Delta \overline{a}) \gt \frac14 m {\|\Delta \overline{a} \|}^2 \gt 0 \Rightarrow \overline{a}[/math] — точка локального минимума.

В результате: если [math]df(\overline{a}) = 0[/math], а [math]d^2 f(\overline{a}, \Delta \overline{a})[/math] как квадратичная форма строго положительно определенная, то [math]a[/math] — точка локального минимума.

Аналогично, если квадратичная форма строго отрицательно определена, то [math]a[/math] — точка локального максимума.

Той же техникой показывают, что если [math]d^2f(\overline{a}, \Delta \overline{a})[/math] незнакоопределённая, то в точке [math]a[/math] в ней локального экстремума нет.

Остается ситуация: [math]d^2 f(\overline{a}, \Delta \overline{a}) \ge 0[/math] или [math]\le 0[/math] (нестрого знакоопределённая) — тогда проблема требует дополнительного исследования.

<< >>