Безусловный экстремум функции многих переменных — различия между версиями

Материал из Викиконспекты
Перейти к: навигация, поиск
м
м (запилил совсем)
Строка 1: Строка 1:
 
<wikitex>
 
<wikitex>
  
Считаем что $ \forall \frac{\partial f}{\partial x_j} \in C^0 $
+
Считаем что $ \forall \frac{\partial f}{\partial x_j} \in C^0 $(непрерывная)
 +
 
 
$ y = f(x_1, x_2, \dots, x_n) $ в $ V(\overline{a}) \in R^n $
 
$ y = f(x_1, x_2, \dots, x_n) $ в $ V(\overline{a}) \in R^n $
  
Если $ \| \Delta \overline{a} \| \le \delta, \quad \delta \approx 0 \Rightarrow f(\overline{a} + \Delta \overline{a}) \le f(\overline{a}) $
+
Если $ \| \Delta \overline{a} \| \le \delta, \quad \delta \approx 0 \Rightarrow f(\overline{a} + \Delta \overline{a}) \le f(\overline{a}) $ , то $ a $ - точка локального максимума. Аналогично, точка локального минимума.
, то $ a $ - точка локального максимума. Аналогично, точка локального минимума.
 
 
 
Мгновенно получается аналог теоремы Ферма:
 
 
 
Существует f, дифференциируемая в точке a, которая - локальный экстремум.
 
Тогда $ \forall j = 1..n $ все $ \frac{\partial{f}}{\partial{x_j}} \overline{a} = 0 $
 
  
 +
{{Теорема
 +
|about = Аналог теоремы Ферма
 +
|statement =
 +
Существует f, дифференциируемая в точке a, которая - локальный экстремум, тогда $ \forall j = 1..n $ все $ \frac{\partial{f}}{\partial{x_j}} \overline{a} = 0 $
 +
|proof =
 
$ f(\overline{a} + \Delta \overline{a}) - f(\overline{a}) =
 
$ f(\overline{a} + \Delta \overline{a}) - f(\overline{a}) =
 
\sum\limits_{j = 1}^{n} \frac{\partial f}{\partial x_j}(\overline{a}) \Delta a_j + o(\Delta \overline{a}) $
 
\sum\limits_{j = 1}^{n} \frac{\partial f}{\partial x_j}(\overline{a}) \Delta a_j + o(\Delta \overline{a}) $
Строка 19: Строка 19:
 
= \frac{\partial f}{\partial x_j}(\overline{a}) + \frac{o(h \overline{e_j})}{h} $ - стремится к 0 при h стремящемся к 0
 
= \frac{\partial f}{\partial x_j}(\overline{a}) + \frac{o(h \overline{e_j})}{h} $ - стремится к 0 при h стремящемся к 0
  
Поэтому предел слева имеет разные знаки в зависимости от стремления к нулю(справа или слева), но по единственности предела:
+
Поэтому предел слева имеет разные знаки в зависимости от стремления к нулю(справа или слева), но по единственности предела: $ \frac{\partial f}{\partial x_j} (\overline{a}) = 0 $
  
$ \frac{\partial f}{\partial x_j} (\overline{a}) = 0 $
+
Пусть $ y = f(\overline{x}) $, исследуем на экстремум $\overline{a} $.
 
 
$ y = f(\overline{x}) $, исследуем на экстремум $\overline{a} $.
 
  
 
Составляем систему:
 
Составляем систему:
Строка 37: Строка 35:
 
= \frac12 \sum\limits_{i,j = 1}^n \frac{\partial^2 f}{\partial x_i \partial x_j } (\overline{a} + \theta \Delta \overline{a}) \Delta a_i \Delta a_j $
 
= \frac12 \sum\limits_{i,j = 1}^n \frac{\partial^2 f}{\partial x_i \partial x_j } (\overline{a} + \theta \Delta \overline{a}) \Delta a_i \Delta a_j $
  
Записывая $ \frac{\partial^2 f}{\partial x_i  \partial x_j } (\overline{a} + \theta \Delta \overline{a}) $
+
Записывая $ \frac{\partial^2 f}{\partial x_i  \partial x_j } (\overline{a} + \theta \Delta \overline{a}) $ как $A_{ij} + \alpha_{ij} $, если $ A_{ij} = \frac{\partial^2 f}{\partial x_i  \partial x_j } \overline{a} $:
как $A_{ij} + \alpha_{ij} $, если $ A_{ij} = \frac{\partial^2 f}{\partial x_i  \partial x_j } \overline{a} $:
 
  
 
$ \Delta f(\overline{a}, \Delta \overline{a})
 
$ \Delta f(\overline{a}, \Delta \overline{a})
Строка 45: Строка 42:
 
$ \xi_i = \frac{\Delta a_i}{\| \Delta \overline{a} \|} $, приходим к записи:
 
$ \xi_i = \frac{\Delta a_i}{\| \Delta \overline{a} \|} $, приходим к записи:
 
$ \Delta f(\overline{a}, \Delta \overline{a})
 
$ \Delta f(\overline{a}, \Delta \overline{a})
= \frac12 {\| \Delta \overline{a} \|}^2 \left( \sum\limits_{i,j = 1}^{n} A_{ij} \Delta \xi_i \Delta \xi_j +\sum\limits_{i,j = 1}^{n} \alpha_{ij} \Delta \xi_i \Delta \xi_j \right) $
+
= \frac12 {\| \Delta \overline{a} \|}^2 \left( \sum\limits_{i,j = 1}^{n} A_{ij} \Delta \xi_i \Delta \xi_j +\sum\limits_{i,j = 1}^{n} \alpha_{ij} \Delta \xi_i \Delta \xi_j \right) $ (*)
  
Обращаем внимание, что $ \sum\limits_{i = 1}^{n} \xi_i^2 = 1 $, то
+
Обращаем внимание, что $ \sum\limits_{i = 1}^{n} \xi_i^2 = 1 $, то есть $ \xi = (\xi_1, \dots ,\xi_n) \in \delta_n $ - ограниченное замкнутое множество, а, значит, компакто в $ R^n $.
есть $ \xi = (\xi_1, \dots ,\xi_n) \in \delta_n $ - ограниченное замкнутое множество, а, значит, компакто в $ R^n $.
 
  
 
Так как все частные производные непрерывны, то все $ \alpha_{ij} $ стремятся к 0, если $ \Delta a $  стремится к 0.
 
Так как все частные производные непрерывны, то все $ \alpha_{ij} $ стремятся к 0, если $ \Delta a $  стремится к 0.
 +
  
 
Воспользуемся тем, что квадратичные формы можно классифицировать по знаку их значений.
 
Воспользуемся тем, что квадратичные формы можно классифицировать по знаку их значений.
Форма является строго положительно определенной, если при $ \xi_i \ne 0 $ знак суммы $ A_{ij} \xi_i \xi_j > 0 $.
+
Форма является строго положительно определенной, если при $ \xi_i \ne 0 $ знак суммы $ A_{ij} \xi_i \xi_j > 0 $ (например, $ \xi_1^2 + \dots + \xi_n^2 $ ).
  
Классический пример: $ \xi_1^2 + \dots + \xi_n^2 $.
+
Будем считать, что интересующая нас форма именно такая. Но на $ \delta_n $ она - непрерывная функция, а координаты на сфере все не равны нулю.
 
 
Будем считать, что интересующая форма именно такая. Но на $ \delta_n $ она - непрерывная функция,
 
а координаты на сфере все не равны нулю.
 
  
 
По теореме Вейерштрасса форма принимает минимальное значение $ m > 0 $.
 
По теореме Вейерштрасса форма принимает минимальное значение $ m > 0 $.
Строка 64: Строка 58:
 
Вывод: $ \forall \overline{\xi} \in \delta_n \Rightarrow \sum\limits_{i,j = 1}^{n} \alpha_{ij} \xi_i \xi_j $, где $ \alpha_{ij} $ - стремится к 0, а $\xi_i, \xi_j $ - ограничены - приходим к выводу что сумма стремится к нулю.
 
Вывод: $ \forall \overline{\xi} \in \delta_n \Rightarrow \sum\limits_{i,j = 1}^{n} \alpha_{ij} \xi_i \xi_j $, где $ \alpha_{ij} $ - стремится к 0, а $\xi_i, \xi_j $ - ограничены - приходим к выводу что сумма стремится к нулю.
  
Значит: ф
+
Значит: $ \exists \delta > 0 : \| \Delta \overline{a} \| < \delta \Rightarrow \sum \alpha_{ij} \xi_i \xi_j > -\frac12 m  $
 +
 
 +
При таких $ \Delta \overline{a} $ : $ \sum A_{ij} \xi_i \xi_j + \sum \alpha_{ij} \xi_i \xi_j> \frac12 m > 0 $
 +
 
 +
Используя все в соотношении(*), получаем, что
 +
$ \Delta f(\overline{a}, \Delta \overline{a}) > \frac14 m {\|\Delta \overline{a} \|}^2 > 0 \Rightarrow \overline{a} $ - точка локального минимума.
 +
 
 +
В результате: если $ df(\overline{a}) = 0$ , а $ d^2 f(\overline{a}, \Delta \overline{a}) $, как квадратичная форма строго положительно определенная, то a - точка локального минимума.
 +
}}
 +
 
 +
 
 +
Аналогично, если квадратичеая форма строго отрицательно определена, то a - точка локального максимума.
 +
 
 +
Той же техникой показывают, что если $d^2f(\overline{a}, \Delta \overline{a})$ незнакоопредленная, то в точке a в ней локального экстремума нет.
 +
 
 +
Остается ситуация: $ d^2 f(\overline{a}, \Delta \overline{a}) \ge 0 $ или $ \le 0 $ (нестрого знакоопределенная) - тогда проблема требует дополнительного исследования.
  
 
</wikitex>
 
</wikitex>

Версия 05:05, 2 июня 2011

<wikitex>

Считаем что $ \forall \frac{\partial f}{\partial x_j} \in C^0 $(непрерывная)

$ y = f(x_1, x_2, \dots, x_n) $ в $ V(\overline{a}) \in R^n $

Если $ \| \Delta \overline{a} \| \le \delta, \quad \delta \approx 0 \Rightarrow f(\overline{a} + \Delta \overline{a}) \le f(\overline{a}) $ , то $ a $ - точка локального максимума. Аналогично, точка локального минимума.

Теорема (Аналог теоремы Ферма):
Существует f, дифференциируемая в точке a, которая - локальный экстремум, тогда $ \forall j = 1..n $ все $ \frac{\partial{f
{\partial{x_j}} \overline{a} = 0 $

|proof = $ f(\overline{a} + \Delta \overline{a}) - f(\overline{a}) = \sum\limits_{j = 1}^{n} \frac{\partial f}{\partial x_j}(\overline{a}) \Delta a_j + o(\Delta \overline{a}) $

$ \Delta \overline{a} = h \overline{e_j} \quad $ : (сохраняет знак из-за экстремальности точки a) $ \quad \frac{f(\overline{a} + h \overline{e_j}) - f(\overline{a})}{h} = \frac{\partial f}{\partial x_j}(\overline{a}) + \frac{o(h \overline{e_j})}{h} $ - стремится к 0 при h стремящемся к 0

Поэтому предел слева имеет разные знаки в зависимости от стремления к нулю(справа или слева), но по единственности предела: $ \frac{\partial f}{\partial x_j} (\overline{a}) = 0 $

Пусть $ y = f(\overline{x}) $, исследуем на экстремум $\overline{a} $.

Составляем систему:

$ \begin{cases} \frac{\partial f}{\partial x_1} \overline{a} = 0\\

               \dots\\
               \frac{\partial f}{\partial x_n} \overline{a} = 0
 \end{cases} $

Решения - стационаоные точки, включают в сеья экстремальные. Если a - стационарна - то по формуле Тейлора: $ f(\overline{a} + \Delta \overline{a}) - f(\overline{a}) = \frac12 \sum\limits_{i,j = 1}^n \frac{\partial^2 f}{\partial x_i \partial x_j } (\overline{a} + \theta \Delta \overline{a}) \Delta a_i \Delta a_j $

Записывая $ \frac{\partial^2 f}{\partial x_i \partial x_j } (\overline{a} + \theta \Delta \overline{a}) $ как $A_{ij} + \alpha_{ij} $, если $ A_{ij} = \frac{\partial^2 f}{\partial x_i \partial x_j } \overline{a} $:

$ \Delta f(\overline{a}, \Delta \overline{a}) = \frac12 \sum\limits_{i,j = 1}^{n} A_{ij} \Delta a_i \Delta a_j +\frac12 \sum\limits_{i,j = 1}^{n} \alpha_{ij} \Delta a_i \Delta a_j $

$ \xi_i = \frac{\Delta a_i}{\| \Delta \overline{a} \|} $, приходим к записи: $ \Delta f(\overline{a}, \Delta \overline{a}) = \frac12 {\| \Delta \overline{a} \|}^2 \left( \sum\limits_{i,j = 1}^{n} A_{ij} \Delta \xi_i \Delta \xi_j +\sum\limits_{i,j = 1}^{n} \alpha_{ij} \Delta \xi_i \Delta \xi_j \right) $ (*)

Обращаем внимание, что $ \sum\limits_{i = 1}^{n} \xi_i^2 = 1 $, то есть $ \xi = (\xi_1, \dots ,\xi_n) \in \delta_n $ - ограниченное замкнутое множество, а, значит, компакто в $ R^n $.

Так как все частные производные непрерывны, то все $ \alpha_{ij} $ стремятся к 0, если $ \Delta a $ стремится к 0.


Воспользуемся тем, что квадратичные формы можно классифицировать по знаку их значений. Форма является строго положительно определенной, если при $ \xi_i \ne 0 $ знак суммы $ A_{ij} \xi_i \xi_j > 0 $ (например, $ \xi_1^2 + \dots + \xi_n^2 $ ).

Будем считать, что интересующая нас форма именно такая. Но на $ \delta_n $ она - непрерывная функция, а координаты на сфере все не равны нулю.

По теореме Вейерштрасса форма принимает минимальное значение $ m > 0 $.

Вывод: $ \forall \overline{\xi} \in \delta_n \Rightarrow \sum\limits_{i,j = 1}^{n} \alpha_{ij} \xi_i \xi_j $, где $ \alpha_{ij} $ - стремится к 0, а $\xi_i, \xi_j $ - ограничены - приходим к выводу что сумма стремится к нулю.

Значит: $ \exists \delta > 0 : \| \Delta \overline{a} \| < \delta \Rightarrow \sum \alpha_{ij} \xi_i \xi_j > -\frac12 m $

При таких $ \Delta \overline{a} $ : $ \sum A_{ij} \xi_i \xi_j + \sum \alpha_{ij} \xi_i \xi_j> \frac12 m > 0 $

Используя все в соотношении(*), получаем, что $ \Delta f(\overline{a}, \Delta \overline{a}) > \frac14 m {\|\Delta \overline{a} \|}^2 > 0 \Rightarrow \overline{a} $ - точка локального минимума.

В результате: если $ df(\overline{a}) = 0$ , а $ d^2 f(\overline{a}, \Delta \overline{a}) $, как квадратичная форма строго положительно определенная, то a - точка локального минимума. }}


Аналогично, если квадратичеая форма строго отрицательно определена, то a - точка локального максимума.

Той же техникой показывают, что если $d^2f(\overline{a}, \Delta \overline{a})$ незнакоопредленная, то в точке a в ней локального экстремума нет.

Остается ситуация: $ d^2 f(\overline{a}, \Delta \overline{a}) \ge 0 $ или $ \le 0 $ (нестрого знакоопределенная) - тогда проблема требует дополнительного исследования.

</wikitex>