Безусловный экстремум функции многих переменных — различия между версиями
м |
м (запилил совсем) |
||
Строка 1: | Строка 1: | ||
<wikitex> | <wikitex> | ||
− | Считаем что $ \forall \frac{\partial f}{\partial x_j} \in C^0 $ | + | Считаем что $ \forall \frac{\partial f}{\partial x_j} \in C^0 $(непрерывная) |
+ | |||
$ y = f(x_1, x_2, \dots, x_n) $ в $ V(\overline{a}) \in R^n $ | $ y = f(x_1, x_2, \dots, x_n) $ в $ V(\overline{a}) \in R^n $ | ||
− | Если $ \| \Delta \overline{a} \| \le \delta, \quad \delta \approx 0 \Rightarrow f(\overline{a} + \Delta \overline{a}) \le f(\overline{a}) $ | + | Если $ \| \Delta \overline{a} \| \le \delta, \quad \delta \approx 0 \Rightarrow f(\overline{a} + \Delta \overline{a}) \le f(\overline{a}) $ , то $ a $ - точка локального максимума. Аналогично, точка локального минимума. |
− | , то $ a $ - точка локального максимума. Аналогично, точка локального минимума. | ||
− | |||
− | |||
− | |||
− | |||
− | |||
+ | {{Теорема | ||
+ | |about = Аналог теоремы Ферма | ||
+ | |statement = | ||
+ | Существует f, дифференциируемая в точке a, которая - локальный экстремум, тогда $ \forall j = 1..n $ все $ \frac{\partial{f}}{\partial{x_j}} \overline{a} = 0 $ | ||
+ | |proof = | ||
$ f(\overline{a} + \Delta \overline{a}) - f(\overline{a}) = | $ f(\overline{a} + \Delta \overline{a}) - f(\overline{a}) = | ||
\sum\limits_{j = 1}^{n} \frac{\partial f}{\partial x_j}(\overline{a}) \Delta a_j + o(\Delta \overline{a}) $ | \sum\limits_{j = 1}^{n} \frac{\partial f}{\partial x_j}(\overline{a}) \Delta a_j + o(\Delta \overline{a}) $ | ||
Строка 19: | Строка 19: | ||
= \frac{\partial f}{\partial x_j}(\overline{a}) + \frac{o(h \overline{e_j})}{h} $ - стремится к 0 при h стремящемся к 0 | = \frac{\partial f}{\partial x_j}(\overline{a}) + \frac{o(h \overline{e_j})}{h} $ - стремится к 0 при h стремящемся к 0 | ||
− | Поэтому предел слева имеет разные знаки в зависимости от стремления к нулю(справа или слева), но по единственности предела: | + | Поэтому предел слева имеет разные знаки в зависимости от стремления к нулю(справа или слева), но по единственности предела: $ \frac{\partial f}{\partial x_j} (\overline{a}) = 0 $ |
− | + | Пусть $ y = f(\overline{x}) $, исследуем на экстремум $\overline{a} $. | |
− | |||
− | $ y = f(\overline{x}) $, исследуем на экстремум $\overline{a} $. | ||
Составляем систему: | Составляем систему: | ||
Строка 37: | Строка 35: | ||
= \frac12 \sum\limits_{i,j = 1}^n \frac{\partial^2 f}{\partial x_i \partial x_j } (\overline{a} + \theta \Delta \overline{a}) \Delta a_i \Delta a_j $ | = \frac12 \sum\limits_{i,j = 1}^n \frac{\partial^2 f}{\partial x_i \partial x_j } (\overline{a} + \theta \Delta \overline{a}) \Delta a_i \Delta a_j $ | ||
− | Записывая $ \frac{\partial^2 f}{\partial x_i \partial x_j } (\overline{a} + \theta \Delta \overline{a}) $ | + | Записывая $ \frac{\partial^2 f}{\partial x_i \partial x_j } (\overline{a} + \theta \Delta \overline{a}) $ как $A_{ij} + \alpha_{ij} $, если $ A_{ij} = \frac{\partial^2 f}{\partial x_i \partial x_j } \overline{a} $: |
− | как $A_{ij} + \alpha_{ij} $, если $ A_{ij} = \frac{\partial^2 f}{\partial x_i \partial x_j } \overline{a} $: | ||
$ \Delta f(\overline{a}, \Delta \overline{a}) | $ \Delta f(\overline{a}, \Delta \overline{a}) | ||
Строка 45: | Строка 42: | ||
$ \xi_i = \frac{\Delta a_i}{\| \Delta \overline{a} \|} $, приходим к записи: | $ \xi_i = \frac{\Delta a_i}{\| \Delta \overline{a} \|} $, приходим к записи: | ||
$ \Delta f(\overline{a}, \Delta \overline{a}) | $ \Delta f(\overline{a}, \Delta \overline{a}) | ||
− | = \frac12 {\| \Delta \overline{a} \|}^2 \left( \sum\limits_{i,j = 1}^{n} A_{ij} \Delta \xi_i \Delta \xi_j +\sum\limits_{i,j = 1}^{n} \alpha_{ij} \Delta \xi_i \Delta \xi_j \right) $ | + | = \frac12 {\| \Delta \overline{a} \|}^2 \left( \sum\limits_{i,j = 1}^{n} A_{ij} \Delta \xi_i \Delta \xi_j +\sum\limits_{i,j = 1}^{n} \alpha_{ij} \Delta \xi_i \Delta \xi_j \right) $ (*) |
− | Обращаем внимание, что $ \sum\limits_{i = 1}^{n} \xi_i^2 = 1 $, то | + | Обращаем внимание, что $ \sum\limits_{i = 1}^{n} \xi_i^2 = 1 $, то есть $ \xi = (\xi_1, \dots ,\xi_n) \in \delta_n $ - ограниченное замкнутое множество, а, значит, компакто в $ R^n $. |
− | есть $ \xi = (\xi_1, \dots ,\xi_n) \in \delta_n $ - ограниченное замкнутое множество, а, значит, компакто в $ R^n $. | ||
Так как все частные производные непрерывны, то все $ \alpha_{ij} $ стремятся к 0, если $ \Delta a $ стремится к 0. | Так как все частные производные непрерывны, то все $ \alpha_{ij} $ стремятся к 0, если $ \Delta a $ стремится к 0. | ||
+ | |||
Воспользуемся тем, что квадратичные формы можно классифицировать по знаку их значений. | Воспользуемся тем, что квадратичные формы можно классифицировать по знаку их значений. | ||
− | Форма является строго положительно определенной, если при $ \xi_i \ne 0 $ знак суммы $ A_{ij} \xi_i \xi_j > 0 $. | + | Форма является строго положительно определенной, если при $ \xi_i \ne 0 $ знак суммы $ A_{ij} \xi_i \xi_j > 0 $ (например, $ \xi_1^2 + \dots + \xi_n^2 $ ). |
− | + | Будем считать, что интересующая нас форма именно такая. Но на $ \delta_n $ она - непрерывная функция, а координаты на сфере все не равны нулю. | |
− | |||
− | Будем считать, что интересующая форма именно такая. Но на $ \delta_n $ она - непрерывная функция, | ||
− | а координаты на сфере все не равны нулю. | ||
По теореме Вейерштрасса форма принимает минимальное значение $ m > 0 $. | По теореме Вейерштрасса форма принимает минимальное значение $ m > 0 $. | ||
Строка 64: | Строка 58: | ||
Вывод: $ \forall \overline{\xi} \in \delta_n \Rightarrow \sum\limits_{i,j = 1}^{n} \alpha_{ij} \xi_i \xi_j $, где $ \alpha_{ij} $ - стремится к 0, а $\xi_i, \xi_j $ - ограничены - приходим к выводу что сумма стремится к нулю. | Вывод: $ \forall \overline{\xi} \in \delta_n \Rightarrow \sum\limits_{i,j = 1}^{n} \alpha_{ij} \xi_i \xi_j $, где $ \alpha_{ij} $ - стремится к 0, а $\xi_i, \xi_j $ - ограничены - приходим к выводу что сумма стремится к нулю. | ||
− | Значит: | + | Значит: $ \exists \delta > 0 : \| \Delta \overline{a} \| < \delta \Rightarrow \sum \alpha_{ij} \xi_i \xi_j > -\frac12 m $ |
+ | |||
+ | При таких $ \Delta \overline{a} $ : $ \sum A_{ij} \xi_i \xi_j + \sum \alpha_{ij} \xi_i \xi_j> \frac12 m > 0 $ | ||
+ | |||
+ | Используя все в соотношении(*), получаем, что | ||
+ | $ \Delta f(\overline{a}, \Delta \overline{a}) > \frac14 m {\|\Delta \overline{a} \|}^2 > 0 \Rightarrow \overline{a} $ - точка локального минимума. | ||
+ | |||
+ | В результате: если $ df(\overline{a}) = 0$ , а $ d^2 f(\overline{a}, \Delta \overline{a}) $, как квадратичная форма строго положительно определенная, то a - точка локального минимума. | ||
+ | }} | ||
+ | |||
+ | |||
+ | Аналогично, если квадратичеая форма строго отрицательно определена, то a - точка локального максимума. | ||
+ | |||
+ | Той же техникой показывают, что если $d^2f(\overline{a}, \Delta \overline{a})$ незнакоопредленная, то в точке a в ней локального экстремума нет. | ||
+ | |||
+ | Остается ситуация: $ d^2 f(\overline{a}, \Delta \overline{a}) \ge 0 $ или $ \le 0 $ (нестрого знакоопределенная) - тогда проблема требует дополнительного исследования. | ||
</wikitex> | </wikitex> |
Версия 05:05, 2 июня 2011
<wikitex>
Считаем что $ \forall \frac{\partial f}{\partial x_j} \in C^0 $(непрерывная)
$ y = f(x_1, x_2, \dots, x_n) $ в $ V(\overline{a}) \in R^n $
Если $ \| \Delta \overline{a} \| \le \delta, \quad \delta \approx 0 \Rightarrow f(\overline{a} + \Delta \overline{a}) \le f(\overline{a}) $ , то $ a $ - точка локального максимума. Аналогично, точка локального минимума.
Теорема (Аналог теоремы Ферма): |
Существует f, дифференциируемая в точке a, которая - локальный экстремум, тогда $ \forall j = 1..n $ все $ \frac{\partial{f |
|proof = $ f(\overline{a} + \Delta \overline{a}) - f(\overline{a}) = \sum\limits_{j = 1}^{n} \frac{\partial f}{\partial x_j}(\overline{a}) \Delta a_j + o(\Delta \overline{a}) $
$ \Delta \overline{a} = h \overline{e_j} \quad $ : (сохраняет знак из-за экстремальности точки a) $ \quad \frac{f(\overline{a} + h \overline{e_j}) - f(\overline{a})}{h} = \frac{\partial f}{\partial x_j}(\overline{a}) + \frac{o(h \overline{e_j})}{h} $ - стремится к 0 при h стремящемся к 0
Поэтому предел слева имеет разные знаки в зависимости от стремления к нулю(справа или слева), но по единственности предела: $ \frac{\partial f}{\partial x_j} (\overline{a}) = 0 $
Пусть $ y = f(\overline{x}) $, исследуем на экстремум $\overline{a} $.
Составляем систему:
$ \begin{cases} \frac{\partial f}{\partial x_1} \overline{a} = 0\\
\dots\\ \frac{\partial f}{\partial x_n} \overline{a} = 0 \end{cases} $
Решения - стационаоные точки, включают в сеья экстремальные. Если a - стационарна - то по формуле Тейлора: $ f(\overline{a} + \Delta \overline{a}) - f(\overline{a}) = \frac12 \sum\limits_{i,j = 1}^n \frac{\partial^2 f}{\partial x_i \partial x_j } (\overline{a} + \theta \Delta \overline{a}) \Delta a_i \Delta a_j $
Записывая $ \frac{\partial^2 f}{\partial x_i \partial x_j } (\overline{a} + \theta \Delta \overline{a}) $ как $A_{ij} + \alpha_{ij} $, если $ A_{ij} = \frac{\partial^2 f}{\partial x_i \partial x_j } \overline{a} $:
$ \Delta f(\overline{a}, \Delta \overline{a}) = \frac12 \sum\limits_{i,j = 1}^{n} A_{ij} \Delta a_i \Delta a_j +\frac12 \sum\limits_{i,j = 1}^{n} \alpha_{ij} \Delta a_i \Delta a_j $
$ \xi_i = \frac{\Delta a_i}{\| \Delta \overline{a} \|} $, приходим к записи: $ \Delta f(\overline{a}, \Delta \overline{a}) = \frac12 {\| \Delta \overline{a} \|}^2 \left( \sum\limits_{i,j = 1}^{n} A_{ij} \Delta \xi_i \Delta \xi_j +\sum\limits_{i,j = 1}^{n} \alpha_{ij} \Delta \xi_i \Delta \xi_j \right) $ (*)
Обращаем внимание, что $ \sum\limits_{i = 1}^{n} \xi_i^2 = 1 $, то есть $ \xi = (\xi_1, \dots ,\xi_n) \in \delta_n $ - ограниченное замкнутое множество, а, значит, компакто в $ R^n $.
Так как все частные производные непрерывны, то все $ \alpha_{ij} $ стремятся к 0, если $ \Delta a $ стремится к 0.
Воспользуемся тем, что квадратичные формы можно классифицировать по знаку их значений.
Форма является строго положительно определенной, если при $ \xi_i \ne 0 $ знак суммы $ A_{ij} \xi_i \xi_j > 0 $ (например, $ \xi_1^2 + \dots + \xi_n^2 $ ).
Будем считать, что интересующая нас форма именно такая. Но на $ \delta_n $ она - непрерывная функция, а координаты на сфере все не равны нулю.
По теореме Вейерштрасса форма принимает минимальное значение $ m > 0 $.
Вывод: $ \forall \overline{\xi} \in \delta_n \Rightarrow \sum\limits_{i,j = 1}^{n} \alpha_{ij} \xi_i \xi_j $, где $ \alpha_{ij} $ - стремится к 0, а $\xi_i, \xi_j $ - ограничены - приходим к выводу что сумма стремится к нулю.
Значит: $ \exists \delta > 0 : \| \Delta \overline{a} \| < \delta \Rightarrow \sum \alpha_{ij} \xi_i \xi_j > -\frac12 m $
При таких $ \Delta \overline{a} $ : $ \sum A_{ij} \xi_i \xi_j + \sum \alpha_{ij} \xi_i \xi_j> \frac12 m > 0 $
Используя все в соотношении(*), получаем, что $ \Delta f(\overline{a}, \Delta \overline{a}) > \frac14 m {\|\Delta \overline{a} \|}^2 > 0 \Rightarrow \overline{a} $ - точка локального минимума.
В результате: если $ df(\overline{a}) = 0$ , а $ d^2 f(\overline{a}, \Delta \overline{a}) $, как квадратичная форма строго положительно определенная, то a - точка локального минимума. }}
Аналогично, если квадратичеая форма строго отрицательно определена, то a - точка локального максимума.
Той же техникой показывают, что если $d^2f(\overline{a}, \Delta \overline{a})$ незнакоопредленная, то в точке a в ней локального экстремума нет.
Остается ситуация: $ d^2 f(\overline{a}, \Delta \overline{a}) \ge 0 $ или $ \le 0 $ (нестрого знакоопределенная) - тогда проблема требует дополнительного исследования.
</wikitex>