Безусловный экстремум функции многих переменных — различия между версиями

Текущая версия на 19:22, 4 сентября 2022

Так же, как и ранее, считаем, что все частные производные исследуемой функции непрерывны.

Определение:

Пусть задан линейный функционал на . Если при , , то — точка локального максимума. Аналогично определяется точка локального минимума.

Теорема (Аналог теоремы Ферма):

Пусть дифференцируема в точке локального экстремума . Тогда

Доказательство:

Пусть , где [math] \overline{e_j} [/math] - базисный вектор.

Тогда

Последнее слагаемое стремится к 0 при [math]h[/math] стремящемся к 0.

Числитель дроби в левой части сохраняет знак из-за экстремальности точки , поэтому предел дроби имеет разные знаки в зависимости от стремления к нулю(справа или слева), но по единственности предела: .

Пусть [math]y = f(\overline{x})[/math], исследуем на экстремум в [math]\overline{a}[/math].

Составляем систему:

Решения — стационарные точки, включают в себя экстремальные. Если [math]a[/math] — стационарна, то по формуле Тейлора:

Записывая как [math]A_{ij} + \alpha_{ij}[/math], если :

, приходим к записи: (*)

Обращаем внимание, что , то есть — замкнутая сфера единичного радиуса, то есть ограниченное замкнутое множество, которое является компактом в [math]\mathbb{R}^n[/math].

Так как все частные производные непрерывны, то все [math]\alpha_{ij}[/math] стремятся к 0, если [math]\Delta a[/math] стремится к 0.

Воспользуемся тем, что квадратичные формы можно классифицировать по знаку их значений. Форма является строго положительно определенной, если при [math]\forall \bar \xi \ne 0[/math] знак суммы [math]A_{ij} \xi_i \xi_j \gt 0[/math] (например,[math]\xi_1^2 + \dots + \xi_n^2[/math]).

Будем считать, что интересующая нас форма именно такая. Но на [math]\delta_n[/math] она — непрерывная функция, а координаты на сфере все координаты не могут быть равны нулю одновременно.

По теореме Вейерштрасса форма принимает минимальное значение [math]m \gt 0[/math].

Вывод: , где [math]\alpha_{ij}[/math] стремится к 0, а [math]\xi_i, \xi_j[/math] ограничены. Приходим к выводу что сумма стремится к нулю.

Значит:

При таких

Используя все в соотношении(*), получаем, что — точка локального минимума.

В результате: если [math]df(\overline{a}) = 0[/math], а как квадратичная форма строго положительно определенная, то [math]a[/math] — точка локального минимума.

Аналогично, если квадратичная форма строго отрицательно определена, то [math]a[/math] — точка локального максимума.

Той же техникой показывают, что если незнакоопределённая, то в точке [math]a[/math] в ней локального экстремума нет.

Остается ситуация: или [math]\le 0[/math] (нестрого знакоопределённая) — тогда проблема требует дополнительного исследования.

<< >>

@@ Строка 1: / Строка 1: @@
-<wikitex>
+[[Формула Тейлора для функций многих переменных|<<]] [[Локальная теорема о неявном отображении|>>]]
-Считаем что $ \forall \frac{\partial f}{\partial x_j} \in C^0 $(непрерывная)
+Так же, как и ранее, считаем, что все частные производные исследуемой функции непрерывны.
-$ y = f(x_1, x_2, \dots, x_n) $ в $ V(\overline{a}) \in R^n $
-Если $ \| \Delta \overline{a} \| \le \delta, \quad \delta \approx 0 \Rightarrow f(\overline{a} + \Delta \overline{a}) \le f(\overline{a}) $ , то $ a $ - точка локального максимума. Аналогично, точка локального минимума.
+{{Определение
+|definition=
+Пусть задан линейный функционал <tex>y = f(x_1, x_2, \dots, x_n) </tex> на <tex> V(\overline{a}) \subset R^n </tex>.
+Если при <tex>\| \Delta \overline{a} \| \le \delta</tex>, <tex>\delta \approx 0 \Rightarrow f(\overline{a} + \Delta \overline{a}) \le f(\overline{a})</tex>, то <tex>a</tex> {{---}} '''точка локального максимума'''. Аналогично определяется точка локального минимума.
+}}
 {{Теорема
-|about = Аналог теоремы Ферма
+|about=
-|statement =
+Аналог теоремы Ферма
-Существует f, дифференциируемая в точке a, которая - локальный экстремум, тогда $ \forall j = 1..n $ все $ \frac{\partial{f}}{\partial{x_j}} \overline{a} = 0 $
+|statement=
-|proof =
+Пусть <tex>f</tex> дифференцируема в точке локального экстремума <tex>a</tex>. Тогда <tex>\forall j = 1..n : \frac{\partial{f}}{\partial{x_j}} \overline{a} = 0</tex>
-$ f(\overline{a} + \Delta \overline{a}) - f(\overline{a}) =
+|proof=
-\sum\limits_{j = 1}^{n} \frac{\partial f}{\partial x_j}(\overline{a}) \Delta a_j + o(\Delta \overline{a}) $
+<tex>f(\overline{a} + \Delta \overline{a}) - f(\overline{a})</tex>
+<tex>=\sum\limits_{j = 1}^{n} \frac{\partial f}{\partial x_j}(\overline{a}) \Delta a_j + o(\Delta \overline{a})</tex>
-$ \Delta \overline{a} = h \overline{e_j} \quad $ :
+Пусть <tex>\Delta \overline{a} = h \overline{e_j}</tex>, где <tex> \overline{e_j} </tex> - базисный вектор.
-(сохраняет знак из-за экстремальности точки a) $ \quad \frac{f(\overline{a} + h \overline{e_j}) - f(\overline{a})}{h}
-= \frac{\partial f}{\partial x_j}(\overline{a}) + \frac{o(h \overline{e_j})}{h} $ - стремится к 0 при h стремящемся к 0
-Поэтому предел слева имеет разные знаки в зависимости от стремления к нулю(справа или слева), но по единственности предела: $ \frac{\partial f}{\partial x_j} (\overline{a}) = 0 $
+Тогда <tex>\frac{f(\overline{a} + h \overline{e_j}) - f(\overline{a})}{h}</tex>
+<tex>= \frac{\partial f}{\partial x_j}(\overline{a}) + \frac{o(h \overline{e_j})}{h}</tex>
-Пусть $ y = f(\overline{x}) $, исследуем на экстремум $\overline{a} $.
+Последнее слагаемое стремится к 0 при <tex>h</tex> стремящемся к 0.
+Числитель дроби в левой части сохраняет знак из-за экстремальности точки <tex>a</tex>, поэтому предел дроби имеет разные знаки в зависимости от стремления к нулю(справа или слева), но по единственности предела: <tex>\frac{\partial f}{\partial x_j} (\overline{a}) = 0</tex>.
+}}
+Пусть <tex>y = f(\overline{x})</tex>, исследуем на экстремум в <tex>\overline{a}</tex>.
 Составляем систему:
-$ \begin{cases} \frac{\partial f}{\partial x_1} \overline{a} = 0\\
+<tex>\begin{cases}
-                \dots\\
+  \frac{\partial f}{\partial x_1} \overline{a} = 0\\
-                \frac{\partial f}{\partial x_n} \overline{a} = 0
+  \dots\\
-  \end{cases} $
+  \frac{\partial f}{\partial x_n} \overline{a} = 0
+\end{cases}</tex>
-Решения - стационаоные точки, включают в сеья экстремальные.
+Решения {{---}} стационарные точки, включают в себя экстремальные.
-Если a - стационарна - то по формуле Тейлора:
+Если <tex>a</tex> {{---}} стационарна, то по формуле Тейлора:
-$ f(\overline{a} + \Delta \overline{a}) - f(\overline{a})
+<tex>f(\overline{a} + \Delta \overline{a}) - f(\overline{a})</tex>
-= \frac12 \sum\limits_{i,j = 1}^n \frac{\partial^2 f}{\partial x_i \partial x_j } (\overline{a} + \theta \Delta \overline{a}) \Delta a_i \Delta a_j $
+<tex>= \frac12 \sum\limits_{i,j = 1}^n \frac{\partial^2 f}{\partial x_i \partial x_j } (\overline{a} + \theta \Delta \overline{a}) \Delta a_i \Delta a_j</tex>
-Записывая $ \frac{\partial^2 f}{\partial x_i  \partial x_j } (\overline{a} + \theta \Delta \overline{a}) $ как $A_{ij} + \alpha_{ij} $, если $ A_{ij} = \frac{\partial^2 f}{\partial x_i  \partial x_j } \overline{a} $:
+Записывая <tex>\frac{\partial^2 f}{\partial x_i  \partial x_j } (\overline{a} + \theta \Delta \overline{a})</tex> как <tex>A_{ij} + \alpha_{ij}</tex>, если <tex>A_{ij} = \frac{\partial^2 f}{\partial x_i  \partial x_j } \overline{a}</tex>:
-$ \Delta f(\overline{a}, \Delta \overline{a})
+<tex>\Delta f(\overline{a}, \Delta \overline{a})</tex>
-= \frac12 \sum\limits_{i,j = 1}^{n} A_{ij} \Delta a_i \Delta a_j +\frac12 \sum\limits_{i,j = 1}^{n} \alpha_{ij} \Delta a_i \Delta a_j $
+<tex>= \frac12 \sum\limits_{i,j = 1}^{n} A_{ij} \Delta a_i \Delta a_j +\frac12 \sum\limits_{i,j = 1}^{n} \alpha_{ij} \Delta a_i \Delta a_j</tex>
-$ \xi_i = \frac{\Delta a_i}{\| \Delta \overline{a} \|} $, приходим к записи:
+<tex>\xi_i = \frac{\Delta a_i}{\| \Delta \overline{a} \|}</tex>, приходим к записи:
-$ \Delta f(\overline{a}, \Delta \overline{a})
+<tex>\Delta f(\overline{a}, \Delta \overline{a})</tex>
-= \frac12 {\| \Delta \overline{a} \|}^2 \left( \sum\limits_{i,j = 1}^{n} A_{ij} \Delta \xi_i \Delta \xi_j +\sum\limits_{i,j = 1}^{n} \alpha_{ij} \Delta \xi_i \Delta \xi_j \right) $ (*)
+<tex>= \frac12 {\| \Delta \overline{a} \|}^2 \left( \sum\limits_{i,j = 1}^{n} A_{ij}  \xi_i  \xi_j +\sum\limits_{i,j = 1}^{n} \alpha_{ij}  \xi_i  \xi_j \right)</tex>(*)
-Обращаем внимание, что $ \sum\limits_{i = 1}^{n} \xi_i^2 = 1 $, то есть $ \xi = (\xi_1, \dots ,\xi_n) \in \delta_n $ - ограниченное замкнутое множество, а, значит, компакто в $ R^n $.
+Обращаем внимание, что <tex>\sum\limits_{i = 1}^{n} \xi_i^2 = 1</tex>, то есть <tex>\xi = (\xi_1, \dots ,\xi_n) \in \delta_n </tex> {{---}} замкнутая сфера единичного радиуса, то есть ограниченное замкнутое множество, которое является компактом в <tex>\mathbb{R}^n</tex>.
-Так как все частные производные непрерывны, то все $ \alpha_{ij} $ стремятся к 0, если $ \Delta a $  стремится к 0.
+Так как все частные производные непрерывны, то все <tex>\alpha_{ij}</tex> стремятся к 0, если <tex>\Delta a</tex> стремится к 0.
 Воспользуемся тем, что квадратичные формы можно классифицировать по знаку их значений.
-Форма является строго положительно определенной, если при $ \xi_i \ne 0 $ знак суммы $ A_{ij} \xi_i \xi_j > 0 $ (например, $ \xi_1^2 + \dots + \xi_n^2 $ ).
+Форма является строго положительно определенной, если при <tex>\forall \bar \xi  \ne 0</tex> знак суммы <tex>A_{ij} \xi_i \xi_j > 0</tex> (например,<tex>\xi_1^2 + \dots + \xi_n^2</tex>).
-Будем считать, что интересующая нас форма именно такая. Но на $ \delta_n $ она - непрерывная функция, а координаты на сфере все не равны нулю.
+Будем считать, что интересующая нас форма именно такая. Но на <tex>\delta_n</tex> она {{---}} непрерывная функция, а координаты на сфере все координаты не могут быть равны нулю одновременно.
-По теореме Вейерштрасса форма принимает минимальное значение $ m > 0 $.
+По теореме Вейерштрасса форма принимает минимальное значение <tex>m > 0</tex>.
-Вывод: $ \forall \overline{\xi} \in \delta_n \Rightarrow \sum\limits_{i,j = 1}^{n} \alpha_{ij} \xi_i \xi_j $, где $ \alpha_{ij} $ - стремится к 0, а $\xi_i, \xi_j $ - ограничены - приходим к выводу что сумма стремится к нулю.
+Вывод: <tex>\forall \overline{\xi} \in \delta_n \Rightarrow \sum\limits_{i,j = 1}^{n} \alpha_{ij} \xi_i \xi_j</tex>, где <tex>\alpha_{ij}</tex> стремится к 0, а <tex>\xi_i, \xi_j</tex> ограничены. Приходим к выводу что сумма стремится к нулю.
-Значит: $ \exists \delta > 0 : \| \Delta \overline{a} \| < \delta \Rightarrow \sum \alpha_{ij} \xi_i \xi_j > -\frac12 m  $
+Значит: <tex>\exists \delta > 0 : \| \Delta \overline{a} \| < \delta \Rightarrow \sum \alpha_{ij} \xi_i \xi_j > -\frac12 m</tex>
-При таких $ \Delta \overline{a} $ : $ \sum A_{ij} \xi_i \xi_j + \sum \alpha_{ij} \xi_i \xi_j> \frac12 m > 0 $
+При таких <tex>\Delta \overline{a} : \sum A_{ij} \xi_i \xi_j + \sum \alpha_{ij} \xi_i \xi_j> \frac12 m > 0</tex>
 Используя все в соотношении(*), получаем, что
-$ \Delta f(\overline{a}, \Delta \overline{a}) > \frac14 m {\|\Delta \overline{a} \|}^2 > 0 \Rightarrow \overline{a} $ - точка локального минимума.
+<tex>\Delta f(\overline{a}, \Delta \overline{a}) > \frac14 m {\|\Delta \overline{a} \|}^2 > 0 \Rightarrow \overline{a}</tex> {{---}} точка локального минимума.
-В результате: если $ df(\overline{a}) = 0$ , а $ d^2 f(\overline{a}, \Delta \overline{a}) $, как квадратичная форма строго положительно определенная, то a - точка локального минимума.
-}}
+В результате: если <tex>df(\overline{a}) = 0</tex>, а <tex>d^2 f(\overline{a}, \Delta \overline{a})</tex> как квадратичная форма строго положительно определенная, то <tex>a</tex> {{---}} точка локального минимума.
-Аналогично, если квадратичеая форма строго отрицательно определена, то a - точка локального максимума.
+Аналогично, если квадратичная форма строго отрицательно определена, то <tex>a</tex> {{---}} точка локального максимума.
-Той же техникой показывают, что если $d^2f(\overline{a}, \Delta \overline{a})$ незнакоопредленная, то в точке a в ней локального экстремума нет.
+Той же техникой показывают, что если <tex>d^2f(\overline{a}, \Delta \overline{a})</tex> незнакоопределённая, то в точке <tex>a</tex> в ней локального экстремума нет.
-Остается ситуация: $ d^2 f(\overline{a}, \Delta \overline{a}) \ge 0 $ или $ \le 0 $ (нестрого знакоопределенная) - тогда проблема требует дополнительного исследования.
+Остается ситуация: <tex>d^2 f(\overline{a}, \Delta \overline{a}) \ge 0</tex> или <tex>\le 0</tex> (нестрого знакоопределённая) {{---}} тогда проблема требует дополнительного исследования.
-</wikitex>
+[[Формула Тейлора для функций многих переменных|<<]] [[Локальная теорема о неявном отображении|>>]]
 [[Категория: Математический анализ 1 курс]]

Безусловный экстремум функции многих переменных — различия между версиями

Текущая версия на 19:22, 4 сентября 2022

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты