Выпуклые функции — различия между версиями
Komarov (обсуждение | вклад) |
м (rollbackEdits.php mass rollback) |
||
(не показано 13 промежуточных версий 5 участников) | |||
Строка 1: | Строка 1: | ||
== Определения == | == Определения == | ||
− | Будем рассматривать отрезок <tex>[a; b]</tex>, <tex>x_1, x_2, x_3, \ldots x_n \in [a; b]</tex> и коэффициенты <tex>\alpha_1, \alpha_2, \ldots, \alpha_n | + | Будем рассматривать отрезок <tex>[a; b]</tex>, набор чисел <tex>x_1, x_2, x_3, \ldots x_n \in [a; b]</tex> и коэффициенты <tex>\alpha_1, \alpha_2, \ldots, \alpha_n \ge 0</tex> |
такие, что <tex>\sum\limits_{i = 1}^n \alpha_i = 1</tex>. | такие, что <tex>\sum\limits_{i = 1}^n \alpha_i = 1</tex>. | ||
{{Определение | {{Определение | ||
|definition= | |definition= | ||
− | Выпуклая комбинация чисел <tex>x_k</tex> — это <tex>\bar x = \sum\limits_{ | + | Выпуклая комбинация чисел <tex>x_k</tex> — это <tex>\bar x = \sum\limits_{k = 1}^n \alpha_kx_k</tex> |
}} | }} | ||
Строка 20: | Строка 20: | ||
{{Определение | {{Определение | ||
|definition= | |definition= | ||
− | Пусть <tex>f(x)</tex> задана на <tex>[a; b]</tex>. Тогда она выпукла вверх на этом отрезке, если | + | Пусть [[Отображения|функция]] <tex>f(x)</tex> задана на <tex>[a; b]</tex>. Тогда она выпукла вверх на этом отрезке, если |
<tex>\forall x_1, x_2 \in [a; b] \forall \alpha \in [0; 1] \quad \alpha f(x_1) + (1 - \alpha) f(x_2) \leq f(\alpha x_1 + (1 - \alpha)x_2)</tex>. | <tex>\forall x_1, x_2 \in [a; b] \forall \alpha \in [0; 1] \quad \alpha f(x_1) + (1 - \alpha) f(x_2) \leq f(\alpha x_1 + (1 - \alpha)x_2)</tex>. | ||
Если же всё время неравенство противоположно, то функция называется выпуклой вниз. | Если же всё время неравенство противоположно, то функция называется выпуклой вниз. | ||
Строка 27: | Строка 27: | ||
В силу того, что было сказано о выпуклой комбинации, определение корректно: <tex>\alpha x_1 + (1 - \alpha)x_2 \in [a; b]</tex>. | В силу того, что было сказано о выпуклой комбинации, определение корректно: <tex>\alpha x_1 + (1 - \alpha)x_2 \in [a; b]</tex>. | ||
− | + | Геометрической смысл этого факта состоит в том, что для выпуклой вверх функции её график будет лежать выше хорды. | |
Замечание: если <tex>f(x)</tex> выпукла вниз, то <tex>-f(x)</tex> выпукла вверх. | Замечание: если <tex>f(x)</tex> выпукла вниз, то <tex>-f(x)</tex> выпукла вверх. | ||
== Неравенство Йенсена == | == Неравенство Йенсена == | ||
− | + | {{Теорема | |
− | Пусть <tex>f(x)</tex> выпукла вверх на <tex>[a; b]</tex>. Тогда <tex>\forall x_1 | + | |about= |
+ | Неравенство Йенсена | ||
+ | |statement= | ||
+ | Пусть <tex>f(x)</tex> выпукла вверх на <tex>[a; b]</tex>. Тогда <tex>\forall x_1, x_2 \ldots x_n \in [a; b]</tex> и их выпуклой комбинации выполнено неравенство | ||
<tex>\sum\limits_{k = 1}^n \alpha_k f(x_k) \leq f\left(\sum\limits_{k = 1}^n \alpha_k x_k\right)</tex>. | <tex>\sum\limits_{k = 1}^n \alpha_k f(x_k) \leq f\left(\sum\limits_{k = 1}^n \alpha_k x_k\right)</tex>. | ||
− | + | |proof= | |
Докажем по индукции. | Докажем по индукции. | ||
Строка 44: | Строка 47: | ||
<tex>\sum\limits_{k = 1}^{n + 1} \alpha_k = 1</tex>, обозначим за <tex>s_n = \sum\limits_{k = 1}^n \alpha_k</tex> | <tex>\sum\limits_{k = 1}^{n + 1} \alpha_k = 1</tex>, обозначим за <tex>s_n = \sum\limits_{k = 1}^n \alpha_k</tex> | ||
− | Пусть <tex>\beta_k = \frac{\alpha_k}{s_n} | + | Пусть <tex>\beta_k = \frac{\alpha_k}{s_n}</tex>. Тогда получаем: <tex>\sum\limits_{k = 1}^{n} \beta_k = 1</tex>. |
<tex> | <tex> | ||
\sum\limits_{k = 1}^{n + 1} \alpha_k f(x_k) = | \sum\limits_{k = 1}^{n + 1} \alpha_k f(x_k) = | ||
− | s_n \sum\limits_{k = 1}^n \beta_k f(x_k) + \alpha_{n + 1}f(x_{n + 1}) \leq | + | s_n \sum\limits_{k = 1}^n \beta_k f(x_k) + \alpha_{n + 1}f(x_{n + 1}) \leq</tex> (по предположению индукции) <tex> |
− | s_n f(\sum\limits_{k = 1}^n \beta_k x_k + \alpha_{n + 1}x_{n + 1}) \leq </tex> (так как <tex>s_n + \alpha_{n + 1} = 1</tex>) | + | s_n f\left(\sum\limits_{k = 1}^n \beta_k x_k \right) + \alpha_{n + 1}f(x_{n + 1}) \leq </tex> (так как <tex>s_n + \alpha_{n + 1} = 1</tex>) |
− | <tex> f(\sum\limits_{k = 1}^{n + 1} \alpha_k x_k)</tex> | + | <tex> f\left(\sum\limits_{k = 1}^{n + 1} \alpha_k x_k\right)</tex> |
+ | |||
+ | Значит, шаг индукции проделан, неравенство доказано для произвольного <tex>n</tex>. | ||
− | + | }} | |
+ | |||
+ | == Связь выпуклости и дифференцируемости == | ||
Применим линейную интерполяцию (в случае <tex>2</tex> узлов) чтобы выяснить связь между выпуклостью и дифференцируемостью функции <tex>f</tex>. | Применим линейную интерполяцию (в случае <tex>2</tex> узлов) чтобы выяснить связь между выпуклостью и дифференцируемостью функции <tex>f</tex>. | ||
Строка 64: | Строка 71: | ||
<tex>f(x) - L_n(x) = \frac{f^{(2)}(c_x)}{2!}(x - x_0)(x - x_1)</tex>, <tex>x_0 \leq x \leq x_1</tex>. | <tex>f(x) - L_n(x) = \frac{f^{(2)}(c_x)}{2!}(x - x_0)(x - x_1)</tex>, <tex>x_0 \leq x \leq x_1</tex>. | ||
− | Если <tex>f^{(2)} | + | Если <tex>f^{(2)} \leq 0</tex> на <tex>\langle a; b\rangle</tex> то правая часть будет неотрицательная, так как <tex>x \in [x_0; x_1]</tex>, поэтому |
− | <tex>f(x) - L_n(x) \ | + | <tex>f(x) - L_n(x) \geq 0</tex>, и т. к. <tex>x_0</tex> и <tex>x_1</tex> произвольны, то <tex>f</tex> выпукла вверх. |
− | Итак, <tex>f^{(2)} | + | Итак, <tex>f^{(2)} \leq 0 \Rightarrow f </tex> — выпукла вверх. |
− | + | Пусть <tex>f</tex> выпукла вверх. Будем считать, что <tex>f^{(2)}</tex> — непрерывна. <tex>x \in \langle a; b\rangle</tex>. | |
− | <tex>x_0 = x - \Delta x</tex>, <tex>x_1 = x + \Delta x</tex>, где <tex>\Delta x</tex> — малое положительное число. | + | Пусть <tex>x_0 = x - \Delta x</tex>, <tex>x_1 = x + \Delta x</tex>, где <tex>\Delta x</tex> — малое положительное число. |
+ | Рассмотрим полином Лагранжа <tex>L_n</tex> для системы узлов <tex>(x_0, x_1)</tex> : | ||
− | <tex>f(t) - L_n(t) = \frac{f^{(2)}(c_t)}{2!} (t - x_0)(t - x_1), \, (t - x_0)(t - x_1) < 0 \Rightarrow f^{(2)}(c_t) \leq 0</tex> | + | <tex>f(t) - L_n(t) = \frac{f^{(2)}(c_t)}{2!} (t - x_0)(t - x_1) \geq 0, \, (t - x_0)(t - x_1) < 0 \Rightarrow f^{(2)}(c_t) \leq 0</tex> |
<tex>c_t \in \langle x - \Delta x; x + \Delta x \rangle</tex> | <tex>c_t \in \langle x - \Delta x; x + \Delta x \rangle</tex> | ||
− | <tex>\Delta x \to 0 : | + | <tex>\Delta x \to 0 : c_t \to x : f^{(2)}(x) \leq 0</tex> |
+ | |||
+ | Итак, если <tex>f</tex> выпукла вверх, то <tex>f^{(2)} \leq 0</tex>. | ||
+ | |||
+ | === Пример === | ||
− | + | В качестве примера рассмотрим <tex>y = \ln x</tex>, <tex>y'' = \frac{-1}{x^2} \leq 0 \Rightarrow \ln x</tex> выпукла вверх. | |
+ | Это мы применим в [[Неравенства_Гёльдера,_Минковского|следующем параграфе]]. | ||
− | + | [[Категория:Математический анализ 1 курс]] | |
− |
Текущая версия на 19:10, 4 сентября 2022
Определения
Будем рассматривать отрезок
, набор чисел и коэффициенты такие, что .
Определение: |
Выпуклая комбинация чисел | — это
Частный случай — . В этом случае — среднее арифметическое.
Обозначим за
, а . Тогда , а так как и .В этом смысле отрезок — выпуклое множество, так как он содержит выпуклую комбинацию любых своих чисел.
(типа определение) Выпуклое множество вместе с парой своих точек содержит отрезок, их соединяющий.
Определение: |
Пусть функция задана на . Тогда она выпукла вверх на этом отрезке, если
Если же всё время неравенство противоположно, то функция называется выпуклой вниз. . |
В силу того, что было сказано о выпуклой комбинации, определение корректно: .
Геометрической смысл этого факта состоит в том, что для выпуклой вверх функции её график будет лежать выше хорды.
Замечание: если
выпукла вниз, то выпукла вверх.Неравенство Йенсена
Теорема (Неравенство Йенсена): |
Пусть выпукла вверх на . Тогда и их выпуклой комбинации выполнено неравенство
. |
Доказательство: |
Докажем по индукции. База: . Неравенство превращается в определение выпуклой вверх функции, для которой это, очевидно, выполняется.Переход. Пусть это верно для . Докажем, что это верно для :, обозначим за Пусть . Тогда получаем: .Значит, шаг индукции проделан, неравенство доказано для произвольного (по предположению индукции) (так как ) . |
Связь выпуклости и дифференцируемости
Применим линейную интерполяцию (в случае
узлов) чтобы выяснить связь между выпуклостью и дифференцируемостью функции . Будем считать, что дифференцируема столько раз, сколько нам нужно. Имея узла на и , , составим :— прямая, проходящая через точки и . Значит, между и получаем хорду, соединяющую две точки графика.
В вопросе о выпуклости надо проверять знак такой разности:
, .Если
на то правая часть будет неотрицательная, так как , поэтому , и т. к. и произвольны, то выпукла вверх.Итак,
— выпукла вверх.Пусть
выпукла вверх. Будем считать, что — непрерывна. .Пусть
, , где — малое положительное число. Рассмотрим полином Лагранжа для системы узлов :
Итак, если
выпукла вверх, то .Пример
В качестве примера рассмотрим следующем параграфе.
, выпукла вверх. Это мы применим в