403
правки
Изменения
Новая страница: «Будем рассматривать отрезок <tex>[a; b]</tex>, <tex>x_1, x_2, x_3, \ldots x_n \in [a; b]</tex> и коэффициенты <tex>\alpha_1, \a…»
Будем рассматривать отрезок <tex>[a; b]</tex>, <tex>x_1, x_2, x_3, \ldots x_n \in [a; b]</tex> и коэффициенты <tex>\alpha_1, \alpha_2, \ldots, \alpha_n > 0</tex>
такие, что <tex>\sum\limits_{i = 1}^n \alpha_i = 1</tex>.
{{Определение
|definition=
Выпуклая комбинация чисел <tex>x_k</tex> — <tex>\bar x = \sum\limits_{i = 1}^n \alpha_kx_k</tex>
}}
Частный случай — <tex>\alpha_k = \frac1n</tex>. В этом случае <tex>\bar x</tex> — среднее арифметическое.
Обозначим за <tex>x_* = \min \{x_1; x_2; \ldots x_n \}</tex>, а <tex>x^* = \max \{x_1; x_2; \ldots x_n \}</tex>. Тогда <tex>x_* \leq \bar x \leq x^*</tex>, а так как
<tex>x_* \in [a; b]</tex> и <tex>x^* \in [a; b]$, то $\bar x \in [a; b]</tex>.
В этом смысле отрезок — выпуклое множество, так как он содержит выпуклую комбинацию любых своих чисел.
(типа определение) Выпуклое множество вместе с парой своих точек содержит отрезок, их соединяющий.
{{Определение
|definition=
Пусть <tex>f(x)</tex> задана на <tex>[a; b]</tex>. Тогда она выпукла вверх на этом отрезке, если
<tex>\forall x_1, x_2 \in [a; b] \forall \alpha \in [0; 1] \quad \alpha f(x_1) + (1 - \alpha) f(x_2) \leq f(\alpha x_1 + (1 - \alpha)x_2)</tex>.
Если же всё время неравенство противоположно, то функция называется выпуклой вниз.
}}
В силу того, что было сказано о выпуклой комбинации, определение корректно: <tex>\alpha x_1 + (1 - \alpha)x_2 \in [a; b]</tex>.
Легко понять, что с геометрической точки это значит, что для выпуклой вверх функции её график будет лежать выше хорды.
Замечание: если <tex>f(x)</tex> выпукла вниз, то <tex>-f(x)</tex> выпукла вверх.
== Неравенство Йенсена ==
Пусть <tex>f(x)</tex> выпукла вверх на <tex>[a; b]</tex>. Тогда <tex>\forall x_1; x_2 \ldots x_n \in [a; b]</tex> и их выпуклой комбинации выполнено неравенство
<tex>\sum\limits_{k = 1}^n \alpha_k f(x_k) \leq f\left(\sum\limits_{k = 1}^n \alpha_k x_k\right)</tex>.
Докажем по индукции.
База: <tex>n = 2</tex>. Неравенство превращается в определение выпуклой вверх функции, для которой это, очевидно, выполняется.
Переход. Пусть это верно для <tex>n</tex>. Докажем, что это верно для <tex>n + 1</tex>:
<tex>\sum\limits_{k = 1}^{n + 1} \alpha_k = 1</tex>, обозначим за <tex>s_n = \sum\limits_{k = 1}^n \alpha_k</tex>
Пусть <tex>\beta_k = \frac{\alpha_k}{s_n}</tex>. Тогда <tex>\sum\limits_{k = 1}^{n + 1} = 1</tex>. Тогда получаем: ????
<tex>
\sum\limits_{k = 1}^{n + 1} \alpha_k f(x_k) =
s_n \sum\limits_{k = 1}^n \beta_k f(x_k) + \alpha_{n + 1}f(x_{n + 1}) \leq
s_n f(\sum\limits_{k = 1}^n \beta_k x_k + \alpha_{n + 1}x_{n + 1}) \leq </tex> (так как <tex>s_n + \alpha_{n + 1} = 1</tex>)
<tex> f(\sum\limits_{k = 1}^{n + 1} \alpha_k x_k)</tex>
Значит, шаг индукции проделан, нерваенство доказано для произвольного <tex>n</tex>.
Применим линейную интерполяцию (в случае <tex>2</tex> узлов) чтобы выяснить связь между выпуклостью и дифферинцируемостью функции <tex>f</tex>.
Будем считать, что <tex>f</tex> дифференцируема столько раз, сколько нам нужно. Имея <tex>2</tex> узла на <tex>\langle a; b\rangle</tex> и <tex>y_0 = f(x_0)</tex>, <tex>y_1 = f(x_1)</tex>,
составим <tex>L_n(x)</tex>:
<tex>L_n(x) = y_0 \frac{x - x_1}{x_0 - x_1} + y_1\frac{x - x_0}{x_1 - x_0}</tex> — прямая, проходящая через точки <tex>(x_0, y_0)</tex> и <tex>(x_1, y_1)</tex>.
Значит, между <tex>x_0</tex> и <tex>x_1</tex> получаем хорду, соединяющую две точки графика.
В вопросе о выпуклости надо проверять знак такой разности:
<tex>f(x) - L_n(x) = \frac{f^{(2)}(c_x)}{2!}(x - x_0)(x - x_1)</tex>, <tex>x_0 \leq x \leq x_1</tex>.
Если <tex>f^{(2)} = 0</tex> на <tex>\langle a; b\rangle</tex> то правая часть будет неотрицательная, так как <tex>x \in [x_0; x_1]</tex>, поэтому
<tex>f(x) - L_n(x) \leq 0</tex>, так как <tex>x_0</tex> и <tex>x_1</tex> произвольны, то <tex>f</tex> выпукла вверх.
Итак, <tex>f^{(2)} = 0 \Rightarrow f </tex> — выпукла вверх.
2) Пусть <tex>f</tex> выпукла вверх. Будем считать, что <tex>f^{(2)}</tex> — непрерывна. <tex>x \in \langle a; b\rangle</tex>.
<tex>x_0 = x - \Delta x</tex>, <tex>x_1 = x + \Delta x</tex>, где <tex>\Delta x</tex> — малое положительное число.
<tex>f(t) - L_n(t) = \frac{f^{(2)}(c_t)}{2!} (t - x_0)(t - x_1), \, (t - x_0)(t - x_1) < 0 \Rightarrow f^{(2)}(c_t) \leq 0</tex>
<tex>c_t \in \langle x - \Delta x; x + \Delta x \rangle</tex>
<tex>\Delta x \to 0 : x_0 \to x : f^{(2)}(x) \leq 0</tex>
Если <tex>f</tex> выпукла вверх, то <tex>f^{(2)} \leq 0</tex>.
В качестве примера рассмотрим <tex>y = \ln x</tex>, <tex>y^{(2)} = \frac{-1}{x^2} \leq 0 \Rightarrow \ln x</tex> выпукла вверх.
Это мы применим в следующем параграфе.
такие, что <tex>\sum\limits_{i = 1}^n \alpha_i = 1</tex>.
{{Определение
|definition=
Выпуклая комбинация чисел <tex>x_k</tex> — <tex>\bar x = \sum\limits_{i = 1}^n \alpha_kx_k</tex>
}}
Частный случай — <tex>\alpha_k = \frac1n</tex>. В этом случае <tex>\bar x</tex> — среднее арифметическое.
Обозначим за <tex>x_* = \min \{x_1; x_2; \ldots x_n \}</tex>, а <tex>x^* = \max \{x_1; x_2; \ldots x_n \}</tex>. Тогда <tex>x_* \leq \bar x \leq x^*</tex>, а так как
<tex>x_* \in [a; b]</tex> и <tex>x^* \in [a; b]$, то $\bar x \in [a; b]</tex>.
В этом смысле отрезок — выпуклое множество, так как он содержит выпуклую комбинацию любых своих чисел.
(типа определение) Выпуклое множество вместе с парой своих точек содержит отрезок, их соединяющий.
{{Определение
|definition=
Пусть <tex>f(x)</tex> задана на <tex>[a; b]</tex>. Тогда она выпукла вверх на этом отрезке, если
<tex>\forall x_1, x_2 \in [a; b] \forall \alpha \in [0; 1] \quad \alpha f(x_1) + (1 - \alpha) f(x_2) \leq f(\alpha x_1 + (1 - \alpha)x_2)</tex>.
Если же всё время неравенство противоположно, то функция называется выпуклой вниз.
}}
В силу того, что было сказано о выпуклой комбинации, определение корректно: <tex>\alpha x_1 + (1 - \alpha)x_2 \in [a; b]</tex>.
Легко понять, что с геометрической точки это значит, что для выпуклой вверх функции её график будет лежать выше хорды.
Замечание: если <tex>f(x)</tex> выпукла вниз, то <tex>-f(x)</tex> выпукла вверх.
== Неравенство Йенсена ==
Пусть <tex>f(x)</tex> выпукла вверх на <tex>[a; b]</tex>. Тогда <tex>\forall x_1; x_2 \ldots x_n \in [a; b]</tex> и их выпуклой комбинации выполнено неравенство
<tex>\sum\limits_{k = 1}^n \alpha_k f(x_k) \leq f\left(\sum\limits_{k = 1}^n \alpha_k x_k\right)</tex>.
Докажем по индукции.
База: <tex>n = 2</tex>. Неравенство превращается в определение выпуклой вверх функции, для которой это, очевидно, выполняется.
Переход. Пусть это верно для <tex>n</tex>. Докажем, что это верно для <tex>n + 1</tex>:
<tex>\sum\limits_{k = 1}^{n + 1} \alpha_k = 1</tex>, обозначим за <tex>s_n = \sum\limits_{k = 1}^n \alpha_k</tex>
Пусть <tex>\beta_k = \frac{\alpha_k}{s_n}</tex>. Тогда <tex>\sum\limits_{k = 1}^{n + 1} = 1</tex>. Тогда получаем: ????
<tex>
\sum\limits_{k = 1}^{n + 1} \alpha_k f(x_k) =
s_n \sum\limits_{k = 1}^n \beta_k f(x_k) + \alpha_{n + 1}f(x_{n + 1}) \leq
s_n f(\sum\limits_{k = 1}^n \beta_k x_k + \alpha_{n + 1}x_{n + 1}) \leq </tex> (так как <tex>s_n + \alpha_{n + 1} = 1</tex>)
<tex> f(\sum\limits_{k = 1}^{n + 1} \alpha_k x_k)</tex>
Значит, шаг индукции проделан, нерваенство доказано для произвольного <tex>n</tex>.
Применим линейную интерполяцию (в случае <tex>2</tex> узлов) чтобы выяснить связь между выпуклостью и дифферинцируемостью функции <tex>f</tex>.
Будем считать, что <tex>f</tex> дифференцируема столько раз, сколько нам нужно. Имея <tex>2</tex> узла на <tex>\langle a; b\rangle</tex> и <tex>y_0 = f(x_0)</tex>, <tex>y_1 = f(x_1)</tex>,
составим <tex>L_n(x)</tex>:
<tex>L_n(x) = y_0 \frac{x - x_1}{x_0 - x_1} + y_1\frac{x - x_0}{x_1 - x_0}</tex> — прямая, проходящая через точки <tex>(x_0, y_0)</tex> и <tex>(x_1, y_1)</tex>.
Значит, между <tex>x_0</tex> и <tex>x_1</tex> получаем хорду, соединяющую две точки графика.
В вопросе о выпуклости надо проверять знак такой разности:
<tex>f(x) - L_n(x) = \frac{f^{(2)}(c_x)}{2!}(x - x_0)(x - x_1)</tex>, <tex>x_0 \leq x \leq x_1</tex>.
Если <tex>f^{(2)} = 0</tex> на <tex>\langle a; b\rangle</tex> то правая часть будет неотрицательная, так как <tex>x \in [x_0; x_1]</tex>, поэтому
<tex>f(x) - L_n(x) \leq 0</tex>, так как <tex>x_0</tex> и <tex>x_1</tex> произвольны, то <tex>f</tex> выпукла вверх.
Итак, <tex>f^{(2)} = 0 \Rightarrow f </tex> — выпукла вверх.
2) Пусть <tex>f</tex> выпукла вверх. Будем считать, что <tex>f^{(2)}</tex> — непрерывна. <tex>x \in \langle a; b\rangle</tex>.
<tex>x_0 = x - \Delta x</tex>, <tex>x_1 = x + \Delta x</tex>, где <tex>\Delta x</tex> — малое положительное число.
<tex>f(t) - L_n(t) = \frac{f^{(2)}(c_t)}{2!} (t - x_0)(t - x_1), \, (t - x_0)(t - x_1) < 0 \Rightarrow f^{(2)}(c_t) \leq 0</tex>
<tex>c_t \in \langle x - \Delta x; x + \Delta x \rangle</tex>
<tex>\Delta x \to 0 : x_0 \to x : f^{(2)}(x) \leq 0</tex>
Если <tex>f</tex> выпукла вверх, то <tex>f^{(2)} \leq 0</tex>.
В качестве примера рассмотрим <tex>y = \ln x</tex>, <tex>y^{(2)} = \frac{-1}{x^2} \leq 0 \Rightarrow \ln x</tex> выпукла вверх.
Это мы применим в следующем параграфе.