Граница Чернова — различия между версиями

Материал из Викиконспекты
Перейти к: навигация, поиск
Строка 3: Строка 3:
 
}}
 
}}
  
==Неравенство и его доказательство==
+
==Абсолютная оценка==
 
{{Теорема
 
{{Теорема
 
| id = thChernov
 
| id = thChernov
| about = Граница Чернова
+
| about = Граница Чернова (аддитивная форма)
 
| statement = Пусть даны <tex>X_1 X_2 \ldots X_n</tex> {{---}} одинаково распределенные независимые случайные величины, принимающие значения из множества <tex>\{0, 1\}</tex>,
 
| statement = Пусть даны <tex>X_1 X_2 \ldots X_n</tex> {{---}} одинаково распределенные независимые случайные величины, принимающие значения из множества <tex>\{0, 1\}</tex>,
  
Строка 51: Строка 51:
 
}}
 
}}
  
== Пример ==
+
== Относительная оценка ==
Граница Чернова используется, когда нужно оценить вероятность того, что сумма одинаково распределенных событий будет отличаться от матожидания этой суммы больше чем на <tex>\delta</tex>
 
 
Пусть монетку подбросили 1000 раз. Оценить вероятность того, что выпало больше 550 орлов.
 
  
<tex>m = {E} \sum\limits_{i=1}^{n} X_i  = n{E} X_i = \dfrac{n}{2}</tex>
+
{{Определение
 +
  |definition = '''Производящая функция моментов''' (англ. ''moment-generating function'') случайной величины <tex>X</tex> {{---}} функция из <tex>\mathbb R</tex> в <tex>\mathbb R</tex>, определяемая как: <br>
 +
<tex>M_x(t) =</tex> <tex>{E}(e^{tX})</tex>.
 +
}}
  
<tex>\delta = \dfrac{1}{20}</tex>
+
{{Определение
 +
  |definition = Распишем производящую функцию моментов по формуле Тейлора: <br>
 +
<tex>M_x(t) =</tex> <tex>{E}(e^{tX}) =</tex> <tex>{E}(1 + tX + \dfrac{1}{2}t^2 X^2 + \cdots + \dfrac{1}{n!}t^n X^n + \cdots =</tex> <tex>\sum\limits_{1}^{\infty} \dfrac{1}{i!} {E}(X^i)</tex> <br>
 +
Величина <tex>{E}(X^i)</tex> называется '''моментом''' (англ. ''moment'') случайной величины <tex>X</tex>.
 +
}}
  
<tex>{P} (|\dfrac{1}{n} \sum\limits_{i=1}^{n} X_i - \dfrac{1}{2}| \geqslant \dfrac{1}{20}) \leqslant 2e^{-2 \dfrac{1000}{400}} = 2e^{-5}</tex>
+
{{Лемма
 +
|id=lemma1
 +
|statement= <tex>X</tex>, <tex>Y</tex> {{---}} независимые случайные величины, тогда:<br>
 +
<tex>{E}(e^{tX}e^{tY}) = {E}(e^{tX}){E}(e^{tY})</tex>
 +
}}
 +
 
 +
{{Лемма
 +
|id=lemma2
 +
|statement= <tex>X</tex> {{---}} независимая случайная величина принимающая значения из множества <tex>\{0, 1\}</tex>, <tex>{P}(X = 1) = p</tex>, <tex>{P}{(X = 0) = 1 - p}</tex>, тогда для любого <tex>t \in \mathbb{R}</tex>: <br>
 +
<tex>{E}e^{t X} \leqslant e^{p(e^t - 1)}</tex>
 +
}}
 +
 
 +
{{Теорема
 +
| id = thChernov
 +
| about = Граница Чернова (мультипликативная форма)
 +
| statement = Пусть даны <tex>X_1 X_2 \ldots X_n</tex> {{---}} независимые случайные величины, принимающие значения из множества <tex>\{0, 1\}</tex>, <tex>{P}(X_i = 1) = p</tex>, <tex>{P}{(X_i = 0) = 1 - p}</tex>
 +
 
 +
<tex>X = \sum_{i=1}^{n} X_i</tex>
 +
 
 +
<tex>m = {E}X = np</tex>
 +
 
 +
Тогда:
 +
 
 +
<tex>{P} (X \geqslant (1 + \delta)m) \leqslant e^{- \frac{\delta^2}{2 + \delta}m }</tex>, для <tex>\delta > 0</tex>
 +
<tex>{P} (X \leqslant (1 - \delta)m) \leqslant e^{- \frac{\delta^2}{2}m }</tex>, для <tex>0 < \delta < 1</tex>
 +
| proof =
 +
По [[Неравенство Маркова| неравенству Маркова]]:
 +
<tex>{P}(x \geqslant a) =</tex> <tex>{P}(e^x \geqslant e^a) \leqslant </tex> <tex>\dfrac{{E}(e^tX)}{e^a}</tex>
 +
 
 +
Воспользуемся [[#lemma1|первой]] и [[#lemma2|второй]] леммами:
 +
 
 +
<tex>\dfrac{{E}(e^tX)}{e^a} \leqslant</tex> <tex>\dfrac{\prod\limits{i = 1}{n}e^{p(e^t - 1)}}{e^{a}} =</tex> <tex>\dfrac{e^{(e^t - 1)\sum\limits{i = 1}{n}p}}{e^{a}}</tex>
 +
 
 +
Заметим, что <tex>\sum\limits{i = 1}{n} p = m</tex>, кроме того <tex>a = (1 + \delta)m</tex> (по замене).
 +
 
 +
<tex>\dfrac{e^{(e^t - 1)\sum\limits{i = 1}{n}}}{e^{a}} = </tex> <tex>e^{m(e^t - 1 - t - t\delta)}</tex>
 +
 
 +
Функция <tex>e^{m(e^t - 1 - t - t\delta)}</tex> принимает своё минимальное значение в точке <tex>t = \ln (1 + \delta)</tex>
 +
 
 +
Воспользуемся неравенством (<tex>x > 0</tex>): <tex>\ln(1 + x) \geqslant \dfrac{x}{1 + x^2}</tex>, для оценки выражения <tex>m(\delta - (1 + \delta)\ln(1 + \delta))</tex>:
 +
 
 +
<tex>m(\delta - (1 + \delta)\ln(1 + \delta)) \leqslant</tex> <tex>- \dfrac{\delta^2}{2 + \delta}m</tex>
 +
 
 +
Отсюда:
 +
 
 +
<tex>{P} (X \geqslant (1 + \delta)m) \leqslant e^{- \frac{\delta^2}{2 + \delta}m }</tex>, для <tex>\delta > 0</tex>
 +
 
 +
Второе неравенство доказывается аналогично.
 +
}}
  
 
== См. также ==
 
== См. также ==
 
* [[Неравенство Маркова]]
 
* [[Неравенство Маркова]]
 
* [[Математическое ожидание случайной величины]]
 
* [[Математическое ожидание случайной величины]]
 
+
 
== Источники информации ==
 
== Источники информации ==
 
* [https://www.lektorium.tv/lecture/12871 Лекториум CS-центра {{---}} Лекция Дмитрия Ицыксона]
 
* [https://www.lektorium.tv/lecture/12871 Лекториум CS-центра {{---}} Лекция Дмитрия Ицыксона]
 +
* [https://en.wikipedia.org/wiki/Chernoff_bound Wikipedia {{---}} Chernoff bound]
  
 
[[Категория: Дискретная математика и алгоритмы]]
 
[[Категория: Дискретная математика и алгоритмы]]
 
[[Категория: Теория вероятности]]
 
[[Категория: Теория вероятности]]

Версия 15:59, 22 апреля 2019

Определение:
Граница Чернова (англ. Chernoff bound) дает оценку вероятности того, что сумма n одинаково распределенных независимых случайных величин больше (или меньше) некоторого значения.


Абсолютная оценка

Теорема (Граница Чернова (аддитивная форма)):
Пусть даны [math]X_1 X_2 \ldots X_n[/math] — одинаково распределенные независимые случайные величины, принимающие значения из множества [math]\{0, 1\}[/math],

[math]m = {E} \sum\limits_{i=1}^{n} X_i[/math],

Тогда:

[math]{P} (|\dfrac{1}{n} \sum\limits_{i=1}^{n} X_i - \dfrac{1}{n} m| \geqslant \delta) \leqslant 2e^{-2 \delta ^2 n}[/math]
Доказательство:
[math]\triangleright[/math]

Так как [math]X_1 X_2 \ldots X_n[/math] — одинаково распределенные и принимают значения из множества [math]\{0, 1\}[/math]:

[math]{P}(X_i = 1) = p[/math]

[math]{P}{(X_i = 0) = 1 - p = q}[/math]

[math]{E} X_i = p[/math]


Пусть [math]\bar{X_i} = X_i - p[/math], тогда [math]{E}\bar{X_i} = 0[/math]

Преобразуем выражение [math]{P} (\dfrac{1}{n} \sum\limits_{i=1}^{n} X_i - \dfrac{1}{n} m \geqslant \delta)[/math]. ([math]t[/math] — любое положительное число):

[math]{P}(\dfrac{1}{n}\sum\limits_{i=1}^{n} X_i - \dfrac{1}{n} m \geqslant \delta) = {P} (\dfrac{1}{n}\sum\limits_{i=1}^{n}\bar{X_i} \geqslant \delta) = {P}(e^{t\sum\limits_{i=1}^{n} \bar{X_i}} \geqslant e^{t \delta n})[/math]

Используем неравенство Маркова для оценки полученного выражения:

[math]{P}(e^{ t\sum\limits_{i=1}^{n}\bar{X_i}} \geqslant e^{t \delta n}) \leqslant \dfrac{{E} (e^{ t\sum\limits_{i=1}^{n}\bar{X_i}})}{e^{t \delta n}}[/math]

Матожидание можно преобразовать:

[math]{E} (e^{ t\sum\limits_{i=1}^{n}\bar{X_i}}) = \prod\limits_{i = 1}^{n}{E}(e^{t \bar{X_i}})[/math]

Оценим [math]{E}(e^{t \bar{X_i}})[/math] с учётом того, что [math]p \in [0, 1][/math]

[math]{E}(e^{t \bar{X_i}}) = p e^{tq} + qe^{-pt} \leqslant e ^ {\frac{t^2}{8}}[/math]

[math]{P}(e^{ t\sum\limits_{i=1}^{n}\bar{X_i}} \geqslant e^{t \delta n}) \leqslant \dfrac{e^{n\frac{t^2}{8}}}{e^{t \delta n}}[/math]

При [math]t = 4\delta[/math]: [math]\mathbb {P}(e^{ t\sum\limits_{i=1}^{n}\bar{X_i}} \geqslant e^{t \delta n}) \leqslant e^{-2 \delta^2 n}[/math]

Аналогично доказывается, что: [math]{P} (\dfrac{1}{n} \sum\limits_{i=1}^{n} X_i - \dfrac{1}{n} m \leqslant -\delta) \leqslant e^{-2 \delta^2 n}[/math]

Таким образом: [math]{P} (|\dfrac{1}{n} \sum\limits_{i=1}^{n} X_i - \dfrac{1}{n} m| \geqslant \delta) \leqslant 2e^{-2 \delta ^2 n}[/math]
[math]\triangleleft[/math]

Относительная оценка

Определение:
Производящая функция моментов (англ. moment-generating function) случайной величины [math]X[/math] — функция из [math]\mathbb R[/math] в [math]\mathbb R[/math], определяемая как:
[math]M_x(t) =[/math] [math]{E}(e^{tX})[/math].


Определение:
Распишем производящую функцию моментов по формуле Тейлора:

[math]M_x(t) =[/math] [math]{E}(e^{tX}) =[/math] [math]{E}(1 + tX + \dfrac{1}{2}t^2 X^2 + \cdots + \dfrac{1}{n!}t^n X^n + \cdots =[/math] [math]\sum\limits_{1}^{\infty} \dfrac{1}{i!} {E}(X^i)[/math]

Величина [math]{E}(X^i)[/math] называется моментом (англ. moment) случайной величины [math]X[/math].


Лемма:
[math]X[/math], [math]Y[/math] — независимые случайные величины, тогда:
[math]{E}(e^{tX}e^{tY}) = {E}(e^{tX}){E}(e^{tY})[/math]
Лемма:
[math]X[/math] — независимая случайная величина принимающая значения из множества [math]\{0, 1\}[/math], [math]{P}(X = 1) = p[/math], [math]{P}{(X = 0) = 1 - p}[/math], тогда для любого [math]t \in \mathbb{R}[/math]:
[math]{E}e^{t X} \leqslant e^{p(e^t - 1)}[/math]
Теорема (Граница Чернова (мультипликативная форма)):
Пусть даны [math]X_1 X_2 \ldots X_n[/math] — независимые случайные величины, принимающие значения из множества [math]\{0, 1\}[/math], [math]{P}(X_i = 1) = p[/math], [math]{P}{(X_i = 0) = 1 - p}[/math]

[math]X = \sum_{i=1}^{n} X_i[/math]

[math]m = {E}X = np[/math]

Тогда:

[math]{P} (X \geqslant (1 + \delta)m) \leqslant e^{- \frac{\delta^2}{2 + \delta}m }[/math], для [math]\delta \gt 0[/math]

[math]{P} (X \leqslant (1 - \delta)m) \leqslant e^{- \frac{\delta^2}{2}m }[/math], для [math]0 \lt \delta \lt 1[/math]
Доказательство:
[math]\triangleright[/math]

По неравенству Маркова: [math]{P}(x \geqslant a) =[/math] [math]{P}(e^x \geqslant e^a) \leqslant [/math] [math]\dfrac{{E}(e^tX)}{e^a}[/math]

Воспользуемся первой и второй леммами:

[math]\dfrac{{E}(e^tX)}{e^a} \leqslant[/math] [math]\dfrac{\prod\limits{i = 1}{n}e^{p(e^t - 1)}}{e^{a}} =[/math] [math]\dfrac{e^{(e^t - 1)\sum\limits{i = 1}{n}p}}{e^{a}}[/math]

Заметим, что [math]\sum\limits{i = 1}{n} p = m[/math], кроме того [math]a = (1 + \delta)m[/math] (по замене).

[math]\dfrac{e^{(e^t - 1)\sum\limits{i = 1}{n}}}{e^{a}} = [/math] [math]e^{m(e^t - 1 - t - t\delta)}[/math]

Функция [math]e^{m(e^t - 1 - t - t\delta)}[/math] принимает своё минимальное значение в точке [math]t = \ln (1 + \delta)[/math]

Воспользуемся неравенством ([math]x \gt 0[/math]): [math]\ln(1 + x) \geqslant \dfrac{x}{1 + x^2}[/math], для оценки выражения [math]m(\delta - (1 + \delta)\ln(1 + \delta))[/math]:

[math]m(\delta - (1 + \delta)\ln(1 + \delta)) \leqslant[/math] [math]- \dfrac{\delta^2}{2 + \delta}m[/math]

Отсюда:

[math]{P} (X \geqslant (1 + \delta)m) \leqslant e^{- \frac{\delta^2}{2 + \delta}m }[/math], для [math]\delta \gt 0[/math]

Второе неравенство доказывается аналогично.
[math]\triangleleft[/math]

См. также

Источники информации