Изменения

Граница Чернова

3711 байт добавлено, 09:08, 29 апреля 2019

м

Нет описания правки

{{Определение

|definition = '''Граница Чернова''' (англ. ''Chernoff bound'') дает оценку вероятности того, что сумма n одинаково распределенных независимых случайных величин больше (или меньше) некоторого значения.

}}

==Производящая функция моментов==

{{Определение

|definition = '''Производящая функция моментов''' (англ. ''moment-generating function'') случайной величины <tex>X</tex> {{---}} функция из <tex>\mathbb R</tex> в <tex>\mathbb R</tex> и определяется как:

<tex>M_x(t) =</tex> <tex>{E}(e^{tX}) =</tex> <tex>{E}(1 + tX + \dfrac{1}{2}t^2 X^2 + \cdots + \dfrac{1}{n!}t^n X^n + \cdots) =</tex> <tex>\sum\limits_{i = 1}^{\infty} \dfrac{1}{i!} {E}(X^i)</tex>

<tex>E(X^i)</tex> называется '''i-ым моментом''' (англ. ''i-th moment'') случайной величины <tex>X</tex>

}}

{{Лемма

|about= О производящей функции моментов суммы случайных величин

|id=lemma1

|statement= Если <tex>X = \sum\limits_{i=1}^{n} X_i</tex>, где <tex>X_1 X_2 \cdots X_n</tex> {{---}} независимые случайные величины, то:

<tex>M_X(t) =</tex><tex> \prod\limits_{i=1}^{n} M_{X_i} (t)</tex>

|proof= <tex>M_X(t) =</tex> <tex>{E}(e^{tX}) =</tex> <tex>{E}(e^{t \sum\limits_{i=1}^{n} {X_i}}) = </tex> <tex>{E}( {\prod\limits_{i=1}^{n} {e^{t X_i}}}) =</tex> <tex>\prod\limits_{i=1}^{n} {{E}( {e^{t X_i}}}) =</tex> <tex> \prod\limits_{i=1}^{n} M_{X_i} (t)</tex>

}}

{{Лемма

|about= Об ограниченности производящей функции моментов

|id=lemma2

|statement= <tex>X</tex> {{---}} независимая случайная величина принимающая значения из множества <tex>\{0, 1\}</tex>, <tex>{P}(X = 1) = p</tex>, <tex>{P}{(X = 0) = 1 - p}</tex>, тогда для любого <tex>t \in \mathbb{R}</tex>:

<tex>M_X(t) =</tex><tex>{E}e^{t X} \leqslant e^{p(e^t - 1)}</tex>

|proof= <tex>M_X(t) =</tex> <tex>{E}e^{t X} = </tex> <tex>pe^t + (1 - p) \cdot 1 =</tex> <tex>1 + p(e^t - 1) \leqslant e^{p(e^t - 1)}</tex>

}}

<tex>{P}(e^{ t\sum\limits_{i=1}^{n}\bar{X_i}} \geqslant e^{t \delta n}) \leqslant \dfrac{{E} (e^{ t\sum\limits_{i=1}^{n}\bar{X_i}})}{e^{t \delta n}}</tex>

[[Математическое ожидание случайной величины| Матожидание]] можно преобразоватьпо :

<tex>{E} (e^{ t\sum\limits_{i=1}^{n}\bar{X_i}}) = </tex> <tex>{E}(\prod\limits_{i = 1}^{n}{e^{\bar{X_i}}}) = </tex> <tex>\prod\limits_{i = 1}^{n}{E}(e^{t \bar{X_i}})</tex>

Оценим <tex>{E}(e^{t \bar{X_i}})</tex> с учётом того, что <tex>p \in [0, 1]</tex>

<tex>{E}(e^{t \bar{X_i}}) = </tex> <tex>p e^{tq} + qe^{-pt} \leqslant e ^ {\frac{t^2}{8}}</tex>

<tex>{P}(e^{ t\sum\limits_{i=1}^{n}\bar{X_i}} \geqslant e^{t \delta n}) \leqslant \dfrac{e^{n\frac{t^2}{8}}}{e^{t \delta n}}</tex>

== Относительная оценка ==

~~{{Определение~~

|definition = '''Производящая функция моментов''' (англ. ''moment-generating function'') случайной величины <tex>X</tex> {{---}} функция из <tex>\mathbb R</tex> в <tex>\mathbb R</tex>, определяемая как:

~~<tex>M_x(t) =</tex> <tex>{E}(e^{tX})</tex>.~~

}}

~~{{Определение~~

~~|definition = Распишем производящую функцию моментов по формуле Тейлора: ~~

~~<tex>M_x(t) =</tex> <tex>{E}(e^{tX}) =</tex> <tex>{E}(1 + tX + \dfrac{1}{2}t^2 X^2 + \cdots + \dfrac{1}{n!}t^n X^n + \cdots =</tex> <tex>\sum\limits_{1}^{\infty} \dfrac{1}{i!} {E}(X^i)</tex> ~~

~~Величина <tex>{E}(X^i)</tex> называется '''моментом''' (англ. ''moment'') случайной величины <tex>X</tex>.~~

}}

~~{{Лемма~~

~~|id=lemma1~~

~~|statement= <tex>X</tex>, <tex>Y</tex> {{---}} независимые случайные величины, тогда: ~~

~~<tex>{E}(e^{tX}e^{tY}) = {E}(e^{tX}){E}(e^{tY})</tex>~~

}}

~~{{Лемма~~

~~|id=lemma2~~

|statement= <tex>X</tex> {{---}} независимая случайная величина принимающая значения из множества <tex>\{0, 1\}</tex>, <tex>{P}(X = 1) = p</tex>, <tex>{P}{(X = 0) = 1 - p}</tex>, тогда для любого <tex>t \in \mathbb{R}</tex>:

~~<tex>{E}e^{t X} \leqslant e^{p(e^t - 1)}</tex>~~

}}

{{Теорема

| statement = Пусть даны <tex>X_1 X_2 \ldots X_n</tex> {{---}} независимые случайные величины, принимающие значения из множества <tex>\{0, 1\}</tex>, <tex>{P}(X_i = 1) = p</tex>, <tex>{P}{(X_i = 0) = 1 - p}</tex>

<tex>X = \~~sum_~~sum\limits_{i=1}^{n} X_i</tex>

| proof =

По [[Неравенство Маркова| неравенству Маркова]]:

<tex>{P}(x \geqslant a) =</tex> <tex>{P}(e^x \geqslant e^a) \leqslant </tex> <tex>\dfrac{{E}(e^{tX})}{e^a}</tex>

Воспользуемся [[#lemma1|~~первой~~леммой о производящей функции моментов суммы случайных величин ]] и [[#lemma2|~~второй~~леммой об ограниченности производящей функции моментов]] ~~леммами~~:

<tex>\dfrac{{E}(e^{tX})}{e^a} \leqslant</tex> <tex>\dfrac{\prod\~~limits~~limits_{i = 1}^{n}e^{p(e^t - 1)}}{e^{a}} =</tex> <tex>\dfrac{e^{(e^t - 1)\sum\~~limits~~limits_{i = 1}^{n}p}}{e^{a}}</tex>

Заметим, что <tex>\sum\~~limits~~limits_{i = 1}^{n} p = m</tex>, кроме того <tex>a = (1 + \delta)m</tex> (по замене).

<tex>\dfrac{e^{(e^t - 1)\sum\~~limits~~limits_{i = 1}^{n}p}}{e^{a}} = </tex> <tex>e^{m(e^t - 1 - t - t\delta)}</tex>

Функция <tex>e^{m(e^t - 1 - t - t\delta)}</tex> принимает своё минимальное значение в точке <tex>t = \ln (1 + \delta)</tex>

Второе неравенство доказывается аналогично.

}}

==Сравнение с оценкой неравенством Чебышева==

Граница Чернова даёт намного более точную оценку, чем неравенство Чебышева.

Пусть честную монету подбросили <tex>N</tex> раз. Оценим вероятность того, что сумма бросков <tex>S</tex> отклонилась от матожидания больше, чем на <tex>\delta = \sqrt{\dfrac{\ln N}{N}}</tex> с помощью [[Неравенство Маркова#Неравенство Чебышева | неравенства Чебышева]] и [[Граница Чернова#Абсолютная оценка | аддитивной формы границы Чернова]]

По неравенству Чебышева: <tex>P(|\dfrac{S}{N} - \dfrac{1}{2}| \geqslant \delta) \leqslant \dfrac{1}{4N\delta^2} = \dfrac{1}{4\ln n}</tex>

Оценка границей Чернова: <tex>P(|\dfrac{S}{N} - \dfrac{1}{2}| \geqslant \delta) \leqslant 2e^{-2N\delta^2} = \dfrac{2}{N^2}</tex>

==Применение==

Оценка границей Чернова используется в решении проблем уравновешивания множеств <ref>[https://en.wikipedia.org/wiki/Set_balancing Wikipedia {{---}} Set balancing]</ref> и маршрутизации пакетов в разреженных сетях.

Задача уравновешивания двух множеств возникает при планировании статистических экспериментов. Обычно при планировании эксперимента известны свойства каждого участника, задача состоит в том, чтобы разделить участников на две группы: контрольную и тестовую, так, чтобы каждое свойство было как можно более сбалансированно между двумя группами.

Граница Чернова используется в теории вычислительного обучения для оценки того, что алгоритм с большой вероятностью имеет небольшую ошибку на достаточно большом наборе обучающих данных.

== См. также ==

* [[Математическое ожидание случайной величины]]

== Примечания ==

== Источники информации ==

* [https://www.lektorium.tv/lecture/12871 Лекториум CS-центра {{---}} Лекция Дмитрия Ицыксона]

* [https://en.wikipedia.org/wiki/Chernoff_bound Wikipedia {{---}} Chernoff bound]

* Michael Mitzenmacher, Eli Upfal. «Probability and Computing: Randomized Algorithms and Probabilistic Analysis» {{---}} «Cambridge University Press», 2005 г. {{---}} 61-83 стр. {{---}} ISBN 0-521-83540-2

* M. Kearns, U. Vazirani. «An Introduction to Computational Learning Theory» {{---}} «MIT Press», 1994 г. {{---}} 190-192 стр. {{---}} ISBN 0-262-11193-4

[[Категория: Дискретная математика и алгоритмы]]

[[Категория: Теория вероятности]]

DespairedController

89

правок

Изменения

Граница Чернова

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты