Граница Чернова — различия между версиями

Текущая версия на 19:17, 4 сентября 2022

Определение:

Граница Чернова (англ. Chernoff bound) дает оценку вероятности того, что сумма n одинаково распределенных независимых случайных величин больше (или меньше) некоторого значения.

Содержание

1 Производящая функция моментов
2 Абсолютная оценка
3 Относительная оценка
4 Сравнение с оценкой неравенством Чебышева
5 Применение
6 См. также
7 Примечания
8 Источники информации

Производящая функция моментов

Определение:

Производящая функция моментов (англ. moment-generating function) случайной величины — функция из в и определяется как:

[math]M_x(t) =[/math] [math]{E}(e^{tX}) =[/math]

называется i-ым моментом (англ. i-th moment) случайной величины

Лемма (О производящей функции моментов суммы случайных величин):

Если , где — независимые случайные величины, то:

Доказательство:

Лемма (Об ограниченности производящей функции моментов):

— независимая случайная величина принимающая значения из множества , , , тогда для любого :

Доказательство:

Абсолютная оценка

Теорема (Граница Чернова (аддитивная форма)):

Пусть даны — одинаково распределенные независимые случайные величины, принимающие значения из множества ,

,

Тогда:

Доказательство:

Так как [math]X_1 X_2 \ldots X_n[/math] — одинаково распределенные и принимают значения из множества [math]\{0, 1\}[/math]:

[math]{P}(X_i = 1) = p[/math]

[math]{P}{(X_i = 0) = 1 - p = q}[/math]

[math]{E} X_i = p[/math]

Пусть [math]\bar{X_i} = X_i - p[/math], тогда [math]{E}\bar{X_i} = 0[/math]

Преобразуем выражение . ([math]t[/math] — любое положительное число):

Используем неравенство Маркова для оценки полученного выражения:

Матожидание можно преобразовать по :

Оценим [math]{E}(e^{t \bar{X_i}})[/math] с учётом того, что [math]p \in [0, 1][/math]

[math]{E}(e^{t \bar{X_i}}) = [/math]

При [math]t = 4\delta[/math]:

Аналогично доказывается, что:

Таким образом:

Относительная оценка

Теорема (Граница Чернова (мультипликативная форма)):

Пусть даны — независимые случайные величины, принимающие значения из множества , ,

[math]m = {E}X = np[/math]

Тогда:

, для [math]\delta \gt 0[/math]

, для

Доказательство:

По неравенству Маркова: [math]{P}(X \geqslant a) =[/math]

Воспользуемся леммой о производящей функции моментов суммы случайных величин и леммой об ограниченности производящей функции моментов:

Заметим, что , кроме того [math]a = (1 + \delta)m[/math] (по замене).

Функция принимает своё минимальное значение в точке [math]t = \ln (1 + \delta)[/math]

Воспользуемся неравенством ([math]x \gt 0[/math]): , для оценки выражения :

Отсюда:

, для [math]\delta \gt 0[/math]

Второе неравенство доказывается аналогично.

Сравнение с оценкой неравенством Чебышева

Граница Чернова даёт намного более точную оценку, чем неравенство Чебышева.

Пусть честную монету подбросили [math]N[/math] раз. Оценим вероятность того, что сумма бросков [math]S[/math] отклонилась от матожидания больше, чем на с помощью неравенства Чебышева и аддитивной формы границы Чернова

По неравенству Чебышева:

Оценка границей Чернова:

Применение

Оценка границей Чернова используется в решении проблем уравновешивания множеств ^[1] и маршрутизации пакетов в разреженных сетях.

Задача уравновешивания двух множеств возникает при планировании статистических экспериментов. Обычно при планировании эксперимента известны свойства каждого участника, задача состоит в том, чтобы разделить участников на две группы: контрольную и тестовую, так, чтобы каждое свойство было как можно более сбалансированно между двумя группами.

Граница Чернова используется в теории вычислительного обучения для оценки того, что алгоритм с большой вероятностью имеет небольшую ошибку на достаточно большом наборе обучающих данных.

См. также

Примечания

↑ Wikipedia — Set balancing

Источники информации

Лекториум CS-центра — Лекция Дмитрия Ицыксона
Wikipedia — Chernoff bound
Michael Mitzenmacher, Eli Upfal. «Probability and Computing: Randomized Algorithms and Probabilistic Analysis» — «Cambridge University Press», 2005 г. — 61-83 стр. — ISBN 0-521-83540-2
M. Kearns, U. Vazirani. «An Introduction to Computational Learning Theory» — «MIT Press», 1994 г. — 190-192 стр. — ISBN 0-262-11193-4

[1] Wikipedia — Set balancing

[1]

@@ Строка 88: / Строка 88: @@
 Тогда:
-<tex>{P} (X \geqslant (1 + \delta)m) \leqslant e^{- \frac{\delta^2}{2 + \delta}m }</tex>, для <tex>\delta > 0</tex>
+<tex>{P} (X \geqslant (1 + \delta)m) \leqslant e^{m(\delta - (1 + \delta)\ln(1 + \delta))} \leqslant e^{- \frac{\delta^2}{2 + \delta}m }</tex>, для <tex>\delta > 0</tex>
 <tex>{P} (X \leqslant (1 - \delta)m) \leqslant e^{- \frac{\delta^2}{2}m }</tex>, для <tex>0 < \delta < 1</tex>
 | proof =
 По [[Неравенство Маркова| неравенству Маркова]]:
-<tex>{P}(x \geqslant a) =</tex> <tex>{P}(e^x \geqslant e^a) \leqslant </tex> <tex>\dfrac{{E}(e^{tX})}{e^a}</tex>
+<tex>{P}(X \geqslant a) =</tex> <tex>{P}(e^{tX} \geqslant e^{ta}) \leqslant </tex> <tex>\dfrac{{E}(e^{tX})}{e^{ta}}</tex>
 Воспользуемся [[#lemma1|леммой о производящей функции моментов суммы случайных величин ]] и [[#lemma2|леммой об ограниченности производящей функции моментов]]:
-<tex>\dfrac{{E}(e^{tX})}{e^a} \leqslant</tex> <tex>\dfrac{\prod\limits_{i = 1}^{n}e^{p(e^t - 1)}}{e^{a}} =</tex> <tex>\dfrac{e^{(e^t - 1)\sum\limits_{i = 1}^{n}p}}{e^{a}}</tex>
+<tex>\dfrac{{E}(e^{tX})}{e^{ta}} \leqslant</tex> <tex>\dfrac{\prod\limits_{i = 1}^{n}e^{p(e^t - 1)}}{e^{ta}} =</tex> <tex>\dfrac{e^{(e^t - 1)\sum\limits_{i = 1}^{n}p}}{e^{ta}}</tex>
 Заметим, что <tex>\sum\limits_{i = 1}^{n} p = m</tex>, кроме того <tex>a = (1 + \delta)m</tex> (по замене).
-<tex>\dfrac{e^{(e^t - 1)\sum\limits_{i = 1}^{n}p}}{e^{a}} = </tex> <tex>e^{m(e^t - 1 - t - t\delta)}</tex>
+<tex>\dfrac{e^{(e^t - 1)\sum\limits_{i = 1}^{n}p}}{e^{ta}} = </tex> <tex>e^{m(e^t - 1 - t - t\delta)}</tex>
 Функция <tex>e^{m(e^t - 1 - t - t\delta)}</tex> принимает своё минимальное значение в точке <tex>t = \ln (1 + \delta)</tex>
@@ Строка 121: / Строка 121: @@
 Пусть честную монету подбросили <tex>N</tex> раз. Оценим вероятность того, что сумма бросков <tex>S</tex> отклонилась от матожидания больше, чем на <tex>\delta = \sqrt{\dfrac{\ln N}{N}}</tex> с помощью [[Неравенство Маркова#Неравенство Чебышева | неравенства Чебышева]] и [[Граница Чернова#Абсолютная оценка | аддитивной формы границы Чернова]]
-По неравенству Чебышева: <tex>P(|\dfrac{S}{N} - \dfrac{1}{2}| \geqslant \delta) \leqslant \dfrac{1}{4N\delta^2} = \dfrac{1}{4\ln n}</tex>
+По неравенству Чебышева: <tex>P(|\dfrac{S}{N} - \dfrac{1}{2}| \geqslant \delta) \leqslant \dfrac{1}{4N\delta^2} = \dfrac{1}{4\ln N}</tex>
 Оценка границей Чернова: <tex>P(|\dfrac{S}{N} - \dfrac{1}{2}| \geqslant  \delta) \leqslant 2e^{-2N\delta^2} = \dfrac{2}{N^2}</tex>

Граница Чернова — различия между версиями

Текущая версия на 19:17, 4 сентября 2022

Содержание

Производящая функция моментов

Абсолютная оценка

Относительная оценка

Сравнение с оценкой неравенством Чебышева

Применение

См. также

Примечания

Источники информации

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты