Протокол Голдвассер-Сипсера для оценки размера множества — различия между версиями

Материал из Викиконспекты
Перейти к: навигация, поиск
(Оценки вероятностей)
(Оценки вероятностей)
Строка 19: Строка 19:
 
Покажем, что для каждого <tex>y \in \left\{0,1\right\}^k</tex> и случайно выбранной функции <tex>h \in H_{m,k}</tex> справедливо <tex>P[\exists x \in S \bigm| h(x) = y] \ge \frac{3}{4} p</tex>.
 
Покажем, что для каждого <tex>y \in \left\{0,1\right\}^k</tex> и случайно выбранной функции <tex>h \in H_{m,k}</tex> справедливо <tex>P[\exists x \in S \bigm| h(x) = y] \ge \frac{3}{4} p</tex>.
  
Для каждого <tex>x \in S</tex> определим [[Вероятностное пространство, элементарный исход, событие|событие]] <tex>E_x = \left\{h \in H_{m, k} \bigm| h(x) = y\right\}</tex>. Тогда <tex>P[\exists x \in S \bigm| h(x) = y] = P[\bigcup \limits_{x \in S}E_x]</tex>, что [[Формула включения-исключения | формуле включения-исключения]] не превосходит <tex>\sum \limits_{x \in S}P[E_x] - \sum\limits_{x_1 \ne x_2 \in S}P[E_{x_1} \cap E_{x_2}]</tex>. Поскольку выбирались <tex>h \in H_{m, k}</tex>, то <tex>P[E_x] = \frac{1}{2^k}</tex> и <tex>P[E_{x_1} \cap E_{x_2}] = \frac{1}{2^{2k}}</tex>. Тогда <tex>P[\bigcup \limits_{x \in S}E_x] \ge \frac{|S|}{2^k} - \frac{1}{2}\frac{|S|^2}{2^{2k}} \ge \frac{3}{4}\frac{|S|}{2^k} \le \frac{3}{4}p</tex>.
+
Для каждого <tex>x \in S</tex> определим [[Вероятностное пространство, элементарный исход, событие|событие]] <tex>E_x = \left\{h \in H_{m, k} \bigm| h(x) = y\right\}</tex>. Тогда <tex>P[\exists x \in S \bigm| h(x) = y] = P[\bigcup \limits_{x \in S}E_x]</tex>, что [[Формула включения-исключения | формуле включения-исключения]] не превосходит <tex>\sum \limits_{x \in S}P[E_x] - \sum\limits_{x_1 \ne x_2 \in S}P[E_{x_1} \cap E_{x_2}]</tex>. Поскольку выбирались <tex>h \in H_{m, k}</tex>, то <tex>P[E_x] = \frac{1}{2^k}</tex> и <tex>P[E_{x_1} \cap E_{x_2}] = \frac{1}{2^{2k}}</tex>. Тогда <tex>P[\bigcup \limits_{x \in S}E_x] \ge \frac{|S|}{2^k} - \frac{1}{2}\frac{|S|^2}{2^{2k}} \ge \frac{3}{4}\frac{|S|}{2^k} \ge \frac{3}{4}p</tex>.
 
}}
 
}}
 
Стоит отметить, что если <tex>|S| > 2^{k - 1}</tex>, то <tex>P</tex> может выбрать <tex>C \subseteq S</tex> так, чтобы <tex>K \le C \le 2^{k - 1}</tex>. А значит, в качестве оценки вероятности можно воспользоваться <tex>\frac{3}{4}p</tex>.
 
Стоит отметить, что если <tex>|S| > 2^{k - 1}</tex>, то <tex>P</tex> может выбрать <tex>C \subseteq S</tex> так, чтобы <tex>K \le C \le 2^{k - 1}</tex>. А значит, в качестве оценки вероятности можно воспользоваться <tex>\frac{3}{4}p</tex>.

Версия 02:14, 4 июня 2012

Описание протокола

Рассмотрим множество [math]S \subseteq \left\{ 0, 1 \right\} ^m[/math], для которого существует сертификат проверки на принадлежность. Протоколом Голдвассера-Сипсера является двухуровневый интерактивный протокол, в котором [math]V[/math] старается принять множество [math]S[/math], если [math]|S| \ge K[/math], и отвергнуть, если [math]|S| \le \frac{K}{2}[/math].

Выберем [math]k[/math] так, чтобы [math]2^{k - 2} \le K \le 2^{k - 1}[/math]. Тогда протокол устроен следующим образом:

[math]V:[/math] Отправляет [math]P[/math], случайным образом выбиранные [math]h : \left\{ 0, 1 \right\} ^ m \rightarrow \left\{ 0, 1 \right\} ^ k[/math] из семейства универсальных попарно независимых хеш-функций [math]H_{m, k}[/math] и [math]y[/math] из [math]\left\{ 0, 1 \right\} ^ k[/math].

[math]P:[/math] Пытается [math]x \in S[/math], такой что [math]h(x) = y[/math]. Отправляет [math]V[/math] найденный [math]x[/math] и сертификат [math]c[/math], подтверждающий принадлежность [math]x[/math] множеству [math]S[/math].

[math]V:[/math] Если верно, что [math]x \in S[/math] и [math]h(x) = y[/math], то множество [math]S[/math] принимается. В противном случае [math]V[/math] отвергает множество [math]S[/math].

Оценки вероятностей

Пусть [math]p = \frac{K}{2^k}[/math]. Если [math]|S| \le \frac{K}{2}[/math], тогда [math]|h(S)| \le \frac{p2^k}{2}[/math]. Отсюда получаем, что [math]P[y \in h(S)] \le \frac{p}{2}[/math]. Необходимо показать, что в случае [math]|S| \ge K[/math], [math]V[/math] будет принимать [math]S[/math] с вероятностью различимо большей [math]\frac{p}{2}[/math].

Утверждение:
Если [math]K \le |S| \le 2^{k - 1}[/math], то [math]P[\exists x \in S \bigm| h(x) = y] \ge \frac{3}{4}\frac{|S|}{2^k}[/math], где [math]h[/math] случайным образом выбрано из [math]H_{m, k}[/math], а [math]y~-[/math] из [math]\left\{0,1\right\}^k[/math].
[math]\triangleright[/math]

Покажем, что для каждого [math]y \in \left\{0,1\right\}^k[/math] и случайно выбранной функции [math]h \in H_{m,k}[/math] справедливо [math]P[\exists x \in S \bigm| h(x) = y] \ge \frac{3}{4} p[/math].

Для каждого [math]x \in S[/math] определим событие [math]E_x = \left\{h \in H_{m, k} \bigm| h(x) = y\right\}[/math]. Тогда [math]P[\exists x \in S \bigm| h(x) = y] = P[\bigcup \limits_{x \in S}E_x][/math], что формуле включения-исключения не превосходит [math]\sum \limits_{x \in S}P[E_x] - \sum\limits_{x_1 \ne x_2 \in S}P[E_{x_1} \cap E_{x_2}][/math]. Поскольку выбирались [math]h \in H_{m, k}[/math], то [math]P[E_x] = \frac{1}{2^k}[/math] и [math]P[E_{x_1} \cap E_{x_2}] = \frac{1}{2^{2k}}[/math]. Тогда [math]P[\bigcup \limits_{x \in S}E_x] \ge \frac{|S|}{2^k} - \frac{1}{2}\frac{|S|^2}{2^{2k}} \ge \frac{3}{4}\frac{|S|}{2^k} \ge \frac{3}{4}p[/math].
[math]\triangleleft[/math]

Стоит отметить, что если [math]|S| \gt 2^{k - 1}[/math], то [math]P[/math] может выбрать [math]C \subseteq S[/math] так, чтобы [math]K \le C \le 2^{k - 1}[/math]. А значит, в качестве оценки вероятности можно воспользоваться [math]\frac{3}{4}p[/math].

Итого:

  1. если [math]|S| \le \frac{K}{2}[/math], то [math]P[|S| \ge K] \le \frac{p}{2}[/math].
  2. если [math]|S| \ge K[/math], то [math]P[|S| \ge K] \ge \frac{3}{4}p[/math].

Источники