Теорема Лаутемана — различия между версиями

Материал из Викиконспекты
Перейти к: навигация, поиск
(Формулировка)
(Доказательство)
Строка 8: Строка 8:
 
<tex>\mathrm{BPP}</tex> можно определить, как множество таких языков <tex>L</tex>, что <tex>x \in L \Leftrightarrow \exists</tex> «много» вероятностных лент <tex>y: R(x,y)</tex>. <tex>\Sigma_2</tex> определяется, как множество <tex>\{ L \mid x \in L \Leftrightarrow \exists y \forall z R(x, y, z)\}</tex>. Таким образом, необходимо уметь записывать «много» с помощью квантора <tex>\forall</tex>.
 
<tex>\mathrm{BPP}</tex> можно определить, как множество таких языков <tex>L</tex>, что <tex>x \in L \Leftrightarrow \exists</tex> «много» вероятностных лент <tex>y: R(x,y)</tex>. <tex>\Sigma_2</tex> определяется, как множество <tex>\{ L \mid x \in L \Leftrightarrow \exists y \forall z R(x, y, z)\}</tex>. Таким образом, необходимо уметь записывать «много» с помощью квантора <tex>\forall</tex>.
  
Рассмотрим язык <tex>G</tex> — всех слов длины <tex>m</tex> над алфавитом <tex>{0, 1}</tex>, для некоторого <tex>m</tex>, значение которого будет получено позже. Определим операцию <tex>\oplus</tex> над славами из этого языка, как побитовое исключающее или.
+
Рассмотрим язык <tex>G</tex> — всех слов длины <tex>k</tex> над алфавитом <tex>{0, 1}</tex>, для некоторого <tex>k</tex>, значение которого будет получено позже. Определим операцию <tex>\oplus</tex> над славами из этого языка, как побитовое исключающее или.
  
Назовем <tex>X</tex>, содержащееся в <tex>G</tex> большим, если существует набор <tex>g_1, g_2, \dots g_k</tex> (значение <tex>k</tex> тоже будет получено позже) такой, что <tex>\bigcup_{i=1}^{k} g_i \oplus X = G</tex>.
+
Назовем <tex>X</tex>, содержащееся в <tex>G</tex> большим, если существует набор <tex>g_1, g_2, \dots g_k</tex> такой, что <tex>\bigcup_{i=1}^{k} g_i \oplus X = G</tex>.
  
 
Если <tex>k|X| < |G|</tex>, то <tex>X</tex> точное не является большим. Найдем достаточное условие, при котором <tex>X</tex> большой.
 
Если <tex>k|X| < |G|</tex>, то <tex>X</tex> точное не является большим. Найдем достаточное условие, при котором <tex>X</tex> большой.
Строка 24: Строка 24:
 
Если <tex>|G|\left(1 - \frac{|X|}{|G|}\right)^k < 1</tex>, то существует набор <tex>\{g_i\}</tex>, что для любого <tex>y</tex> <tex>\bigwedge_{i=1}^{k} y \not \in g_i \oplus X</tex>, а из этого следует, что <tex>X</tex> большой.  
 
Если <tex>|G|\left(1 - \frac{|X|}{|G|}\right)^k < 1</tex>, то существует набор <tex>\{g_i\}</tex>, что для любого <tex>y</tex> <tex>\bigwedge_{i=1}^{k} y \not \in g_i \oplus X</tex>, а из этого следует, что <tex>X</tex> большой.  
  
Рассмотрим язык <tex>L \in \mathrm{BPP}</tex>.
+
Рассмотрим язык <tex>L \in \mathrm{BPP}</tex>. Не уменьшая общности, можем считать, <tex>p(|x|)</tex> шагов и вероятность ошибки не превосходит
 +
<tex>\frac{1}{3p(|x|)}</tex>, это следует из того, что если запускать программу несколько раз, то время работы растет линейно, а вероятность ошибки
 +
экспоненциально уменьшается. Пусть его распознает машина <tex>M</tex>.
  
<tex>X_x = \{y \mid M(x,y) = 1\}</tex>
+
Зафиксируем <tex>x</tex>. Возьмем <tex>k = p(|x|)</tex>. Рассмотрим множество начал длины <tex>m</tex> вероятностных лент <tex>X</tex>, на которых
 +
машина <tex>M</tex> выдает единицу, то есть <tex>X = \{y \in G \mid M(x,y) = 1\}</tex>.
  
<tex>x \in L \Rightarrow \frac{|X_x|}{|G|} \geqslant 1 - \varepsilon</tex>
+
Из того, что вероятность ошибки не превосходит <tex>\frac1{3k}</tex>, следует:
 +
* <tex>x \in L \Rightarrow \frac{|X|}{|G|} \geqslant 1 - \frac1{3k}</tex>
 +
* <tex>x \not \in L \Rightarrow \frac{|X|}{|G|} \leqslant \frac1{3k}</tex>
  
<tex>x \not \in L \Rightarrow \frac{|X_x|}{|G|} \leqslant \varepsilon</tex>
+
Если <tex>x \in L</tex>, то:
 +
* <tex>\frac{|X|}{|G|} \geqslant 1 - \frac1{3k}</tex>;
 +
* <tex>1 - \frac{|X|}{|G|} \leqslant \frac1{3k}</tex>;
 +
* <tex>|G|\left(1 - \frac{|X|}{|G|}\right)^k \leqslant |G| \frac1{3k}^k = \frac2{3k}^k < 1</tex>, что влечет за собой то, что <tex>X</tex> большой.
 +
 
 +
Если <tex>x \not \in</tex>, то <tex>\frac{|X|}{|G|} \leqslant \frac1{3k} < \frac1k</tex>, а значит <tex>X</tex> не является большим.
 +
 
 +
Таким образом, <tex>x \in L Leftrightarrow \exists k, g_1, g_2, \dots, g_k \forall y \bigvee_{i=1}^{m} y \in g_i \oplus X</tex>, а значит
 +
<tex>L \in \Sigma_2</tex>, <tex>\mathrm{BPP} \subset \Sigma_2</tex> и <tex>\mathrm{BPP} \subset \Sigma_2 \cap \Pi_2</tex>, что и требовалось доказать.

Версия 22:27, 9 апреля 2010

Формулировка

Теорема Лаутемана (Sipser–Lautemann theorem или Sipser–Gács–Lautemann theorem) утверждает, что класс BPP содержится в классах [math]\Sigma_2[/math] и [math]\Pi_2[/math] полиномиальной иерархии.

Доказательство

Из того, что класс [math]\mathrm{BPP}[/math] замкнут относительно дополнения и [math]\mathrm{co}\Sigma_2 = \Pi_2[/math] следует, что достаточно доказать включение [math]\mathrm{BPP} \subset \Sigma_2[/math].

[math]\mathrm{BPP}[/math] можно определить, как множество таких языков [math]L[/math], что [math]x \in L \Leftrightarrow \exists[/math] «много» вероятностных лент [math]y: R(x,y)[/math]. [math]\Sigma_2[/math] определяется, как множество [math]\{ L \mid x \in L \Leftrightarrow \exists y \forall z R(x, y, z)\}[/math]. Таким образом, необходимо уметь записывать «много» с помощью квантора [math]\forall[/math].

Рассмотрим язык [math]G[/math] — всех слов длины [math]k[/math] над алфавитом [math]{0, 1}[/math], для некоторого [math]k[/math], значение которого будет получено позже. Определим операцию [math]\oplus[/math] над славами из этого языка, как побитовое исключающее или.

Назовем [math]X[/math], содержащееся в [math]G[/math] большим, если существует набор [math]g_1, g_2, \dots g_k[/math] такой, что [math]\bigcup_{i=1}^{k} g_i \oplus X = G[/math].

Если [math]k|X| \lt |G|[/math], то [math]X[/math] точное не является большим. Найдем достаточное условие, при котором [math]X[/math] большой.

Выберем случауно набор [math]\{g_i\}[/math].

Для некотрого [math]y \in G[/math]:

  • [math]P(y \in g_i \oplus X) = P(y \oplus g_i \in X) = \frac{|X|}{|G|}[/math],
  • [math]P(y \not \in g_i \oplus X) = 1 - \frac{|X|}{|G|}[/math]
  • [math]P(\bigwedge_{i=1}^{k} y \not \in g_i \oplus X) = \left(1 - \frac{|X|}{|G|}\right)^k[/math]
  • [math]P(\exists y \in G \bigwedge_{i=1}^{k} y \not \in g_i \oplus X) = |G|\left(1 - \frac{|X|}{|G|}\right)^k[/math]

Если [math]|G|\left(1 - \frac{|X|}{|G|}\right)^k \lt 1[/math], то существует набор [math]\{g_i\}[/math], что для любого [math]y[/math] [math]\bigwedge_{i=1}^{k} y \not \in g_i \oplus X[/math], а из этого следует, что [math]X[/math] большой.

Рассмотрим язык [math]L \in \mathrm{BPP}[/math]. Не уменьшая общности, можем считать, [math]p(|x|)[/math] шагов и вероятность ошибки не превосходит [math]\frac{1}{3p(|x|)}[/math], это следует из того, что если запускать программу несколько раз, то время работы растет линейно, а вероятность ошибки экспоненциально уменьшается. Пусть его распознает машина [math]M[/math].

Зафиксируем [math]x[/math]. Возьмем [math]k = p(|x|)[/math]. Рассмотрим множество начал длины [math]m[/math] вероятностных лент [math]X[/math], на которых машина [math]M[/math] выдает единицу, то есть [math]X = \{y \in G \mid M(x,y) = 1\}[/math].

Из того, что вероятность ошибки не превосходит [math]\frac1{3k}[/math], следует:

  • [math]x \in L \Rightarrow \frac{|X|}{|G|} \geqslant 1 - \frac1{3k}[/math]
  • [math]x \not \in L \Rightarrow \frac{|X|}{|G|} \leqslant \frac1{3k}[/math]

Если [math]x \in L[/math], то:

  • [math]\frac{|X|}{|G|} \geqslant 1 - \frac1{3k}[/math];
  • [math]1 - \frac{|X|}{|G|} \leqslant \frac1{3k}[/math];
  • [math]|G|\left(1 - \frac{|X|}{|G|}\right)^k \leqslant |G| \frac1{3k}^k = \frac2{3k}^k \lt 1[/math], что влечет за собой то, что [math]X[/math] большой.

Если [math]x \not \in[/math], то [math]\frac{|X|}{|G|} \leqslant \frac1{3k} \lt \frac1k[/math], а значит [math]X[/math] не является большим.

Таким образом, [math]x \in L Leftrightarrow \exists k, g_1, g_2, \dots, g_k \forall y \bigvee_{i=1}^{m} y \in g_i \oplus X[/math], а значит [math]L \in \Sigma_2[/math], [math]\mathrm{BPP} \subset \Sigma_2[/math] и [math]\mathrm{BPP} \subset \Sigma_2 \cap \Pi_2[/math], что и требовалось доказать.