Из того, что класс [math]\mathrm{BPP}[/math] замкнут относительно дополнения и [math]\mathrm{co}\Sigma_2 = \Pi_2[/math], следует, что достаточно доказать включение [math]\mathrm{BPP} \subset \Sigma_2[/math].
[math]\mathrm{BPP}[/math] можно определить как множество таких языков [math]L[/math], что [math]x \in L \Leftrightarrow \exists[/math] «много» вероятностных лент [math]y: R(x,y)[/math]. [math]\Sigma_2[/math] определяется как множество [math]\{ L \mid x \in L \Leftrightarrow \exists y \forall z R(x, y, z)\}[/math]. Таким образом, необходимо уметь записывать «[math]\exists[/math] много» с помощью кванторов [math]\exists\forall[/math].
Рассмотрим язык [math]G[/math] всех слов длины [math]k[/math] над алфавитом [math]\{0, 1\}[/math] для некоторого [math]k[/math], значение которого будет получено позже. Определим операцию [math]\oplus[/math] над словами из этого языка как побитовое исключающее или.
Назовем [math]X[/math], содержащееся в [math]G[/math], большим, если существует набор [math]g_1, g_2, \dots g_k[/math] такой, что [math]\bigcup_{i=1}^{k} g_i \oplus X = G[/math].
Если [math]k|X| \lt |G|[/math], то [math]X[/math] точно не является большим. Найдем достаточное условие, при котором [math]X[/math] большой.
Воспользуемся утверждением, что если вероятность [math]P(x \in A) \gt 0[/math], то существует [math]x[/math] из [math]A[/math]. Для этого
выберем случайно набор [math]\{g_i\}[/math].
Для некотрого [math]y \in G[/math]:
- [math]P(y \in g_i \oplus X) = P(y \oplus g_i \in X) = \frac{|X|}{|G|}[/math];
- [math]P(y \not \in g_i \oplus X) = 1 - \frac{|X|}{|G|}[/math];
- [math]P(\bigwedge_{i=1}^{k} y \not \in g_i \oplus X) = \left(1 - \frac{|X|}{|G|}\right)^k[/math];
- [math]P(\exists y \in G \bigwedge_{i=1}^{k} y \not \in g_i \oplus X) = |G|\left(1 - \frac{|X|}{|G|}\right)^k[/math].
Если [math]|G|\left(1 - \frac{|X|}{|G|}\right)^k \lt 1[/math], то существует набор [math]\{g_i\}[/math], что для любого [math]y[/math] выполнено [math]\bigvee_{i=1}^{k} y \in g_i \oplus X[/math], а из этого следует, что [math]X[/math] большой.
Рассмотрим язык [math]L \in \mathrm{BPP}[/math]. Не уменьшая общности, можем считать, что программа [math]M[/math], распознающая этот язык, завершается за [math]p(|x|)[/math] шагов и вероятность ошибки не превосходит
[math]\frac{1}{3p(|x|)}[/math], это следует из того, что если запускать программу несколько раз, то время работы растет линейно, а вероятность ошибки
экспоненциально уменьшается.
Зафиксируем [math]x[/math]. Возьмем [math]k = p(|x|)[/math]. Рассмотрим множество начал длины [math]k[/math] вероятностных лент [math]X[/math], на которых
машина [math]M[/math] выдает единицу, то есть [math]X = \{y \in G \mid M(x,y) = 1\}[/math].
Из того, что вероятность ошибки не превосходит [math]\frac1{3k}[/math], следует:
- [math]x \in L \rightarrow \frac{|X|}{|G|} \geqslant 1 - \frac1{3k}[/math];
- [math]x \not \in L \rightarrow \frac{|X|}{|G|} \leqslant \frac1{3k}[/math].
Если [math]x \in L[/math], то:
- [math]\frac{|X|}{|G|} \geqslant 1 - \frac1{3k}[/math];
- [math]1 - \frac{|X|}{|G|} \leqslant \frac1{3k}[/math];
- [math]|G|\left(1 - \frac{|X|}{|G|}\right)^k \leqslant |G| \left(\frac1{3k}\right)^k = \left(\frac2{3k}^k\right) \lt 1[/math], что влечет за собой то, что [math]X[/math] большой.
Если [math]x \not \in L[/math], то [math]\frac{|X|}{|G|} \leqslant \frac1{3k} \lt \frac1k[/math], а, следовательно, [math]X[/math] не является большим.
Таким образом, [math]x \in L \Leftrightarrow \exists k, g_1, g_2, \dots, g_k \forall y \bigvee_{i=1}^{m} y \in g_i \oplus X[/math], то есть
[math]x \in L \Leftrightarrow \exists k, g_1, g_2, \dots, g_k \forall y \bigvee_{i=1}^{m} M(x, y \oplus g_i)[/math],
а, значит, [math]L \in \Sigma_2[/math], [math]\mathrm{BPP} \subset \Sigma_2[/math] и [math]\mathrm{BPP} \subset \Sigma_2 \cap \Pi_2[/math], что и требовалось доказать.