Сортирующая сеть глубины O(log N)

Материал из Викиконспекты
Перейти к: навигация, поиск

Ажтаи (Ajtai), Комлос (Komlos) и Шимереди (Szemeredi) сконструировали сортирующую сеть на [math]N[/math] входов глубины [math] O(\log N) [/math], при они не углублялись в исследование значения константы, получавшейся при правильном соблюдении необходимой ассимптотики. Впоследствии Патерсон выяснил, что [math] O(\log N) [/math] можно заменить на [math] c\log_2 N [/math] с константой приблизительно равной [math] 6100 [/math]. Здесь будет описана более поздняя реализация, которая включает в себя меньшую константу [math]c[/math], а именно, будет доказано, что для любого целого числа [math]N[/math] такого,что [math]N \ge 2^{78}[/math] существует сортирующая сеть на [math]N[/math] входов, такая, что глубина в худшем случае будет [math]1830 \log_2 N - 58657 [/math].

Основными составяющими этой конструкции будут сортирующие сети на [math]M[/math] входов, такие ,что [math]M[/math] относительно мало. Мы назовем их [math]M[/math]-сортировщиками. Для любых выбранных положительных целых чисел [math]M[/math] и [math]N[/math] таких что [math] N \ge M[/math], конструкция будет включать в себя [math]N[/math] проводов, и будет сделана из [math]M[/math]-сортировщиков, глубина которых в худшем случае [math](48 + о(1))\log_MN + 115[/math] при [math]M \to \infty[/math]. (Стоит отметить, что асимптотическое [math]o(1)[/math] здесь относится к [math]M[/math], а не к [math]N[/math]).

Разделители

Сначала введем все необходимые понятия для построения сортирующей сети.


Определение:
Идеальным разделителем будем называть сеть, выходные провода которой разделены на K блоков одинакового размера, таких, что принимая на вход любые [math]a[/math] значений, сеть размещает первые [math]a/k[/math] минимальные по величине ключи в первый блок, следующие [math]a/k[/math] по величине ключи – во второй, и т.д.

Эти идеальные разделители могут быть использованы как модули для построения сортирующей сети на [math]N[/math] входов, где [math]N = k^d[/math] для некоторого положительного числа d. Такая сеть будет представлять собой композицию сетей [math]N_0, N_1, N_2 \dots N_{d-1}[/math], где [math]N_t[/math] – парраллельная композиция [math]k^t[/math] идеальных разделителей одинакового размера.

Конструкция сети

[math]\alpha^*(t) = \dfrac{t\log \dfrac{1}{\nu} - \log N + \log(2A\nu k^3)}{\log A}[/math]

[math]\omega^*(t) = \dfrac{t\log \dfrac{1}{\nu} + \log(A\nu k)}{\log Ak}[/math]

[math]\alpha(t) \ge \alpha^*(t),\quad \alpha(t)\equiv t\mod 2 [/math]


[math]\omega(t) \ge \omega^*(t),\quad \omega(t)\equiv t\mod 2 [/math]


[math] O(\log N) [/math] [math] c\log_2 N [/math]


[math] \pi(\alpha(t),t) = \begin{cases} 0,&\text{если $\alpha(t + 1)\gt \alpha(t)$,}\\ \dfrac{\nu}{AK}c(a(t),t), &\text{если $\alpha(t + 1)\gt \alpha(t)$.} \end{cases} [/math]


[math] \pi(i,t) = \dfrac{A\nu k - 1}{A^2k^2}c(i,t),\qquad\quad \text{если $\alpha(t) \lt i \lt \omega(t)$,} [/math]


[math] \pi(\omega(t),t) = \begin{cases} \dfrac{A\nu k - 1}{A^2k^2}c(\omega(t),t),&\text{ $\omega(t + 1)\gt \omega(t)$,}\\ \alpha(\omega(t),t),&\text{если $\omega(t + 1)\lt \omega(t)$,} \end{cases} [/math]


[math] \chi(\alpha(t),t) = \begin{cases} \dfrac{1}{k}c(\alpha(t),t),&\text{ $\alpha(t + 1)\gt \alpha(t)$,}\\ \dfrac{Ak - \nu}{Ak^2}c(\alpha(t),t),&\text{если $\alpha(t + 1)\lt \alpha(t)$,} \end{cases} [/math]


[math] \chi(i,t) = \dfrac{Ak - \nu}{Ak^2}c(i,t),\qquad\quad \text{если $\alpha(t) \lt i \lt \omega(t)$,} [/math]


[math] \pi(\omega(t),t) = \begin{cases} \alpha(\omega(t + 1), t + 1)), &\text{ $\omega(t + 1)\gt \omega(t)$,}\\ 0,&\text{если $\omega(t + 1)\lt \omega(t)$,} \end{cases} [/math]

[math]\pi(i, t)[/math]

[math]\chi(i, t)[/math]

[math]\alpha(t + 1) \lt \alpha(t)[/math]

[math]c(\alpha(t), t) = (A/\nu)c(\alpha(t + 1), t + 1) \ge 2Ak^2/\nu[/math]

лемма 3.1 Если [math]\alpha(i, t) \neq 0[/math] тогда


[math] \sum\limits^d_{j=0} k^{j-i}a(j, t) = \begin{cases} Nk^{-i}, &\text{ $i = \alpha(t)$,}\\ Nk^{-i} - \dfrac{c(i,t)}{A^2k^2}, &\text{ $i \gt \alpha(t)$,} \end{cases} [/math]


[math]\sum\limits^d_{j=0} k^ja(j, t) = N [/math]


[math] i = \alpha(t) [/math]


[math] a(j,t) = \begin{cases} 0, &\text{ $j \not\equiv i \mod 2$,}\\ c(j, t), &\text{ $j = \alpha(t)$,}\\ (1 - \dfrac{1}{A^2k^2})c(j, t) &\text{ $\alpha(t) \lt j \lt i, \quad j \equiv i \mod 2$} \end{cases} [/math]


[math] c(j, t) = c(i, t)A^{j-i}[/math] когда [math]i\ge\alpha(t)+2[/math]


лемма 3.2 Если [math]\alpha(t + 1) \gt \alpha(t) [/math] тогда [math]\alpha(t) = 0[/math] или [math]c(\alpha(t),t)\le Ak^2/\nu[/math]

[math]\alpha(t+1) \gt \alpha(t) \gt 0[/math]

[math]\alpha(t) - 1 \lt \alpha^*(t + 1) [/math]

[math]c(\alpha(t),t) \lt 2Ak^2/\nu[/math]

Анализ сети

[math](\dfrac{1}{k} + \dfrac{\mu\delta kA^2}{1 - \delta^2k^2A^2})c(i,t)[/math]


[math] \dfrac{1}{k}(Nk^{-i} - c(i,t)) [/math]


[math] \sum\limits_{j\ge 1} k^{2j-1}\mu\delta^{2j-1}c(i+2j, t) [/math]


[math] \sum\limits_{j\ge 1} (k\delta)^{2j-1}c(i+2j, t) = c(i,t)\sum\limits_{j\ge 1} (k\delta)^{2j-1}A^{2j} \lt c(i,t)\dfrac{\delta k A^2}{1-\delta^2k^2A^2} [/math]

[math]\dfrac{1}{k}Nk^{-i}[/math]


лемма 4.2

[math](\mu + (k - 1)\dfrac{\mu\delta k A^2}{1 - \delta^2k^2A^2} + \dfrac{A\nu k - 2A\nu + 1}{2k^2A^2} + \varepsilon_B)c(i,t)[/math]


[math]c=c(i, t), \quad a=a(i,t),\quad \pi=\pi(i,t), \quad \chi=\chi(i, t) [/math]


[math]\Delta_1 = \dfrac{\mu\delta kA^2}{1-\delta^2k^2A^2}c[/math]


[math]\Delta_2 = \dfrac{\nu}{1 - \delta^2k^2A^2}c[/math]

dfrac [math] \Delta = \begin{cases} \Delta_1,&\text{ $i = \alpha(t) \lt \alpha(t+1)$,}\\ \Delta_2,&\text{ $i = \omega(t) \lt \omega(t+1)$,}\\ \Delta_1 + \Delta_2,&\text{если $\alpha(t) \lt i \lt \omega(t) \quad ||\quad i = \alpha(t) \gt \alpha(t + 1), t \ge 2$,} \end{cases} [/math]


[math](k - 1)\Delta - \dfrac{1}{2}\pi \le (k - 1)\Delta_1 + \dfrac{A\nu k - 2A\nu + 1}{2A^2k^2}c [/math]


лемма 4.3

[math] \varepsilon^* \le \dfrac{\mu}{k},[/math]

[math](\mu + (k - 1)\dfrac{\mu\delta k A^2}{1 - \delta^2k^2A^2} + \dfrac{A\nu k - 2A\nu + 1}{2k^2A^2} + \varepsilon_B)\dfrac{1}{A\nu} + \mu\delta\dfrac{Ak}{\nu} \le \mu [/math]

Лемма 4.4

[math]\mu \le \dfrac{\nu}{Ak^2}, [/math]


[math]\mu\le\dfrac{1}{2}\delta_F\dfrac{A\nu k - 1}{A^2k^2},[/math]


[math]\varepsilon_F\dfrac{1}{A\nu} + \delta^2\dfrac{Ak}{\nu} \le \delta [/math]


[math]\dfrac{\pi(i,t)}{c(i,t)} \ge \dfrac{A\nu k - 1}{A^2k^2}[/math]

Лемма 4.5

[math]\mu\delta^rc(\alpha(t_f),t_f) \le 1[/math]

Конструкция разделителей

[math]M \ge 32A^2k^2 [/math]


[math]a=mn, \quad M/32 \lt m \le M/16 [/math]


[math]|F_j|=fn,\quad|B_j|=bn[/math]


[math]|F_j|=2^s f_0,\quad|B_j|=2^s b_0[/math]


[math]2f_0+kb_0 \lt 2A^2k62 :[/math]


[math]i=\alpha(t) \lt \alpha(t+1) [/math]

[math]f_0 = 0, \qquad b_0=1, \qquad 2^s = \dfrac{a(i,t)}{k}, [/math]


[math]i=\alpha(t) \gt \alpha(t+1) [/math]

[math]f_0 = \dfrac{k}{2}, \qquad b_0=\dfrac{Ak}{\nu} -1, \qquad 2^s = \dfrac{\nu c(i,t)}{Ak^2}, [/math]


[math]\alpha(t) \lt i \lt \omega(t) [/math]

[math]f_0 = A\nu k - 1, \qquad b_0=2A^2k - 2A\nu, \qquad 2^s = \dfrac{c(i,t)}{2A^2k^2}, [/math]


[math]i=\omega(t) \lt \omega(t + 1) [/math] [math]t\ge 2[/math]

[math]f_0 = A\nu k - 1, \qquad b_0=2A^2k\dfrac{Nk^{-i}}{c(i,t)} - 2A\nu, \qquad 2^s = \dfrac{c(i,t)}{2A^2k^2}, [/math]


[math]i=\omega(t) \lt \omega(t + 1) [/math]

[math]c(i,t) = c(i+1,t+1)/A\nu \lt AkN^{-i}/\nu[/math]

[math]m_0 = 2f_0 + kb_0 [/math]

[math]a 2^s m_0[/math]

[math]m_0 \lt M/16[/math]

[math] 2^r m_0 \le M/16 [/math]

[math] m=2^r m_0, n = a/m, f = 2^r f_0, b = 2^r b_0 [/math]

[math]f \ge \dfrac{\nu}{2Ak} \cdot \dfrac{A\nu k - 1}{A\nu k - \dfrac{\nu}{Ak}}m [/math] где [math] f \neq 0[/math]

Теорема 5.1

[math]m\ge 100, n\ge 16, f\ge 10 [/math]

[math] m = 2f + kb [/math]

[math] \varepsilon_B \ge \sqrt{\dfrac{2(1 + \ln m)}{m}} [/math]

[math] \delta_F \le 1/25 [/math]


[math] \varepsilon_F \ge \dfrac{2}{f - 2}\left (1 + \dfrac{\ln(3e^5f)}{\ln(0.12/e\delta_F)}\right )[/math]

[math] \varepsilon_F \ge 4e/f[/math]

[math]1/\varepsilon_F[/math]


[math]|F_j|=fn,|B_j|=bn[/math]

Анализ разделителей

лемма 6.3 [math] p = \dfrac{1}{kn}\sum\limits _{i=1}^k r_i [/math]

[math]\sum\limits_{i=1}^k|R_i\cap S| \ge (p+t)ks [/math]


[math] \Bigg( \bigg( \dfrac{p}{p+t} \bigg) ^{p+t} \bigg(\dfrac{1-p}{1-p-t}\bigg)^{1-p-t}\Bigg)^{ks} [/math]


[math] \bigg( \dfrac{p}{p+t} \bigg) ^{p+t} \bigg(\dfrac{1-p}{1-p-t}\bigg)^{1-p-t} \lt \exp(-2t^2) [/math]


[math] \bigg( \dfrac{p}{p+t} \bigg) ^{p+t} \bigg(\dfrac{1-p}{1-p-t}\bigg)^{1-p-t} \lt \bigg(\dfrac{ep}{p+t}\bigg) ^{p+t} [/math]


[math] \exp(-2t^2ms) \le (em)^{-n^2/s} \le (em)^{-n} [/math]


[math] \dfrac{1 + e^{-5}}{1 - e^{-5}} \Bigg(\bigg(\dfrac{efn}{2\varepsilon_Fj}\bigg)^{2/f}\dfrac{2ej}{fn}\Bigg)^{\varepsilon_Fj}[/math]


[math] p(s) \le \dbinom{n}{s} \bigg(\dfrac{ejs}{(\tfrac{1}{2}fs + \varepsilon_Fj)n}\bigg)^{\tfrac{1}{2}fs+\varepsilon_Fj} [/math]


[math] p(s) \le \dbinom{n}{s} \bigg(\dfrac{es}{\varepsilon_Fn}\bigg)^{\varepsilon_Fj} [/math]


[math] p(s) \le \dbinom{n}{s} \bigg(\dfrac{2ej}{fn}\bigg)^{fs/2} [/math]

[math] g(x) = \begin{cases} \bigg(\dfrac{en}{x}\bigg)^x \bigg(\dfrac{ex}{\varepsilon_Fn}\bigg)^{\varepsilon_Fj} &\text{если $x \le \varepsilon_F\cdot2j/f$}\\ \bigg(\dfrac{en}{x}\bigg)^x \bigg(\dfrac{2ej}{fn}\bigg)^{fx/2} &\text{если $x \ge \varepsilon_F\cdot2j/f$} \end{cases} [/math]


[math] \sum\limits_{s-1}^n q(s) \le \dfrac{1 + e^{-5}}{1 - e^{-5}} g(\varepsilon_F\cdot2j/f) [/math]


[math] x \le \varepsilon_F\cdot2j/f [/math]


[math] \dfrac{d}{dx}\ln g(x) = \ln\dfrac{n}{x} + \dfrac{\varepsilon_Fj}{x} \ge \dfrac{1}{2}f \ge 5 [/math]


[math] x \ge \varepsilon_F\cdot2j/f [/math]


[math] \dfrac{d}{dx}\ln g(x) = \ln\dfrac{n}{x} + \dfrac{1}{2}f\ln\dfrac{2ej}{fn} \\ \le \ln\dfrac{e}{\varepsilon_F} + \left(\dfrac{1}{2}f - 1\right)\ln\dfrac{2ej}{fn} \\ \le \ln\dfrac{f}{4} + \left(\dfrac{1}{2}f - 1\right)\ln\dfrac{2e}{25} \\ \lt -5[/math]

[math] \delta = e ^{-5}, b=\varepsilon_F\cdot 2j/f, a= \lfloor b\rfloor, c = a + 1[/math]


[math] \sum\limits_{s=1}^n g(s) = \sum\limits_{s=1}^a g(s) + \sum\limits_{s=c}^n g(s) \\ \lt \dfrac{1}{1-\delta}(g(a) + g(c)) \\ \le \dfrac{\delta^{b-a} + \delta^{c-b}}{1-\delta}g(b) \\ \le \dfrac{1 + \delta}{1-\delta}g(b) [/math]


[math] \dfrac{90}{89} \bigg(\dfrac{e^2(f + 2)^2n}{4j}\bigg) ^{2j/(f+2)} [/math]


[math]s_1,\; s_1,+s_2, \; s_1+s_2+s_3, \; \dots ,\; s_1+s_2+s_3+\dots +s_k [/math]


[math] \sum\limits_{i = 1}^{k}(s_i+dfrac{1}{2}f) \le j, [/math]


[math] \sum\limits_{k=0}^n\dbinom{n}{k}\dbinom{j - fk/2}{k} [/math]


[math]\dbinom{n}{k}\dbinom{j - fk/2}{k} \le \dbinom{n}{k}\dbinom{j}{k} \lt \bigg(\dfrac{e^2(f+2)^2n}{k^2}\bigg)^k [/math]

[math] 1 + \sum\bigg(\dfrac{e^2(f+2)^2n}{k^2}\bigg)^k \lt \dfrac{90}{89} \bigg(\dfrac{e^2(f + 2)^2n}{4j}\bigg) ^{2j/(f+2)} [/math]

[math]e^2nj \ge e^2j \gt 90 [/math]

[math]x \le 2j/(f+2) [/math]

[math]\dfrac{d}{dx}\ln\bigg(\bigg(\dfrac{e^2nj}{x^2}\bigg)^x\bigg) = \ln\dfrac{nj}{x^2} \ge \ln\dfrac{n(f + 2)^2}{4j} \ge \ln\dfrac{25(f+2)^2}{4f} \ge \ln 90[/math]


[math] \dfrac{90}{89} \bigg(\dfrac{e^2(f + 2)^2n}{4j}\bigg) ^{2j/(f+2)} \cdot \dfrac{1 + e^{-5}}{1 - e^{-5}} \Bigg(\bigg(\dfrac{efn}{2\varepsilon_Fj}\bigg)^{2/f}\dfrac{2ej}{fn}\Bigg)^{\varepsilon_Fj} [/math]


[math]x = \bigg(\dfrac{e^2(f + 2)^2n}{4j}\bigg) ^{2/\varepsilon_Ff} \cdot \bigg(\dfrac{efn}{2\varepsilon_Fj}\bigg)^{2/f} \cdot \dfrac{2ej}{fn}; [/math]


[math](e^2/\varepsilon_F)^{2/f} = ((e^2/\varepsilon_F)^{\varepsilon_F})^{2/\varepsilon_Ff} \le (e^2))^{2/\varepsilon_Ff} [/math]

[math]x \le \bigg(\dfrac{e^4(f+2)^2n}{4j}\bigg)^{2//\varepsilon_Ff}\bigg(\dfrac{2ej}{fn}\bigg)^{(f-2)/f} [/math]

[math]t = \varepsilon_F(f-2)/2 [/math]

[math] x^{f/(f-2)} \le 0.24\Bigg(\dfrac{e^5(f+2)^2}{0.48f}\bigg(\dfrac{ej}{0.12fn}\bigg)^{t-1}\Bigg)^{1/t} \\ \le 0.24\Bigg(3e^5f\bigg(\dfrac{e\delta_F}{0.12}\bigg)^{t-1}\Bigg)^{1/t} [/math]

[math] t-1 \ge \dfrac{\ln(3e^5f)}{\ln(0.12/e\delta_F)} [/math]

[math] x^{f/(f-2)} \le 0.24 [/math]

[math]x \lt 0.32 [/math]


[math] 1.025 \sum\limits_{i\ge1} 0.32^i [/math]

Доказательство

Будем считать, что

 [math]A=k^2[/math] и [math]\nu = 1/k [/math].
 [math]\mu = k ^{-5},\; \delta = \dfrac{1}{3}k^{-5}, \; \delta_F = \dfrac{2k}{k^2 - 1} [/math]

Тогда получим, что

 [math] t_f = 3d - 20 [/math] и [math]\alpha(t_f) = \omega(t_f) = d - 6 [/math], где [math]d = \log N/\log k [/math].
 

[math] \varepsilon_B \le \dfrac{1}{4}k^{-4} \cdot \dfrac{4k-1}{4k} [/math]

[math] \varepsilon_F \le \dfrac{1}{4}k^{-4} \cdot\dfrac{4k-1}{4k} [/math]


[math] \varepsilon^* = 2^{-39}\sqrt{1 + 79\ln 2} \lt 2 ^{-36} [/math]

[math] f \gt 2^{34} \cdot \dfrac{1-2^{-12}}{1 - 2^{-36}} \gt 1.7 \times 10^{10} [/math]


[math] \varepsilon_B = 2 ^{-29}\sqrt{1 + 59\ln 2} \lt 1.25 \times 10 ^{-8} [/math]

[math] \delta_F = 128/4095 [/math]

[math] \varepsilon_F = 1/(8\times 10^7) = 1.25 \times 10^{-8} [/math]

[math] \sqrt{\dfrac{2(1+\ln m)}{m}} \le k ^{-6} [/math]

[math] M/32 \lt m \le M/16 [/math]

[math] \log k = (\dfrac{1}{12} + o(1))\log M [/math] [math] M \to \infty [/math]

[math] f \ge (1 + o(1))\dfrac{m}{2k^4} \ge (1+o(1))k^8\ln k [/math]

[math]M \to \infty [/math]

[math] \varepsilon_B = k^{-6}, \; \delta_F = \dfrac{2k}{k^2 - 1}, \; \varepsilon_F = k^{-8} [/math]

[math] \sqrt{\dfrac{2(1+\ln m)}{m}} \le \dfrac{1}{5}k^{-4} [/math]

[math] \log k = (\dfrac{1}{8} + o(1))\log M [/math]

[math] \sqrt{\dfrac{2(1 + \ln \lfloor M^{3/2}\rfloor)}{\lfloor M^{3/2}\rfloor}} \le k^{-6} [/math]

[math] \varepsilon_B = \dfrac{1}{5}k^{-4}, \; \delta_F = \dfrac{2k}{k^2 - 1}, \; \varepsilon_F = \dfrac{1}{5}k^{-4} [/math]