Ажтаи (Ajtai), Комлос (Komlos) и Шимереди (Szemeredi) сконструировали сортирующую сеть на N входов глубины <tex> O(\log N) </tex>, при они не углублялись в исследование значения константы, получавшейся при правильном соблюдении необходимой ассимптотики. Впоследствии Патерсон выяснил, что <tex> O(\log N) </tex> можно заменить на <texdpi = "200" > c1 \log_2 N </tex> с константой приблизительно равной <tex> 6100 </tex>. Здесь будет описана более поздняя реализация, которая включает в себя меньшую константу <tex>c</tex>mid r_i, а именно, будет доказано, что для любого целого числа <tex>N</tex> такого,что <tex>N p_i = 1 \ge 2^{78}</tex> существует сортирующая сеть на <tex>N</tex> входов, такая, что глубина в худшем случае будет <tex>1830 mid \log_2 N - 58657 sum f_i</tex>.
Основными составяющими этой конструкции будут сортирующие сети на {{Задача|definition= <texol>M</texli> входов, такие ,что Имеется один станок.<tex/li>M</texli> относительно мало. Мы назовем их Есть <tex>Mn</tex>-сортировщикамиработ, каждая из которых выполняется за единицу времени. Для любых выбранных положительных целых чисел <tex>M</texli> и <texli>NКаждая работа имеет своё время появления </tex> таких что <tex> N \ge Mr_i</tex>, конструкция будет включать в себя <tex>N. </texli> проводов, и будет сделана из <texli>M</tex>-сортировщиков, глубина которых в худшем случае Для каждой работы задана монотонно неубывающая функция <tex>(48 + о(1))\log_MN + 115f_i</tex> при <tex>M \to \inf. </texli>.(Стоит отметить, что асимптотическое <tex>o(1)</texol> здесь относится к Необходимо минимизировать <tex>M\sum f_i, </tex>, а не к где <tex>Nf_i</tex>). == Представление в виде дерева и разделители == Сначала введем все необходимые понятия для построения сортирующей сети. {{Определение|definition='''Идеальным разделителем''' будем называть сеть, выходные провода которой разделены на K блоков одинакового размера, таких, что принимая на вход любые ---}} значение функции <tex>af_i</tex> значений, сеть размещает первые <tex>a/k</tex> минимальные по величине ключи в первый блок, следующие момент завершения выполнения задания с номером <tex>a/ki</tex> по величине ключи – во второй, и т.д.
}}
Эти идеальные разделители могут быть использованы как модули для построения сортирующей сети на <tex>N</tex> входов, где <tex>N = k^d</tex> для некоторого положительного числа d. Такая сеть будет представлять собой композицию сетей <tex>N_0, N_1, N_2 \dots N_{d-1}</tex>, где <tex>N_t</tex> – парраллельная композиция <tex>k^t</tex> идеальных разделителей одинакового размера. <tex>k^{d - t}</tex> Выходных проводов уровня <tex>N_t</tex> разделены на <tex>k</tex> блоков одинакового размерв и каждый из этих блоков формирует вход для идеального разделителя из N_{t+1}.
Можно рассмотреть другую интерпретацию этой конструкции. k^d входных данных мы будем рассматривать как листья полного k-ичного дерева глубины d; каждый модуль(разделитель) из N_t будем считать узлом, находящимся на высоте t в нашем дереве. Будем считать, что в каждый момент времени t = 0, 1, 2, ... в - 1 входные провода распределены по всему уровню t нашего дерева. В то же время, каждый узел х на t уровне принимает k^{d - t} проводов и эти провода затем используются как вход для идеального разделителя который разбивает их на k блоков одинакового размера в промежуток времени между t и t + 1. Выходные провода из j получившегося блока идут в j ребенка вершины x. К моменту времени d каждый лист дерева содершит в себе только один провод, а этот провод содержит в себе значение, которое и приписывается к листу.
К сожалению, эта схема описывает сортирующую сеть глубины <tex>\Omega((\log_k N)(\log_m N)) </tex>: каждый идеальный разделитель на а проводов, если его делать из М-разделителей, должен иметь глубину более чем <tex>\log_M(\dfrac{k-1}{k}a). (Чтобы осознать это, заметим, что для каждого выхода y должно быть более чем <tex>\dfrac{k -1}{k}a</tex> входов x , таких, что ключ мог бы дойти от x до y). К счастью, схему можно переделать так, чтобы она описывала сортирующую сеть глубины ==Решение за <tex>O(\log_M Nn^3)</tex> : идеальные разделители можно заменить на более слабые модули константной глубины,чья слабость будет компенсироваться более сложным перемещением ключей через дерево.==
Слабые модули мы назовем сепараторамиЭта задача может быть решена сведением к решению [[Венгерский алгоритм решения задачи о назначениях | задачи о назначениях]]. У каждого такого сепаратора есть а выходных проводовА именно, которые делятся на блоки покажем, что решение задачи состоит сопоставлении <tex>n</tex> различным заданиям различных времен начала выполнения работы. Если сопоставляем работе <tex>i</tex> время <tex>t</tex> F_1, B_1, B_2, \dots, B_k, F_2 то вклад в целевую функцию будет <tex> f_i(t + 1) </tex> так. Далее будет показано, что при построении оптимального расписания нам нужно будет рассмотреть всего <tex> |F_1| = |F_2|n</tex> различных времен начала работ. Следовательно, подобная задача может быть решена за <tex> |B_1| = |B_2| = \dots = |B_k| O(n^3)</tex>;.
Как правило, "обрамляющие блоки" Поскольку <tex>F_1f_i</tex> и <tex>F_2</tex> гораздо меньше всех остальных. В каком{{---}} монотонно неубывающие функции, то смысле, можно сказатьэто значит, что сепаратор аппроксимирует идеальный разделитель. Тогда будем измерять точность аппроксимации величинами <tex> \delta_F, \varepsilon_F </tex> и <tex>\varepsilon_B</tex>. Сортирующая сеть, с такими же выходными проводами в оптимальном расписании работы должны начинать исполняться как и наш сепаратор, принимая на вход I, состоящее из a отдельных проводов, распределяет соответствующие <tex>I_j</tex> в выходные блоки <tex>B_j</tex>можно раньше. Сераратор же распределяет вход Первые <tex>In</tex> таким образом, что 1) для каждого <tex> j = 1, 2, \dots, k, </tex> не более <tex>\varepsilon_B a</tex> ключей из <tex>I_j</tex> не попадут в <tex>B_j</tex>.2)самых ранних для каждого целого j такого, что <tex>1\le j\le \delta_F|F_i|</tex>не более <tex>\varepsilon_F j</tex> из <tex>j</tex> самых маленьких чисел могут не попасть в <tex>F_1</tex> и не более начала исполнения времен <tex>\varepsilon_F jt_i</tex> из <tex>j</tex> самых больших чисел могут не попасть в <tex>F_2</tex>Что касается перемещения значений в дереве, то в момент времени <tex>t = 0</tex> все <tex>k^d</tex> проводов входят в корень. Между временами <tex> t</tex> и <tex>t + 1</tex> каждый узел <tex>x</tex>, в который входят какие-нибудь провода, использует эти а проводов как вход для сепаратора, с разумно выбранным размером для выходных блоков. Провода из каждого выходного блока <tex>B_j</tex> посывлаются в <tex>j</tex>того сына узла <tex>x</tex>а провода попавшие в <tex>F_1</tex> или <tex>F_2/tex> посылаются обратно к родителю <tex>x</tex>. (Если <tex>x</tex>. - корень, то <tex>F_1</tex> и <tex>F_2</tex> должны быть пустыми. Так как <tex>F_1</tex> и <tex>F_2</tex> сравнительно маленькиевычислены следующим алгоритмом, то большинство значений провалится ниже к листам дерева; так как сепаратор не идеальный, то некоторые ключи могут быть посланы вниз в неправильном направлениии. Свойство 1) гарантируеткотором мы предполагаем, что очень малое количество собъется с пути, а свойство 2) гарантирует, что большинство из этих ключей вернутся назад и смогут исправить свое положение позже.== Конструкция сети ==Пускай число детей у каждой вершины <tex>k</tex> будет степенью двойки, и число входных ключей - <tex> N = k ^ d </tex>. В любой момент времени <tex>t</tex> все <tex>N</tex> проводов распределены внутри дерева таким образом, что число проводов, содержащихся в вершине <tex>x</tex> зависит только от работы отсортированы по неубыванию времени появления <tex>t</tex> и глубины <tex>i</tex> на которой находится вершина <tex>x</tex>. Тогда пускай <tex>a(i, t)</tex> будет описывать это число. Значение <tex>a(i, t)</tex> зависит от двух параметров <tex>A</tex> и <tex>\nu</tex>, таких, что <tex>\nu < 1 </tex> и <tex>A\nu > 1r_i</tex>:
В самом начале <tex>t_1</tex> = <tex>r_1</tex> '''for''' <tex> i \in \{ 2 \ldots n \} </tex> <tex>t_i</tex> = <tex>\max(r_i, число проводов, входящих в корень :t_{i-1} + 1)</tex>
<tex>a(0, 0) = N</tex>
При переходе к <tex>t = 1</tex> корень делит <tex>N</tex> проводов на <tex>k</tex> групп и отправляет их своим <tex> k </tex> детям:{{Лемма <tex>a(1, 1) |id= N/ k</tex>lemma1 При переходе к <tex>t |statement= 2Существует оптимальное расписание </tex> каждый узел, находящийся на 1 уровне отправляет <tex>N\nu / Ak^2 </tex> своих <tex>N/kS</tex> проводов обратно в корень и распределяет оставшиеся провода равномерно среди детей : котором все <tex> a(0, 2) = \dfrac{\nu}{Ak}Nn</tex><tex> a(2, 2) = \dfrac{Ak - \nu}{Ak^3}N</tex> Обозначим <tex>\alpha (t)</tex> и <tex>\omega (t)</tex> - верхний и нижний уровни, соответственно, такие что на на них содержатся непустые узлы на момент времени <tex>t</tex>. Иначе говоря, <tex>\alpha (t)</tex> - это наименьшее <tex>i</tex>, такое что <tex>a(i, t) \neq 0</tex>, а <tex>\omega (t)</tex> - это наибольшее <tex>iзадач распределены по всем временам </tex>, такое что <tex>at_i (i, t) \neq 0</tex> Так получаем, что <tex>\alpha (0) = \omega (0) = 0; \quad \alpha (1) = \omega (1) = 1; \quad \alpha (2) = 0 \omega (2) = 2; </tex> Значения <tex>\alpha (t)</tex> и <tex>\omega(tldots n)</tex> расходятся в момент <tex>t = 2</tex>и сойдутся, когда перемещение значений по сети и их сортировка будет оконченакоторые выбирает приведенный выше алгоритм.Запишем<tex>\alpha^*(t) = \dfrac{t\log \dfrac{1}{\nu} - \log N + \log(2A\nu k^3)}{\log A}</tex>и<tex>\omega^*(t) |proof= \dfrac{t\log \dfrac{1}{\nu} + \log(A\nu k)}{\log Ak}</tex> Пускай <tex>\alpha(t)</tex> будет наименьшим неотрицательным челым числомПредположим, таким что <tex>\alpha(t) \ge \alpha^*(t),\quad \alpha (t)\equiv t\mod 2 в некоторое оптимальное расписание </tex> Пускай <tex>\omega(t)S</tex> будет наименьшим челым числом, таким что входят времена <tex>t_1 \omega(t) \ge \omega^*(t)ldots t_j,\quad \omega (t)\equiv t\mod 2 </tex> Поскольку где <tex>A\nu \ge 1 </tex> получаем, что j <tex>\alpha^*(t + 1) \le \alpha^* (t) + 1, \omega^*(t + 1) \le \omega^* (t) </tex> для любого <tex>tn</tex> и поэтому <tex> |\alpha(t + 1) - \alpha(t) | = 1, \quad |\omega(t + 1) - \omega(t)| = 1 </tex> максимально возможное для любого <tex>t</tex>этого расписания.Нижнее значение может уменьшаться и увеличиватьсяИз того, но как в среднем оно спадает со скоростью <tex>\log\dfrac{1}{\nu} </tex> уровней на каждые <tex> \log(Ak) </tex> итераций. Верхнее же значение первые <tex>\log N/\log\dfrac{1}{\nu} </tex> итераций колеблется между значениями 0 и 1 ,а дальше начинает так же уменьщаться со скоростью <tex>\log\dfrac{1}{\nu}</tex> уровней на каждые <tex>\log(A)</tex> итераций. Обозначим за <tex>t_f </tex> время, когда верхнее и нижнее алгоритме выбирались значения совпадут: <tex>t_f </tex> - это наибольшее целое положтельное число такое, что:<tex> \alpha(t) < \omega(t)</tex> <tex> 1 < t < t_f </tex>Также<tex> \alpha(t_f) = omega(t_f) </tex> (Это будет понятно из дальнейшего изложения. Так же будет проверено, что общее значение <tex> \alpha(t_f)</tex> и <tex>omega(t_f) </tex> меньше, чем <tex>d</tex>) <tex> c(i, t) = \dfrac{N}{A\nu k} A^i\nu ^i </tex>Значение <tex> c(i, t) </tex> можно рассматривать как вместимость узла на <tex> i </tex> уровне во время <tex> t </tex>: для любого <tex> t</tex>, такого, что <tex> 1 < t < t_f </tex> имеем<tex> \dfrac{a(\alpha(t), t)}{c(\alpha(t), t)} = 1 </tex>, <tex> \dfrac{a(i, t)}{c(i, t)} = 1 - \dfrac{1}{A^2 k^2} </tex> где <tex> \alpha(t) < i < \omega(t) </tex>и <tex> i \equiv t \mod 2 </tex> <tex> a(\omega(t),t) = Nk ^{-\omega(t)} - dfrac{c(\omega(t), t)}{A^2k^2}</tex>(Если <tex> i \not\equiv t \mod 2</tex> тогда<tex> a(i, t) = 0 </tex>) Начиная с <tex> N k ^{-\omega(t)} \le c(\omega(t), t) < A^2k^2Nk^{-\omega(t)}), </tex>имеем <tex> 0 < \dfrac{a(\omega(t), t)}{c(\omega(t), t)} \le 1 - \dfrac{1}{A^2k^2} </tex> Начиная с <tex>c(\alpha(t), t) \ge 2k^2 /tex> мы имеем <tex>c(i, t) \ge 2A^2k^2 t_i</tex> когда <tex>i\ge \alpha(t) + 2 </tex>. Это следует из того, что все<tex> a(i, t) </tex> целые. Чтобы как-то перераспределить провода между временами <tex>t</tex> и <tex>t + 1 </tex> каждый узел на уровне i посылает <tex>\pi(i, t) </tex> значений своим родителям и <tex>\chi(i, t) </tex> значений каждому из своих <tex>k</tex> детей. Если <tex>2 \le t < t_f </tex>, то <tex> \pi(\alpha(t),t) =\begin{cases}0,&\text{если $\alpha(t + 1)>\alpha(t)$,}\\\dfract_{\nu}{AK}c(a(t),t), &\text{если $\alpha(t j + 1)>\alpha(t)$.}\end{cases}</tex> <tex> \pi(i,t) = \dfrac{A\nu k - 1}{A^2k^2}c(i,t),\qquad\quad \text{если $\alpha(t) < i < \omega(t)$,}</tex> <tex> \pi(\omega(t),t) =\begin{cases}\dfrac{A\nu k - 1}{A^2k^2}c(\omega(t),t),&\text{ $\omega(t + 1)>\omega(t)$,}\\\alpha(\omega(t),t),&\text{если $\omega(t + 1)<\omega(t)$,}\end{cases}</tex> <tex> \chi(\alpha(t),t) =\begin{cases}\dfrac{1}{k}c(\alpha(t),t),&\text{ $\alpha(t + 1)>\alpha(t)$,}\\\dfrac{Ak - \nu}{Ak^2}c(\alpha(t),t),&\text{если $\alpha(t + 1)<\alpha(t)$,}\end{cases}</tex> <tex> \chi(i,t) = \dfrac{Ak - \nu}{Ak^2}c(i,t),\qquad\quad \text{если $\alpha(t) < i < \omega(t)$,}</tex> <tex> \pi(\omega(t),t) =\begin{cases}\alpha(\omega(t + 1), t + 1)), &\text{ $\omega(t + 1)>\omega(t)$,}\\0,&\text{если $\omega(t + 1)<\omega(t)$,}\end{cases}</tex> Отметимминимальное возможное время, что для все большее <tex>\pi(it_j, t)</tex> и <tex>\chi(i, t)</tex> целые: в частности, если <tex>\alpha(t + 1) < \alpha(t)</tex>, то<tex>c(\alpha(t), t) = (A/\nu)c(\alpha(t + 1), t + 1) \ge 2Ak^2/\nu</tex> Если сепараторы, используемые для построения сети достаточно хорошие, то(мы проверим чуто позже) существует такое целое число <tex>\gamma </tex>, не превосходящее <tex>\alpha(t_f) </tex>, но при этом отличающееся от <tex>\alpha(t_f) </tex>не более чем на константу, не зависящую от <tex>N</tex>, такое, что для любого узла <tex>x</tex>, находящегося на уровне <tex>\gamma </tex>, все ключи, являющиеся потомками узла <tex>x</tex> в момент времени <tex>t_f</tex> адресуются толко к ключам, являющимся потомками <tex>x</tex>. Следовательно, построеная сеть может быть дополнена до сортирующей единственным слоем из параллельных сортирующих сетей, каждая из которых будет содержать <tex>k^{d которое вообще можно начать выполнять какое- \gamma} </tex> входных проводов. Далее мы будем использовать следующие утверждения Лемма 3нибудь задание.1 Если <tex>\alpha(i, t) \neq 0</tex> тогда <tex> \sum\limits^d_{j=0} k^{j-i}a(j, t) =\begin{cases}Nk^{-i}, &\text{ $i = \alpha(t)$,}\\Nk^{-i} - \dfrac{c(i,t)}{A^2k^2}, &\text{ $i > \alpha(t)$,}\end{cases}</tex> ДоказательствоЭто утверждение следует из того<tex>\sum\limits^d_{j=0} k^ja(j, t) = N </tex> Непосредственно, когда <tex> i = \alpha(t) </tex> и подставляется <tex> a(j,t) =\begin{cases}0, &\text{ $j \not\equiv i \mod 2$,}\\c(j, t), &\text{ $j = \alpha(t)$,}\\(1 - \dfrac{1}{A^2k^2})c(j, t) &\text{ $\alpha(t) < j < i, \quad j \equiv i \mod 2$}\end{cases}</tex> где <tex> c(j, t) = c(i, t)A^{j-i}</tex> при <tex>i\ge\alpha(t)+2</tex>. лемма 3.2 Если <tex>\alpha(t + 1) > \alpha(t) </tex> тогда <tex>\alpha(t) = 0</tex> или <tex>c(\alpha(t),t)\le Ak^2/\nu</tex> ДоказательствоЕсли <tex>\alpha(t+1) > \alpha(t) > 0</tex>, тогда <tex>\alpha(t) - 1 < \alpha^*(t + 1) </tex>, а значит и <tex>c(\alpha(t),t) < 2Ak^2/\nu</tex>. == Анализ работы сети ==Посторонним ключем будем называть ключ, находящийся в узле <tex>x</tex>, котороый при этом не будет отправлен ниже по дереву при переходе к следующему шагу. Посторонним ключем порядка <tex>r</tex> будем называть такой ключ, который останется посторонним, даже если его переместить в его предка, находящегося на <tex>r</tex> уровней выше по дереву.(По сути, посторонний ключ - посторонний ключ порядка ноль).Далее мы докажем, что в момент времени <tex>t_f</tex> узлы на уровне <tex>\alpha(t_f) </tex> не содержат посторонних ключей порядка <tex>r</tex> для некоторой константы <tex>r</tex>, зависящей только от <tex>A, k, \nu</tex> Для этого рассмотрим следующее предположение Для любого <tex> i = 0, 1, \dots , d </tex> и для любого <tex> r = 0, 1, \dots , d </tex> каждый узел на уровне <tex>i</tex> содержит менее чем <tex>\mu \delta^r c(i, t) </tex> посторонних ключей порядка <tex> r </tex>. Так как <tex>c(\alpha(t_f), t_f) < 2 A^2 k^2 </tex>, то остается только проверить, что предположение выполняеся во время tex>t_f</tex> для некоторых <tex>\mu</tex> и <tex>\delta</tex> (зависящего только от <tex> i = 0, 1, \dots , d </tex>) ,такого, что <tex>\delta < 1 </tex> Используем индукцию по t, чтобы доказать, что лемма выполняется для любого <tex>t = 0, 1, \dots , t_f </tex> для некоторых <tex>\mu</tex> и <tex>\delta</tex>(зависящей только от <tex>k, A , \nu </tex>) такой, что <tex> \delta < 1 </tex>. Это может быть верным только если модули сепараторов используемые в сети достаточно хорошие. При условии, что все эти сепараторы (за исключением того, кторый используется в корне в момент времени <tex>t = 0 </tex>) имеют одинаковые параметры <tex>\varepsilon_B, \delta_F, \varepsilon_F </tex> а у того сепаратора, который в корне, вместо <tex>\varepsilon_B </tex> будет <tex>\varepsilon^*</tex>, мы подберем ограничения на <tex>\mu, \delta, \varepsilon_B, \delta_F, \varepsilon_F, \varepsilon </tex> так, что можно будет проделать индукцию по <tex>t </tex>. == Конструкция разделителей ==