Участник:Dominica — различия между версиями

Материал из Викиконспекты
Перейти к: навигация, поиск
м (Конструкция сети)
м
Строка 156: Строка 156:
 
\end{cases}
 
\end{cases}
 
</tex>
 
</tex>
 +
 +
 
Доказательство
 
Доказательство
 
Это утверждение следует из того
 
Это утверждение следует из того
Строка 179: Строка 181:
 
Доказательство
 
Доказательство
 
Если <tex>\alpha(t+1) > \alpha(t) > 0</tex>, тогда <tex>\alpha(t) - 1 < \alpha^*(t + 1) </tex>, а значит и <tex>c(\alpha(t),t) < 2Ak^2/\nu</tex>.
 
Если <tex>\alpha(t+1) > \alpha(t) > 0</tex>, тогда <tex>\alpha(t) - 1 < \alpha^*(t + 1) </tex>, а значит и <tex>c(\alpha(t),t) < 2Ak^2/\nu</tex>.
 +
 +
== Анализ работы сети ==
  
 
== Мусор ==
 
== Мусор ==

Версия 14:14, 25 мая 2015

Ажтаи (Ajtai), Комлос (Komlos) и Шимереди (Szemeredi) сконструировали сортирующую сеть на N входов глубины [math] O(\log N) [/math], при они не углублялись в исследование значения константы, получавшейся при правильном соблюдении необходимой ассимптотики. Впоследствии Патерсон выяснил, что [math] O(\log N) [/math] можно заменить на [math] c\log_2 N [/math] с константой приблизительно равной [math] 6100 [/math]. Здесь будет описана более поздняя реализация, которая включает в себя меньшую константу [math]c[/math], а именно, будет доказано, что для любого целого числа [math]N[/math] такого,что [math]N \ge 2^{78}[/math] существует сортирующая сеть на [math]N[/math] входов, такая, что глубина в худшем случае будет [math]1830 \log_2 N - 58657 [/math].

Основными составяющими этой конструкции будут сортирующие сети на [math]M[/math] входов, такие ,что [math]M[/math] относительно мало. Мы назовем их [math]M[/math]-сортировщиками. Для любых выбранных положительных целых чисел [math]M[/math] и [math]N[/math] таких что [math] N \ge M[/math], конструкция будет включать в себя [math]N[/math] проводов, и будет сделана из [math]M[/math]-сортировщиков, глубина которых в худшем случае [math](48 + о(1))\log_MN + 115[/math] при [math]M \to \inf[/math]. (Стоит отметить, что асимптотическое [math]o(1)[/math] здесь относится к [math]M[/math], а не к [math]N[/math]).

Представление в виде дерева и разделители

Сначала введем все необходимые понятия для построения сортирующей сети.


Определение:
Идеальным разделителем будем называть сеть, выходные провода которой разделены на K блоков одинакового размера, таких, что принимая на вход любые [math]a[/math] значений, сеть размещает первые [math]a/k[/math] минимальные по величине ключи в первый блок, следующие [math]a/k[/math] по величине ключи – во второй, и т.д.

Эти идеальные разделители могут быть использованы как модули для построения сортирующей сети на [math]N[/math] входов, где [math]N = k^d[/math] для некоторого положительного числа d. Такая сеть будет представлять собой композицию сетей [math]N_0, N_1, N_2 \dots N_{d-1}[/math], где [math]N_t[/math] – парраллельная композиция [math]k^t[/math] идеальных разделителей одинакового размера. [math]k^{d - t}[/math] Выходных проводов уровня [math]N_t[/math] разделены на [math]k[/math] блоков одинакового размерв и каждый из этих блоков формирует вход для идеального разделителя из N_{t+1}. Можно рассмотреть другую интерпретацию этой конструкции. k^d входных данных мы будем рассматривать как листья полного k-ичного дерева глубины d; каждый модуль(разделитель) из N_t будем считать узлом, находящимся на высоте t в нашем дереве. Будем считать, что в каждый момент времени t = 0, 1, 2, ... в - 1 входные провода распределены по всему уровню t нашего дерева. В то же время, каждый узел х на t уровне принимает k^{d - t} проводов и эти провода затем используются как вход для идеального разделителя который разбивает их на k блоков одинакового размера в промежуток времени между t и t + 1. Выходные провода из j получившегося блока идут в j ребенка вершины x. К моменту времени d каждый лист дерева содершит в себе только один провод, а этот провод содержит в себе значение, которое и приписывается к листу.

К сожалению, эта схема описывает сортирующую сеть глубины [math]\Omega((\log_k N)(\log_m N)) [/math]: каждый идеальный разделитель на а проводов, если его делать из М-разделителей, должен иметь глубину более чем [math]\log_M(\dfrac{k-1}{k}a). (Чтобы осознать это, заметим, что для каждого выхода y должно быть более чем \lt tex\gt \dfrac{k -1}{k}a[/math] входов x , таких, что ключ мог бы дойти от x до y). К счастью, схему можно переделать так, чтобы она описывала сортирующую сеть глубины [math]O(\log_M N)[/math] : идеальные разделители можно заменить на более слабые модули константной глубины,чья слабость будет компенсироваться более сложным перемещением ключей через дерево.

Слабые модули мы назовем сепараторами. У каждого такого сепаратора есть а выходных проводов, которые делятся на блоки [math] F_1, B_1, B_2, \dots, B_k, F_2 [/math] так, что [math] |F_1| = |F_2|[/math] [math] |B_1| = |B_2| = \dots = |B_k| [/math];

Как правило, "обрамляющие блоки" [math]F_1[/math] и [math]F_2[/math] гораздо меньше всех остальных. В каком-то смысле, можно сказать, что сепаратор аппроксимирует идеальный разделитель. Тогда будем измерять точность аппроксимации величинами [math] \delta_F, \varepsilon_F [/math] и [math]\varepsilon_B[/math]. Сортирующая сеть, с такими же выходными проводами как и наш сепаратор, принимая на вход I, состоящее из a отдельных проводов, распределяет соответствующие [math]I_j[/math] в выходные блоки [math]B_j[/math]. Сераратор же распределяет вход [math]I[/math] таким образом, что 1) для каждого [math] j = 1, 2, \dots, k, [/math] не более [math]\varepsilon_B a[/math] ключей из [math]I_j[/math] не попадут в [math]B_j[/math]. 2)для каждого целого j такого, что [math]1\le j\le \delta_F|F_i|[/math]не более [math]\varepsilon_F j[/math] из [math]j[/math] самых маленьких чисел могут не попасть в [math]F_1[/math] и не более [math]\varepsilon_F j[/math] из [math]j[/math] самых больших чисел могут не попасть в [math]F_2[/math] Что касается перемещения значений в дереве, то в момент времени [math]t = 0[/math] все [math]k^d[/math] проводов входят в корень. Между временами [math] t[/math] и [math]t + 1[/math] каждый узел [math]x[/math], в который входят какие-нибудь провода, использует эти а проводов как вход для сепаратора, с разумно выбранным размером для выходных блоков. Провода из каждого выходного блока [math]B_j[/math] посывлаются в [math]j[/math]того сына узла [math]x[/math]а провода попавшие в [math]F_1[/math] или [math]F_2/tex\gt посылаются обратно к родителю \lt tex\gt x[/math]. (Если [math]x[/math]. - корень, то [math]F_1[/math] и [math]F_2[/math] должны быть пустыми. Так как [math]F_1[/math] и [math]F_2[/math] сравнительно маленькие, то большинство значений провалится ниже к листам дерева; так как сепаратор не идеальный, то некоторые ключи могут быть посланы вниз в неправильном направлениии. Свойство 1) гарантирует, что очень малое количество собъется с пути, а свойство 2) гарантирует, что большинство из этих ключей вернутся назад и смогут исправить свое положение позже.

Конструкция сети

Пускай число детей у каждой вершины [math]k[/math] будет степенью двойки, и число входных ключей - [math] N = k ^ d [/math]. В любой момент времени [math]t[/math] все [math]N[/math] проводов распределены внутри дерева таким образом, что число проводов, содержащихся в вершине [math]x[/math] зависит только от времени [math]t[/math] и глубины [math]i[/math] на которой находится вершина [math]x[/math]. Тогда пускай [math]a(i, t)[/math] будет описывать это число. Значение [math]a(i, t)[/math] зависит от двух параметров [math]A[/math] и [math]\nu[/math], таких, что [math]\nu \lt 1 [/math] и [math]A\nu \gt 1[/math]

В самом начале, число проводов, входящих в корень :

[math]a(0, 0) = N[/math]

При переходе к [math]t = 1[/math] корень делит [math]N[/math] проводов на [math]k[/math] групп и отправляет их своим [math] k [/math] детям:

[math]a(1, 1) = N/ k[/math]

При переходе к [math]t = 2[/math] каждый узел, находящийся на 1 уровне отправляет [math]N\nu / Ak^2 [/math] своих [math]N/k[/math] проводов обратно в корень и распределяет оставшиеся провода равномерно среди детей :

[math] a(0, 2) = \dfrac{\nu}{Ak}N[/math] [math] a(2, 2) = \dfrac{Ak - \nu}{Ak^3}N[/math]

Обозначим [math]\alpha (t)[/math] и [math]\omega (t)[/math] - верхний и нижний уровни, соответственно, такие что на на них содержатся непустые узлы на момент времени [math]t[/math]. Иначе говоря, [math]\alpha (t)[/math] - это наименьшее [math]i[/math], такое что [math]a(i, t) \neq 0[/math], а [math]\omega (t)[/math] - это наибольшее [math]i[/math], такое что [math]a(i, t) \neq 0[/math]

Так получаем, что [math]\alpha (0) = \omega (0) = 0; \quad \alpha (1) = \omega (1) = 1; \quad \alpha (2) = 0 \omega (2) = 2; [/math]

Значения [math]\alpha (t)[/math] и [math]\omega(t)[/math] расходятся в момент [math]t = 2[/math]и сойдутся, когда перемещение значений по сети и их сортировка будет окончена. Запишем [math]\alpha^*(t) = \dfrac{t\log \dfrac{1}{\nu} - \log N + \log(2A\nu k^3)}{\log A}[/math] и [math]\omega^*(t) = \dfrac{t\log \dfrac{1}{\nu} + \log(A\nu k)}{\log Ak}[/math]

Пускай [math]\alpha(t)[/math] будет наименьшим неотрицательным челым числом, таким что

[math]\alpha(t) \ge \alpha^*(t),\quad \alpha (t)\equiv t\mod 2 [/math]

Пускай [math]\omega(t)[/math] будет наименьшим челым числом, таким что

[math]\omega(t) \ge \omega^*(t),\quad \omega (t)\equiv t\mod 2 [/math]

Поскольку [math]A\nu \ge 1 [/math] получаем, что [math]\alpha^*(t + 1) \le \alpha^* (t) + 1, \omega^*(t + 1) \le \omega^* (t) [/math] для любого [math]t[/math] и поэтому

[math] |\alpha(t + 1) - \alpha(t) | = 1, \quad |\omega(t + 1) - \omega(t)| = 1 [/math]

для любого [math]t[/math]. Нижнее значение может уменьшаться и увеличиваться, но в среднем оно спадает со скоростью [math]\log\dfrac{1}{\nu} [/math] уровней на каждые [math] \log(Ak) [/math] итераций. Верхнее же значение первые [math]\log N/\log\dfrac{1}{\nu} [/math] итераций колеблется между значениями 0 и 1 ,а дальше начинает так же уменьщаться со скоростью [math]\log\dfrac{1}{\nu}[/math] уровней на каждые [math]\log(A)[/math] итераций. Обозначим за [math]t_f [/math] время, когда верхнее и нижнее значения совпадут: [math]t_f [/math] - это наибольшее целое положтельное число такое, что: [math] \alpha(t) \lt \omega(t)[/math] [math] 1 \lt t \lt t_f [/math] Также [math] \alpha(t_f) = omega(t_f) [/math] (Это будет понятно из дальнейшего изложения. Так же будет проверено, что общее значение [math] \alpha(t_f)[/math] и [math]omega(t_f) [/math] меньше, чем [math]d[/math])

[math] c(i, t) = \dfrac{N}{A\nu k} A^i\nu ^i [/math] Значение [math] c(i, t) [/math] можно рассматривать как вместимость узла на [math] i [/math] уровне во время [math] t [/math]: для любого [math] t[/math], такого, что [math] 1 \lt t \lt t_f [/math] имеем [math] \dfrac{a(\alpha(t), t)}{c(\alpha(t), t)} = 1 [/math],

[math] \dfrac{a(i, t)}{c(i, t)} = 1 - \dfrac{1}{A^2 k^2} [/math] где [math] \alpha(t) \lt i \lt \omega(t) [/math] и [math] i \equiv t \mod 2 [/math]

[math] a(\omega(t),t) = Nk ^{-\omega(t)} - dfrac{c(\omega(t), t)}{A^2k^2}[/math] (Если [math] i \not\equiv t \mod 2[/math] тогда [math] a(i, t) = 0 [/math]) Начиная с [math] N k ^{-\omega(t)} \le c(\omega(t), t) \lt A^2k^2Nk^{-\omega(t)}), [/math] имеем

[math] 0 \lt \dfrac{a(\omega(t), t)}{c(\omega(t), t)} \le 1 - \dfrac{1}{A^2k^2} [/math]

Начиная с [math]c(\alpha(t), t) \ge 2k^2 /tex\gt мы имеем \lt tex\gt c(i, t) \ge 2A^2k^2 [/math] когда [math]i\ge \alpha(t) + 2 [/math]. Это следует из того, что все [math] a(i, t) [/math] целые.

Чтобы как-то перераспределить провода между временами [math]t[/math] и [math]t + 1 [/math] каждый узел на уровне i посылает [math]\pi(i, t) [/math] значений своим родителям и [math]\chi(i, t) [/math] значений каждому из своих [math]k[/math] детей. Если [math]2 \le t \lt t_f [/math], то

[math] \pi(\alpha(t),t) = \begin{cases} 0,&\text{если $\alpha(t + 1)\gt \alpha(t)$,}\\ \dfrac{\nu}{AK}c(a(t),t), &\text{если $\alpha(t + 1)\gt \alpha(t)$.} \end{cases} [/math]


[math] \pi(i,t) = \dfrac{A\nu k - 1}{A^2k^2}c(i,t),\qquad\quad \text{если $\alpha(t) \lt i \lt \omega(t)$,} [/math]


[math] \pi(\omega(t),t) = \begin{cases} \dfrac{A\nu k - 1}{A^2k^2}c(\omega(t),t),&\text{ $\omega(t + 1)\gt \omega(t)$,}\\ \alpha(\omega(t),t),&\text{если $\omega(t + 1)\lt \omega(t)$,} \end{cases} [/math]


[math] \chi(\alpha(t),t) = \begin{cases} \dfrac{1}{k}c(\alpha(t),t),&\text{ $\alpha(t + 1)\gt \alpha(t)$,}\\ \dfrac{Ak - \nu}{Ak^2}c(\alpha(t),t),&\text{если $\alpha(t + 1)\lt \alpha(t)$,} \end{cases} [/math]


[math] \chi(i,t) = \dfrac{Ak - \nu}{Ak^2}c(i,t),\qquad\quad \text{если $\alpha(t) \lt i \lt \omega(t)$,} [/math]


[math] \pi(\omega(t),t) = \begin{cases} \alpha(\omega(t + 1), t + 1)), &\text{ $\omega(t + 1)\gt \omega(t)$,}\\ 0,&\text{если $\omega(t + 1)\lt \omega(t)$,} \end{cases} [/math]

Отметим, что для все [math]\pi(i, t)[/math] и [math]\chi(i, t)[/math] целые: в частности, если [math]\alpha(t + 1) \lt \alpha(t)[/math], то [math]c(\alpha(t), t) = (A/\nu)c(\alpha(t + 1), t + 1) \ge 2Ak^2/\nu[/math]

Если сепараторы, используемые для построения сети достаточно хорошие, то(мы проверим чуто позже) существует такое целое число [math]\gamma [/math], не превосходящее [math]\alpha(t_f) [/math], но при этом отличающееся от [math]\alpha(t_f) [/math]не более чем на константу, не зависящую от [math]N[/math], такое, что для любого узла [math]x[/math], находящегося на уровне [math]\gamma [/math], все ключи, являющиеся потомками узла [math]x[/math] в момент времени [math]t_f[/math] адресуются толко к ключам, являющимся потомками [math]x[/math]. Следовательно, построеная сеть может быть дополнена до сортирующей единственным слоем из параллельных сортирующих сетей, каждая из которых будет содержать [math]k^{d - \gamma} [/math] входных проводов.


Далее мы будем использовать следующие утверждения


Лемма 3.1 Если [math]\alpha(i, t) \neq 0[/math] тогда


[math] \sum\limits^d_{j=0} k^{j-i}a(j, t) = \begin{cases} Nk^{-i}, &\text{ $i = \alpha(t)$,}\\ Nk^{-i} - \dfrac{c(i,t)}{A^2k^2}, &\text{ $i \gt \alpha(t)$,} \end{cases} [/math]


Доказательство Это утверждение следует из того [math]\sum\limits^d_{j=0} k^ja(j, t) = N [/math]

Непосредственно, когда [math] i = \alpha(t) [/math] и подставляется


[math] a(j,t) = \begin{cases} 0, &\text{ $j \not\equiv i \mod 2$,}\\ c(j, t), &\text{ $j = \alpha(t)$,}\\ (1 - \dfrac{1}{A^2k^2})c(j, t) &\text{ $\alpha(t) \lt j \lt i, \quad j \equiv i \mod 2$} \end{cases} [/math]


где [math] c(j, t) = c(i, t)A^{j-i}[/math] при [math]i\ge\alpha(t)+2[/math].


лемма 3.2 Если [math]\alpha(t + 1) \gt \alpha(t) [/math] тогда [math]\alpha(t) = 0[/math] или [math]c(\alpha(t),t)\le Ak^2/\nu[/math]

Доказательство Если [math]\alpha(t+1) \gt \alpha(t) \gt 0[/math], тогда [math]\alpha(t) - 1 \lt \alpha^*(t + 1) [/math], а значит и [math]c(\alpha(t),t) \lt 2Ak^2/\nu[/math].

Анализ работы сети

Мусор