Изменения

Участник:Dominica

19 312 байт убрано, 03:05, 30 апреля 2016

Нет описания правки

Ажтаи (Ajtai), Комлос (Komlos) и Шимереди (Szemeredi) сконструировали сортирующую сеть на N входов глубины <tex> O(\log N) </tex>, при они не углублялись в исследование значения константы, получавшейся при правильном соблюдении необходимой ассимптотики. Впоследствии Патерсон выяснил, что <tex> O(\log N) </tex> можно заменить на <texdpi = "200" > c1 \log_2 N </tex> с константой приблизительно равной <tex> 6100 </tex>. Здесь будет описана более поздняя реализация, которая включает в себя меньшую константу <tex>c</tex>mid r_i, ~~а именно, будет доказано, что для любого целого числа <tex>N</tex> такого,что <tex>N~~ p_i = 1 \~~ge 2^{78}</tex> существует сортирующая сеть на <tex>N</tex> входов, такая, что глубина в худшем случае будет <tex>1830~~ mid \~~log_2 N - 58657~~ sum f_i</tex>.

~~Основными составяющими этой конструкции будут сортирующие сети на~~ {{Задача|definition= <~~tex~~ol>M<~~/tex~~li> ~~входов, такие ,что~~ Имеется один станок.<~~tex~~/li>M<~~/tex~~li> ~~относительно мало. Мы назовем их~~ Есть <tex>Mn</tex>~~-сортировщиками~~работ, каждая из которых выполняется за единицу времени. ~~Для любых выбранных положительных целых чисел <tex>M~~</~~tex~~li> и <~~tex~~li>NКаждая работа имеет своё время появления </tex> ~~таких что <tex> N \ge M~~r_i</tex>~~, конструкция будет включать в себя <tex>N~~. </~~tex~~li> ~~проводов, и будет сделана из~~ <~~tex~~li>~~M</tex>-сортировщиков, глубина которых в худшем случае~~ Для каждой работы задана монотонно неубывающая функция <tex>~~(48 + о(1))\log_MN + 115~~f_i</tex> ~~при <tex>M \to \inf~~. </~~tex~~li>.~~(Стоит отметить, что асимптотическое <tex>o(1)~~</~~tex~~ol> ~~здесь относится к~~ Необходимо минимизировать <tex>M\sum f_i, </tex>~~, а не к~~ где <tex>Nf_i</tex>). ~~== Представление в виде дерева и разделители ==~~ ~~Сначала введем все необходимые понятия для построения сортирующей сети.~~ {{~~Определение|definition=~~'''Идеальным разделителем''' будем называть сеть, выходные провода которой разделены на K блоков одинакового размера, таких, что принимая на вход любые ---}} значение функции <tex>af_i</tex> ~~значений, сеть размещает первые <tex>a/k</tex> минимальные по величине ключи~~ в ~~первый блок, следующие~~ момент завершения выполнения задания с номером <tex>~~a/k~~i</tex> ~~по величине ключи – во второй, и т.д~~.

}}

Эти идеальные разделители могут быть использованы как модули для построения сортирующей сети на <tex>N</tex> входов, где <tex>N = k^d</tex> для некоторого положительного числа d. Такая сеть будет представлять собой композицию сетей <tex>N_0, N_1, N_2 \dots N_{d-1}</tex>, где <tex>N_t</tex> – парраллельная композиция <tex>k^t</tex> идеальных разделителей одинакового размера. <tex>k^{d - t}</tex> Выходных проводов уровня <tex>N_t</tex> разделены на <tex>k</tex> блоков одинакового размерв и каждый из этих блоков формирует вход для идеального разделителя из N_{t+1}.

Можно рассмотреть другую интерпретацию этой конструкции. k^d входных данных мы будем рассматривать как листья полного k-ичного дерева глубины d; каждый модуль(разделитель) из N_t будем считать узлом, находящимся на высоте t в нашем дереве. Будем считать, что в каждый момент времени t = 0, 1, 2, ... в - 1 входные провода распределены по всему уровню t нашего дерева. В то же время, каждый узел х на t уровне принимает k^{d - t} проводов и эти провода затем используются как вход для идеального разделителя который разбивает их на k блоков одинакового размера в промежуток времени между t и t + 1. Выходные провода из j получившегося блока идут в j ребенка вершины x. К моменту времени d каждый лист дерева содершит в себе только один провод, а этот провод содержит в себе значение, которое и приписывается к листу.

К сожалению, эта схема описывает сортирующую сеть глубины <tex>\Omega((\log_k N)(\log_m N)) </tex>: каждый идеальный разделитель на а проводов, если его делать из М-разделителей, должен иметь глубину более чем <tex>\log_M(\dfrac{k-1}{k}a). (Чтобы осознать это, заметим, что для каждого выхода y должно быть более чем <tex>\dfrac{k -1}{k}a</tex> входов x , таких, что ключ мог бы дойти от x до y). К счастью, схему можно переделать так, чтобы она описывала сортирующую сеть глубины ==Решение за <tex>O(~~\log_M N~~n^3)</tex> : идеальные разделители можно заменить на более слабые модули константной глубины,чья слабость будет компенсироваться более сложным перемещением ключей через дерево.==

~~Слабые модули мы назовем сепараторами~~Эта задача может быть решена сведением к решению [[Венгерский алгоритм решения задачи о назначениях | задачи о назначениях]]. ~~У каждого такого сепаратора есть а выходных проводов~~А именно, ~~которые делятся на блоки~~ покажем, что решение задачи состоит сопоставлении <tex>n</tex> различным заданиям различных времен начала выполнения работы. Если сопоставляем работе <tex>i</tex> время <tex>t</tex> ~~F_1~~, ~~B_1, B_2, \dots, B_k, F_2~~ то вклад в целевую функцию будет <tex> f_i(t + 1) </tex> ~~так~~. Далее будет показано, что при построении оптимального расписания нам нужно будет рассмотреть всего <tex> ~~|F_1| = |F_2|~~n</tex> различных времен начала работ. Следовательно, подобная задача может быть решена за <tex> ~~|B_1| = |B_2| = \dots = |B_k|~~ O(n^3)</tex>;.

~~Как правило, "обрамляющие блоки"~~ Поскольку <tex>~~F_1~~f_i</tex> ~~и <tex>F_2</tex> гораздо меньше всех остальных. В каком~~{{---}} монотонно неубывающие функции, то ~~смысле, можно сказать~~это значит, что сепаратор аппроксимирует идеальный разделитель. Тогда будем измерять точность аппроксимации величинами <tex> \delta_F, \varepsilon_F </tex> и <tex>\varepsilon_B</tex>. Сортирующая сеть, с такими же выходными проводами в оптимальном расписании работы должны начинать исполняться как и наш сепаратор, принимая на вход I, состоящее из a отдельных проводов, распределяет соответствующие <tex>I_j</tex> в выходные блоки <tex>B_j</tex>можно раньше. ~~Сераратор же распределяет вход~~ Первые <tex>In</tex> таким образом, что 1) для каждого <tex> j = 1, 2, \dots, k, </tex> не более <tex>\varepsilon_B a</tex> ключей из <tex>I_j</tex> не попадут в <tex>B_j</tex>.2)самых ранних для каждого целого j такого, что <tex>1\le j\le \delta_F|F_i|</tex>не более <tex>\varepsilon_F j</tex> из <tex>j</tex> самых маленьких чисел могут не попасть в <tex>F_1</tex> и не более начала исполнения времен <tex>~~\varepsilon_F j~~t_i</tex> ~~из <tex>j</tex> самых больших чисел~~ могут ~~не попасть в <tex>F_2</tex>~~Что касается перемещения значений в дереве, то в момент времени <tex>t = 0</tex> все <tex>k^d</tex> проводов входят в корень. Между временами <tex> t</tex> и <tex>t + 1</tex> каждый узел <tex>x</tex>, в который входят какие-нибудь провода, использует эти а проводов как вход для сепаратора, с разумно выбранным размером для выходных блоков. Провода из каждого выходного блока <tex>B_j</tex> посывлаются в <tex>j</tex>того сына узла <tex>x</tex>а провода попавшие в <tex>F_1</tex> или <tex>F_2/tex> посылаются обратно к родителю <tex>x</tex>. (Если <tex>x</tex>. - корень, то <tex>F_1</tex> и <tex>F_2</tex> должны быть ~~пустыми. Так как <tex>F_1</tex> и <tex>F_2</tex> сравнительно маленькие~~вычислены следующим алгоритмом, то большинство значений провалится ниже к листам дерева; так как сепаратор не идеальный, то некоторые ключи могут быть посланы вниз в ~~неправильном направлениии. Свойство 1) гарантирует~~котором мы предполагаем, что очень малое количество собъется с пути, а свойство 2) гарантирует, что большинство из этих ключей вернутся назад и смогут исправить свое положение позже.~~== Конструкция сети ==~~Пускай число детей у каждой вершины <tex>k</tex> будет степенью двойки, и число входных ключей - <tex> N = k ^ d </tex>. В любой момент времени <tex>t</tex> все <tex>N</tex> проводов распределены внутри дерева таким образом, что число проводов, содержащихся в вершине <tex>x</tex> зависит только от работы отсортированы по неубыванию времени появления <tex>t</tex> и глубины <tex>i</tex> на которой находится вершина <tex>x</tex>. Тогда пускай <tex>a(i, t)</tex> будет описывать это число. Значение <tex>a(i, t)</tex> зависит от двух параметров <tex>A</tex> и <tex>\nu</tex>, таких, что <tex>\nu < 1 </tex> и <tex>A\nu > 1r_i</tex>:

~~В самом начале~~ <tex>t_1</tex> = <tex>r_1</tex> '''for''' <tex> i \in \{ 2 \ldots n \} </tex> <tex>t_i</tex> = <tex>\max(r_i, ~~число проводов, входящих в корень :~~t_{i-1} + 1)</tex>

~~<tex>a(0, 0) = N</tex>~~

~~При переходе к <tex>t = 1</tex> корень делит <tex>N</tex> проводов на <tex>k</tex> групп и отправляет их своим <tex> k </tex> детям:~~{{Лемма ~~<tex>a(1, 1)~~ |id= ~~N/ k</tex>~~lemma1 ~~При переходе к <tex>t~~ |statement= 2Существует оптимальное расписание </tex> ~~каждый узел, находящийся на 1 уровне отправляет <tex>N\nu / Ak^2 </tex> своих <tex>N/k~~S</tex> ~~проводов обратно~~ в ~~корень и распределяет оставшиеся провода равномерно среди детей :~~ котором все <tex> ~~a(0, 2) = \dfrac{\nu}{Ak}N~~n</tex>~~<tex> a(2, 2) = \dfrac{Ak - \nu}{Ak^3}N</tex>~~ Обозначим <tex>\alpha (t)</tex> и <tex>\omega (t)</tex> - верхний и нижний уровни, соответственно, такие что на на них содержатся непустые узлы на момент времени <tex>t</tex>. Иначе говоря, <tex>\alpha (t)</tex> - это наименьшее <tex>i</tex>, такое что ~~<tex>a(i, t) \neq 0</tex>, а <tex>\omega (t)</tex> - это наибольшее <tex>i~~задач распределены по всем временам </tex>~~, такое что~~ ~~<tex>a~~t_i (i~~, t) \neq 0</tex>~~ ~~Так получаем, что~~ ~~<tex>\alpha (0) = \omega (0) = 0; \quad \alpha (1) = \omega (1)~~ = 1~~; \quad \alpha (2) = 0 \omega (2) = 2; </tex>~~ ~~Значения <tex>\alpha (t)</tex> и <tex>~~\~~omega(t~~ldots n)</tex> ~~расходятся в момент <tex>t = 2</tex>и сойдутся~~, ~~когда перемещение значений по сети и их сортировка будет окончена~~которые выбирает приведенный выше алгоритм.~~Запишем<tex>\alpha^*(t) = \dfrac{t\log \dfrac{1}{\nu} - \log N + \log(2A\nu k^3)}{\log A}</tex>~~и~~<tex>\omega^*(t)~~ |proof= ~~\dfrac{t\log \dfrac{1}{\nu} + \log(A\nu k)}{\log Ak}</tex>~~ ~~Пускай <tex>\alpha(t)</tex> будет наименьшим неотрицательным челым числом~~Предположим, ~~таким~~ что ~~<tex>\alpha(t) \ge \alpha^*(t),\quad \alpha (t)\equiv t\mod 2~~ в некоторое оптимальное расписание </tex> ~~Пускай <tex>\omega(t)~~S</tex> ~~будет наименьшим челым числом, таким что~~ входят времена <tex>t_1 \~~omega(t) \ge \omega^*(t)~~ldots t_j,~~\quad \omega (t)\equiv t\mod 2~~ </tex> ~~Поскольку~~ где <tex>~~A\nu \ge 1 </tex> получаем, что~~ j <~~tex>\alpha^*(t + 1) \le \alpha^* (t) + 1, \omega^*(t + 1) \le \omega^* (t) </tex> для любого <tex>t~~n</tex> и ~~поэтому~~ ~~<tex> |\alpha(t + 1) - \alpha(t) | = 1, \quad |\omega(t + 1) - \omega(t)| = 1 </tex>~~ максимально возможное для ~~любого <tex>t</tex>~~этого расписания.~~Нижнее значение может уменьшаться и увеличиваться~~Из того, но как в среднем оно спадает со скоростью <tex>\log\dfrac{1}{\nu} </tex> уровней на каждые <tex> \log(Ak) </tex> итераций. Верхнее же значение первые <tex>\log N/\log\dfrac{1}{\nu} </tex> итераций колеблется между значениями 0 и 1 ,а дальше начинает так же уменьщаться со скоростью <tex>\log\dfrac{1}{\nu}</tex> уровней на каждые <tex>\log(A)</tex> итераций. Обозначим за <tex>t_f </tex> время, когда верхнее и нижнее алгоритме выбирались значения ~~совпадут: <tex>t_f </tex> - это наибольшее целое положтельное число такое, что:<tex> \alpha(t) < \omega(t)</tex> <tex> 1 < t < t_f </tex>Также<tex> \alpha(t_f) = omega(t_f) </tex>~~ (Это будет понятно из дальнейшего изложения. Так же будет проверено, что общее значение <tex> \alpha(t_f)</tex> и <tex>omega(t_f) </tex> меньше, чем <tex>d</tex>) ~~<tex> c(i, t) = \dfrac{N}{A\nu k} A^i\nu ^i </tex>Значение <tex> c(i, t) </tex> можно рассматривать как вместимость узла на <tex> i </tex> уровне во время <tex> t </tex>:~~ для ~~любого <tex> t</tex>, такого, что <tex> 1 < t < t_f </tex> имеем<tex> \dfrac{a(\alpha(t), t)}{c(\alpha(t), t)} = 1 </tex>,~~ ~~<tex> \dfrac{a(i, t)}{c(i, t)} = 1 - \dfrac{1}{A^2 k^2} </tex> где~~ ~~<tex> \alpha(t) < i < \omega(t) </tex>~~и ~~<tex> i \equiv t \mod 2 </tex>~~ ~~<tex> a(\omega(t),t) = Nk ^{-\omega(t)} - dfrac{c(\omega(t), t)}{A^2k^2}</tex>(Если~~ ~~<tex> i \not\equiv t \mod 2</tex> тогда<tex> a(i, t) = 0 </tex>) Начиная с~~ ~~<tex> N k ^{-\omega(t)} \le c(\omega(t), t) < A^2k^2Nk^{-\omega(t)}), </tex>имеем~~ ~~<tex> 0 < \dfrac{a(\omega(t), t)}{c(\omega(t), t)} \le 1 - \dfrac{1}{A^2k^2} </tex>~~ ~~Начиная с~~ ~~<tex>c(\alpha(t), t) \ge 2k^2 /tex> мы имеем~~ <tex>~~c(i, t) \ge 2A^2k^2~~ t_i</tex> ~~когда <tex>i\ge \alpha(t) + 2 </tex>. Это~~ следует ~~из того~~, что ~~все<tex> a(i, t) </tex> целые.~~ Чтобы как-то перераспределить провода между временами <tex>t</tex> и <tex>t + 1 </tex> каждый узел на уровне i посылает <tex>\pi(i, t) </tex> значений своим родителям и <tex>\chi(i, t) </tex> ~~значений каждому из своих <tex>k</tex> детей. Если <tex>2 \le t < t_f </tex>, то~~ ~~<tex> \pi(\alpha(t),t) =\begin{cases}0,&\text{если $\alpha(t + 1)>\alpha(t)$,}\\\dfrac~~t_{~~\nu}{AK}c(a(t),t), &\text{если $\alpha(t~~ j + 1~~)>\alpha(t)$.}\end{cases}</tex>~~ ~~<tex> \pi(i,t) = \dfrac{A\nu k - 1}{A^2k^2~~}~~c(i,t),\qquad\quad \text{если $\alpha(t) < i < \omega(t)$,}~~</tex> ~~<tex> \pi(\omega(t),t) =\begin~~{~~cases}\dfrac~~{~~A\nu k~~ - ~~1}{A^2k^2}c(\omega(t),t),&\text{ $\omega(t + 1)>\omega(t)$,}\\\alpha(\omega(t),t),&\text{если $\omega(t + 1)<\omega(t)$,}\end{cases}</tex>~~ ~~<tex> \chi(\alpha(t),t) =\begin{cases}\dfrac{1}{k}c(\alpha(t),t),&\text{ $\alpha(t + 1)>\alpha(t)$,}\\\dfrac{Ak~~ - ~~\nu}{Ak^2}c(\alpha(t),t),&\text{если $\alpha(t + 1)<\alpha(t)$,}\end{cases}</tex>~~ ~~<tex> \chi(i,t) = \dfrac{Ak~~ - ~~\nu~~}~~{Ak^2~~}~~c(i,t),\qquad\quad \text{если $\alpha(t) < i < \omega(t)$,}</tex>~~ ~~<tex> \pi(\omega(t),t) =\begin{cases}\alpha(\omega(t + 1), t + 1)), &\text{ $\omega(t + 1)>\omega(t)$,}\\0,&\text{если $\omega(t + 1)<\omega(t)$,}\end{cases}</tex>~~ ~~Отметим~~минимальное возможное время, ~~что для все~~ большее <tex>~~\pi(i~~t_j, t)</tex> ~~и <tex>\chi(i, t)</tex> целые:~~ в ~~частности, если <tex>\alpha(t + 1) < \alpha(t)</tex>, то<tex>c(\alpha(t), t) = (A/\nu)c(\alpha(t + 1), t + 1) \ge 2Ak^2/\nu</tex>~~ Если сепараторы, используемые для построения сети достаточно хорошие, то(мы проверим чуто позже) существует такое целое число <tex>\gamma </tex>, не превосходящее <tex>\alpha(t_f) </tex>, но при этом отличающееся от <tex>\alpha(t_f) </tex>не более чем на константу, не зависящую от <tex>N</tex>, такое, что для любого узла <tex>x</tex>, находящегося на уровне <tex>\gamma </tex>, все ключи, являющиеся потомками узла <tex>x</tex> в момент времени <tex>t_f</tex> адресуются толко к ключам, являющимся потомками <tex>x</tex>. Следовательно, построеная сеть может быть дополнена до сортирующей единственным слоем из параллельных сортирующих сетей, каждая из которых будет содержать <tex>k^{d которое вообще можно начать выполнять какое- ~~\gamma} </tex> входных проводов.~~ ~~Далее мы будем использовать следующие утверждения~~ ~~Лемма 3~~нибудь задание.~~1 Если <tex>\alpha(i, t) \neq 0</tex> тогда~~ ~~<tex> \sum\limits^d_{j=0} k^{j-i}a(j, t) =\begin{cases}Nk^{-i}, &\text{ $i = \alpha(t)$,}\\Nk^{-i} - \dfrac{c(i,t)}{A^2k^2}, &\text{ $i > \alpha(t)$,}\end{cases}</tex>~~ ~~ДоказательствоЭто утверждение следует из того<tex>\sum\limits^d_{j=0} k^ja(j, t) = N </tex>~~ ~~Непосредственно, когда <tex> i = \alpha(t) </tex> и подставляется~~ ~~<tex> a(j,t) =\begin{cases}0, &\text{ $j \not\equiv i \mod 2$,}\\c(j, t), &\text{ $j = \alpha(t)$,}\\(1 - \dfrac{1}{A^2k^2})c(j, t) &\text{ $\alpha(t) < j < i, \quad j \equiv i \mod 2$}\end{cases~~}~~</tex>~~ ~~где <tex> c(j, t) = c(i, t)A^{j-i~~}~~</tex> при <tex>i\ge\alpha(t)+2</tex>.~~ ~~лемма 3.2 Если <tex>\alpha(t + 1) > \alpha(t) </tex> тогда <tex>\alpha(t) = 0</tex> или <tex>c(\alpha(t),t)\le Ak^2/\nu</tex>~~ ~~ДоказательствоЕсли <tex>\alpha(t+1) > \alpha(t) > 0</tex>, тогда <tex>\alpha(t) - 1 < \alpha^*(t + 1) </tex>, а значит и <tex>c(\alpha(t),t) < 2Ak^2/\nu</tex>.~~ ~~== Анализ работы сети ==~~Посторонним ключем будем называть ключ, находящийся в узле <tex>x</tex>, котороый при этом не будет отправлен ниже по дереву при переходе к следующему шагу. Посторонним ключем порядка <tex>r</tex> будем называть такой ключ, который останется посторонним, даже если его переместить в его предка, находящегося на <tex>r</tex> уровней выше по дереву.(По сути, посторонний ключ - посторонний ключ порядка ноль).Далее мы докажем, что в момент времени <tex>t_f</tex> узлы на уровне <tex>\alpha(t_f) </tex> не содержат посторонних ключей порядка <tex>r</tex> для некоторой константы <tex>r</tex>, зависящей только от <tex>A, k, \nu</tex> Для этого рассмотрим следующее предположение Для любого <tex> i = 0, 1, \dots , d </tex> и для любого <tex> r = 0, 1, \dots , d </tex> каждый узел на уровне <tex>i</tex> содержит менее чем <tex>\mu \delta^r c(i, t) </tex> посторонних ключей порядка <tex> r </tex>. Так как <tex>c(\alpha(t_f), t_f) < 2 A^2 k^2 </tex>, то остается только проверить, что предположение выполняеся во время tex>t_f</tex> для некоторых <tex>\mu</tex> и <tex>\delta</tex> (зависящего только от <tex> i = 0, 1, \dots , d </tex>) ,такого, что <tex>\delta < 1 </tex> Используем индукцию по t, чтобы доказать, что лемма выполняется для любого <tex>t = 0, 1, \dots , t_f </tex> для некоторых <tex>\mu</tex> и <tex>\delta</tex>(зависящей только от <tex>k, A , \nu </tex>) такой, что <tex> \delta < 1 </tex>. Это может быть верным только если модули сепараторов используемые в сети достаточно хорошие. При условии, что все эти сепараторы (за исключением того, кторый используется в корне в момент времени <tex>t = 0 </tex>) имеют одинаковые параметры <tex>\varepsilon_B, \delta_F, \varepsilon_F </tex> а у того сепаратора, который в корне, вместо <tex>\varepsilon_B </tex> будет <tex>\varepsilon^*</tex>, мы подберем ограничения на <tex>\mu, \delta, \varepsilon_B, \delta_F, \varepsilon_F, \varepsilon </tex> так, что можно будет проделать индукцию по <tex>t </tex>. ~~== Конструкция разделителей ==~~

Dominica

264

правки

Изменения

Участник:Dominica

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты