Обсуждение:PSRS-сортировка — различия между версиями

Материал из Викиконспекты
Перейти к: навигация, поиск
 
(не показано 29 промежуточных версий 3 участников)
Строка 1: Строка 1:
==Распараллеливание простых сортировок==
+
<b>Алгоритм Борувки</b> (англ. ''Borůvka's algorithm'') — алгоритм поиска минимального остовного дерева (англ. ''minimum spanning tree, MST'') во взвешенном неориентированном связном графе.
===Быстрая параллельная сортировка===
+
Впервые был опубликован в 1926 году Отакаром Борувкой.
В алгоритме быстрой сортировки, исходный массив разбивается на 2 части, обработка которых ведется не зависимо (поэтому может выполняться параллельно). Задачи должны создаваться внутри параллельной области, однако если мы поместим директиву omp parallel внутрь функции, то у нас будут рекурсивно создаваться потоки (количество потоков при этом будет зависеть от размера обрабатываемого массива). Создание потока — очень сложная операция, требующая значительных вычислительных затрат, поэтому потоки мы создадим до вызова функции. И так, поток, выполнивший область omp single добавит в пул одну или две задачи и завершится. Но мы должны дождаться пока эти задачи будут выполнены. При этом, добавлять задачи в пул будет не только этот поток, но любой другой поток (ведь он может взять из пула задачу и обработать часть массива). Оптимизированный вариант сортировки отличается от обычного лишь тем, что при небольшом точным значением можно поиграть) размере массива сортировка выполняется последовательно.
+
 
  '''void''' quickSort('''double'''[] a, '''long''' n)  
+
==Описание алгоритма==
    '''long''' i = 0, j = n
+
# Построим граф <tex>T</tex>. Изначально <tex>T</tex> содержит все вершины из <tex>G</tex> и не содержит ребер (каждая вершина в графе <tex>T</tex> {{---}} отдельная компонента связности).
    '''float'''  mid = a[n / 2]; // опорный элемент
+
# Будем добавлять в <tex>T</tex> ребра следующим образом, пока <tex>T</tex> не является деревом
 +
#* Для каждой компоненты связности находим минимальное по весу ребро, которое связывает эту компоненту с другой. 
 +
#* Добавим в <tex>T</tex> все найденные рёбра.
 +
# Получившийся граф <tex>T</tex> является минимальным остовным деревом графа <tex>G</tex>.
 +
 
 +
Данный алгоритм может работать неправильно, если в графе есть ребра равные по весу. Например, полный граф из трех вершин, вес каждого ребра равен один. В <tex>T</tex> могут быть добавлены все три ребра. Избежать эту проблему можно, выбирая в первом пункте среди ребер, равных по весу, ребро с наименьшим номером.
 +
 
 +
Доказательство будем проводить, считая веса всех ребер различными.
 +
 
 +
==Доказательство корректности==
 +
{{Лемма
 +
|id=lemma1
 +
|statement=Рассмотрим связный неориентированный взвешенный граф <tex> G = (V, E)  </tex> с инъективной весовой функцией <tex>w : E \to \mathbb{R}</tex> .
 +
Тогда после первой итерации главного цикла алгоритма Борувки получившийся подграф можно достроить до ''MST''.
 +
|proof=Предположим обратное: пусть любое ''MST'' графа <tex>G</tex> не содержит <tex>T</tex>. Рассмотрим какое-нибудь ''MST''. Тогда существует ребро <tex>x</tex> из <tex>T</tex> такое что <tex>x</tex> не принадлежит ''MST''. Добавив ребро <tex>x</tex> в ''MST'', получаем цикл в котором <tex>x</tex> не максимально, т.к оно было минимальным. Тогда, исходя из [[Критерий Тарьяна минимальности остовного дерева|критерия Тарьяна]], получаем противоречие.
 +
}}
 +
 
 +
 
 +
{{Теорема
 +
|id=th1.
 +
|statement=Алгоритм Борувки строит ''MST''.
 +
|proof=Очевидно, что алгоритм Борувки строит дерево.Будем доказывать что после каждой итерации главного цикла в алгоритме Борувки текущий подграф <tex>T</tex> можно достроить до ''MST''.
 +
 
 +
Докажем это по индукции.
 +
 
 +
'''База. ''' <tex>n = 1</tex>([[#lemma1|Лемма]]).
 +
 
 +
'''Переход. '''  Пусть лес <tex>T</tex>, получившийся после <tex>n</tex> итераций алгоритма, можно достроить до ''MST''. Докажем, что после <tex>n+1</tex> итерации получившийся лес <tex>T'</tex> можно достроить до ''MST''. Предположим обратное: <tex>T'</tex> нельзя достроить до ''MST''. Тогда существует <tex>F</tex> = ''MST'' графа <tex>G</tex>, содержащее <tex>T</tex>  и не содержащее <tex>T'</tex>. Тогда рассмотрим цикл, получающийся добавлением в <tex>F</tex> какого-нибудь ребра <tex>x</tex> из <tex>T' {{---}} T</tex>. На этом цикле имеется ребро, большее по весу чем ребро <tex>x</tex>, иначе компонента для которой <tex>x</tex> является минимальным ребром ни с кем больше ни связана. Исходя из [[Критерий Тарьяна минимальности остовного дерева|критерия Тарьяна]], получаем противоречие.
 +
 
 +
'''Получаем. '''  <tex>T'</tex> можно достроить до ''MST''. Следовательно предположение индукции верно.
 
   
 
   
    '''do'''  
+
}}
      '''while''' (a[i] < mid) i++
+
 
      '''while''' (a[j] > mid) j--
+
==Реализация==
 
+
У вершины есть поле comp — компонента связности, которой принадлежит эта вершина.
      '''if''' (i <= j)
+
 
        swap(a[i], a[j])
+
{| width = 100%
        i++ j--
+
|-
      '''while''' (i <= j);
+
|
+
  <font color=green>// <tex>G</tex> {{---}} исходный граф</font>
    '''if''' (n < 100) // если размер массива меньше 100
+
  <font color=green>// <tex>w</tex> {{---}} весовая функция</font>
                  // сортировка выполняется в текущем потоке
+
  '''function''' <tex>\mathtt{boruvkaMST}():</tex>
      '''if''' (j > 0) quickSort(a, j)
+
      '''while''' <tex>T\mathtt{.size} < n - 1</tex>                                 
      '''if''' (n > i) quickSort(a + i, n - i)
+
            '''for''' <tex>k \in </tex> Component                                // Component — множество компонент связности в <tex>T</tex>
      '''return'''
+
                <tex>w(\mathtt{minEdge}[k])=\infty</tex>                     // для каждой компоненты связности вес минимального ребра = <tex>\infty</tex>
 
+
            <tex>\mathtt{findComp(}T\mathtt{)}</tex>                                      // разбиваем граф <tex>T</tex> на компоненты связности обычным ''dfs''-ом
+
            '''for''' <tex>\mathtt{(u,v)} \in  E </tex>
    '''spawn'''
+
                '''if''' <tex>\mathtt{u.comp} \neq \mathtt{v.comp}</tex>
      '''if''' (j > 0) quickSort(a, j)
+
                    '''if''' <tex>w(\mathtt{minEdge}[\mathtt{u.comp}]) < w(u,v)</tex>
    '''spawn'''
+
                        <tex>\mathtt{minEdge}[\mathtt{u.comp}] = (u,v)</tex>
      '''if''' (n > i) quickSort(a + i, n - i)
+
                    '''if''' <tex>w(\mathtt{minEdge}[\mathtt{v.comp}]) < w(u,v)</tex>
    '''sync'''
+
                        <tex>\mathtt{minEdge}[\mathtt{v.comp}] = (u,v)</tex>
=== Анализ эффективности параллельного алгоритма ===
+
            '''for''' <tex>k \in </tex> Component                               
Каждую итерацию массив делится случайно. На первой итерации при делении на <tex>2</tex> части с меньшими и большими элеменами с разделяющим ведущем пусть длина меньшей части <tex>n1</tex>. Алгоритм отправляет её на другой процессор сортироваться параллельно, а так как она короче, то и досортируется быстрее, значит время её сортировки не учитывается. Длина большей части <tex>N-n1</tex>, с этой частью мы проделываем точно такую же итерацию с разделителем <tex>n2</tex>. И так далее до момента, когда число свободных процессоров закончится, то есть до разделителя <tex>nk</tex>. Где <tex>[p / 100]=2^k</tex>.
+
                <tex>T\mathtt{.addEdge}(\mathtt{minEdge}[k])</tex>                    // добавляем ребро если его не было в <tex>T</tex>
 +
      '''return''' <tex>T</tex>   
 +
|}
 +
 
 +
==Пример==
 +
{| class = "wikitable"
 +
! Изображение !! Компоненты связности !! Описание
 +
|-
 +
|[[Файл:Step_0.png|200px]]
 +
|
 +
|Начальный граф <tex>T</tex>
 +
|-
 +
|[[Файл:Step_1.png|200px]]
 +
| <center>'''a''' '''b''' '''c''' '''d''' '''e'''</center>
 +
|Распределим вершины по компонентам.
 +
|-
 +
|[[Файл:1step_2.png|200px]]
 +
| <center>'''a''' '''b'''  '''c'''  '''d''' '''e'''</center>
 +
|Пометим минимальные пути между компонентами.
 +
|-
 +
|[[Файл:1step_3.png|200px]]<br/>
 +
|<center>'''bae'''     '''cd'''</center>
 +
|Объединим соединившиеся компоненты в одну и добавим минимальные рёбра к графу <tex>T</tex><br/>
 +
|-
 +
|[[Файл:1step_4.png|200px]]
 +
|<center>'''bae'''  '''cd'''</center>
 +
|Пометим минимальные пути между компонентами.
 +
|-
 +
|[[Файл:1step_5.png|200px]]
 +
|<center>'''baecd'''</center>
 +
|Объединим соединившиеся компоненты в одну и добавим минимальные рёбра к графу <tex>T</tex><br/>
 +
|}
 +
 
 +
==Асимптотика==
 +
Внешний цикл повторяется <tex>\log{V}</tex> раз, так как количество компонент связности каждый раз уменьшается в двое и изначально равно количеству вершин. Что же касается внутреннего цикла, то он выполняется за <tex>E</tex>, где <tex>E</tex> {{---}} количество рёбер в исходном графе. Следовательно конечное время работы алгоритма <tex>O(E\log{V})</tex>.
 +
 
 +
==См. также==
 +
* [[Алгоритм Прима]]
 +
* [[Алгоритм Краскала]]
 +
* [[Алгоритм двух китайцев]]
 +
 
 +
== Ссылки ==
 +
* [http://rain.ifmo.ru/cat/view.php/vis/graph-spanning-trees/mst-2006 Визуализатор алгоритма]
 +
* [http://www.csee.wvu.edu/~ksmani/courses/fa01/random/lecnotes/lecture11.pdf Minimum Spanning Trees]
 +
* [[wikipedia:ru:Алгоритм Борувки|Алгоритм Борувки— Википедия]]
  
<tex>T=(N+(N-n1)+(N-n1-n2)+...+(N-n1-...-nk))*t</tex>, где <tex>t</tex> - время перестановки.
+
[[Категория: Алгоритмы и структуры данных]]
 +
[[Категория: Остовные деревья ]]

Текущая версия на 18:02, 3 декабря 2014

Алгоритм Борувки (англ. Borůvka's algorithm) — алгоритм поиска минимального остовного дерева (англ. minimum spanning tree, MST) во взвешенном неориентированном связном графе. Впервые был опубликован в 1926 году Отакаром Борувкой.

Описание алгоритма[править]

  1. Построим граф [math]T[/math]. Изначально [math]T[/math] содержит все вершины из [math]G[/math] и не содержит ребер (каждая вершина в графе [math]T[/math] — отдельная компонента связности).
  2. Будем добавлять в [math]T[/math] ребра следующим образом, пока [math]T[/math] не является деревом
    • Для каждой компоненты связности находим минимальное по весу ребро, которое связывает эту компоненту с другой.
    • Добавим в [math]T[/math] все найденные рёбра.
  3. Получившийся граф [math]T[/math] является минимальным остовным деревом графа [math]G[/math].

Данный алгоритм может работать неправильно, если в графе есть ребра равные по весу. Например, полный граф из трех вершин, вес каждого ребра равен один. В [math]T[/math] могут быть добавлены все три ребра. Избежать эту проблему можно, выбирая в первом пункте среди ребер, равных по весу, ребро с наименьшим номером.

Доказательство будем проводить, считая веса всех ребер различными.

Доказательство корректности[править]

Лемма:
Рассмотрим связный неориентированный взвешенный граф [math] G = (V, E) [/math] с инъективной весовой функцией [math]w : E \to \mathbb{R}[/math] . Тогда после первой итерации главного цикла алгоритма Борувки получившийся подграф можно достроить до MST.
Доказательство:
[math]\triangleright[/math]
Предположим обратное: пусть любое MST графа [math]G[/math] не содержит [math]T[/math]. Рассмотрим какое-нибудь MST. Тогда существует ребро [math]x[/math] из [math]T[/math] такое что [math]x[/math] не принадлежит MST. Добавив ребро [math]x[/math] в MST, получаем цикл в котором [math]x[/math] не максимально, т.к оно было минимальным. Тогда, исходя из критерия Тарьяна, получаем противоречие.
[math]\triangleleft[/math]


Теорема:
Алгоритм Борувки строит MST.
Доказательство:
[math]\triangleright[/math]

Очевидно, что алгоритм Борувки строит дерево.Будем доказывать что после каждой итерации главного цикла в алгоритме Борувки текущий подграф [math]T[/math] можно достроить до MST.

Докажем это по индукции.

База. [math]n = 1[/math](Лемма).

Переход. Пусть лес [math]T[/math], получившийся после [math]n[/math] итераций алгоритма, можно достроить до MST. Докажем, что после [math]n+1[/math] итерации получившийся лес [math]T'[/math] можно достроить до MST. Предположим обратное: [math]T'[/math] нельзя достроить до MST. Тогда существует [math]F[/math] = MST графа [math]G[/math], содержащее [math]T[/math] и не содержащее [math]T'[/math]. Тогда рассмотрим цикл, получающийся добавлением в [math]F[/math] какого-нибудь ребра [math]x[/math] из [math]T' {{---}} T[/math]. На этом цикле имеется ребро, большее по весу чем ребро [math]x[/math], иначе компонента для которой [math]x[/math] является минимальным ребром ни с кем больше ни связана. Исходя из критерия Тарьяна, получаем противоречие.

Получаем. [math]T'[/math] можно достроить до MST. Следовательно предположение индукции верно.
[math]\triangleleft[/math]

Реализация[править]

У вершины есть поле comp — компонента связности, которой принадлежит эта вершина.

  // [math]G[/math] — исходный граф
  // [math]w[/math] — весовая функция
  function [math]\mathtt{boruvkaMST}():[/math]
      while [math]T\mathtt{.size} \lt  n - 1[/math]                                   
           for [math]k \in [/math] Component                                 // Component — множество компонент связности в [math]T[/math]
               [math]w(\mathtt{minEdge}[k])=\infty[/math]                      // для каждой компоненты связности вес минимального ребра = [math]\infty[/math]
           [math]\mathtt{findComp(}T\mathtt{)}[/math]                                      // разбиваем граф [math]T[/math] на компоненты связности обычным dfs-ом
           for [math]\mathtt{(u,v)} \in  E [/math]
               if [math]\mathtt{u.comp} \neq \mathtt{v.comp}[/math]
                   if [math]w(\mathtt{minEdge}[\mathtt{u.comp}]) \lt  w(u,v)[/math]
                       [math]\mathtt{minEdge}[\mathtt{u.comp}] = (u,v)[/math]
                   if [math]w(\mathtt{minEdge}[\mathtt{v.comp}]) \lt  w(u,v)[/math]
                       [math]\mathtt{minEdge}[\mathtt{v.comp}] = (u,v)[/math]
           for [math]k \in [/math] Component                                 
               [math]T\mathtt{.addEdge}(\mathtt{minEdge}[k])[/math]                     // добавляем ребро если его не было в [math]T[/math]
      return [math]T[/math]     

Пример[править]

Изображение Компоненты связности Описание
Step 0.png Начальный граф [math]T[/math]
Step 1.png
a b c d e
Распределим вершины по компонентам.
1step 2.png
a b c d e
Пометим минимальные пути между компонентами.
1step 3.png
bae cd
Объединим соединившиеся компоненты в одну и добавим минимальные рёбра к графу [math]T[/math]
1step 4.png
bae cd
Пометим минимальные пути между компонентами.
1step 5.png
baecd
Объединим соединившиеся компоненты в одну и добавим минимальные рёбра к графу [math]T[/math]

Асимптотика[править]

Внешний цикл повторяется [math]\log{V}[/math] раз, так как количество компонент связности каждый раз уменьшается в двое и изначально равно количеству вершин. Что же касается внутреннего цикла, то он выполняется за [math]E[/math], где [math]E[/math] — количество рёбер в исходном графе. Следовательно конечное время работы алгоритма [math]O(E\log{V})[/math].

См. также[править]

Ссылки[править]