Изменения

СНМ (реализация с помощью леса корневых деревьев)

2856 байт добавлено, 18:45, 7 января 2018

→‎union

При объединении двух множеств, корень одного дерева подвешивается к другому (операция ''<tex>\mathrm{union}</tex>''). Таким образом, чтобы определить, в каком множестве находится элемент достаточно пройтись по ссылкам по дереву вверх до корня (операция ''<tex>\mathrm{get}</tex>'').

Без использования дополнительных "улучшений", такое дерево может выродиться в линейный список, где <tex>\mathrm{get}</tex> будет работать за линейное время, и никакого выигрыша по сравнению с [[СНМ(наивные_реализации)|наивными ~~реализацими~~реализациями]] не будет. Выигрыш в скорости можно получить, используя две эвристики: '''объединение по рангу''' (union by rank) и '''сжатие пути''' (path compression).

===Объединение по рангу===

Эта эвристика аналогична [[СНМ(списки_с_весовой_эвристикой)|весовой эвристике у связных списков]]. Идея в том, чтобы при объединении подвешивать дерево с меньшей глубиной к дереву с большей.

Вместо того, чтобы явно хранить высоту дерева, можно хранить его ранг, который по сути является некой верхней оценкой высоты дерева. У дерева, состоящего ровно из одного элемента ранг равен <tex>10</tex>. При объединении дерево с меньшим рангом подвешивается к дереву с большим, и ранг объединенного дерева становится равным большему из этих двух рангов. Если ранги объединяемых деревьев равны, то не важно какое к какому дереву подвешивать, но ранг объединенного дерева следует делать большим на <tex>1</tex>.

===Сжатие пути===

Для реализации СНМ будем поддерживать следующие массивы: <tex>p[x]</tex> {{---}} массив "родителей", <tex>r[x]</tex> {{---}} массив рангов.

===='''get'''====

'''function''' '''get'''(x: '''int'''): '''int''' '''if''' p[x] != x p[x] = get(p[x]) '''return''' p[x]

===='''union'''====

'''function''' '''union'''(x: '''int''', y: '''int'''): x = get(x) y = get(y) '''if''' x == y '''return''' '''if''' r[x] == r[y] r[x]++ '''if''' r[x] < r[y] p[x] = y '''else''' p[y] = x Также возможна реализация функции <tex>\mathrm{get}</tex> без использования <tex>\mathrm{O(\log n)}</tex> дополнительной памяти. ===='''get'''==== '''function''' '''get'''(x: '''int'''): '''int''' root = x '''while''' p[root] != root root = p[root] i = x '''while''' p[i] != i j = p[i] p[i] = root i = j '''return''' root

==Асимптотика==

| ''<tex>\mathrm{get}</tex>'' || <tex>\mathrm{O(\log n)}</tex> || <tex>\mathrm{O(\mathrm{\alpha(m, n)})}</tex>

|-

| ''<tex>\mathrm{union}</tex>'' || <tex>\mathrm{O(\log n)}</tex> || <tex>\mathrm{O(1\mathrm{\alpha(m, n)})}</tex>

|}

Где <tex>m</tex> {{---}} общее количество операций, <tex>n</tex> {{---}} полное количество элементов, <tex>\mathrm{\alpha(m, n)}</tex> {{---}} функция, обратная к функции Аккермана (если <tex>m</tex> операций <tex>\mathrm{get }</tex> и <tex>n</tex> элементов).

Докажем, что если глубина множества (т.е. его ранг) равна <tex>k</tex>, то в нем содержится как минимум <tex>2^k</tex> элементов. Из этого свойства следует, что глубина множества с <tex>n</tex> элементами есть <tex>\mathrm{O(\log n)}</tex>, а значит и время работы операции <tex>\mathrm{get}</tex> является логарифмическим.

{| class="wikitable" border = 1

|-

!<tex>\mathbf{m \backslash n}</tex> !! <tex>\mathbf{0 }</tex> !! <tex>\mathbf{1 }</tex> !! <tex>\mathbf{2 }</tex> !! <tex>\mathbf{3 }</tex> !! <tex>\mathbf{4 }</tex> !! <tex>\mathbf{5}</tex>|- style = "text-align = center"| ! <tex>\mathbf{1 }</tex> || <tex>1 </tex> || <tex>2 </tex> || <tex>4 </tex> || <tex>8 </tex> || <tex>16 </tex> || <tex>32</tex>

|-

| ! <tex>\mathbf{2 }</tex> || <tex>2 </tex> || <tex>4 </tex> || <tex>16 </tex> || <tex>65536 </tex> || <tex>2^{2^{16}}</tex> || <tex>2^{2^{2^{16}}}</tex>

|-

| ! <tex>\mathbf{3 }</tex> || <tex>2 </tex> || <tex>16 </tex> || <tex>\underbrace{2^{2^{\cdot^{\cdot^{\cdot^2}}}}}_{17}</tex> || <tex>\underbrace{2^{2^{\cdot^{\cdot^{\cdot^2}}}}}_{A(3, 2)}</tex> || <tex>\cdots</tex> || <tex>\cdots</tex>

|-

| ! <tex>\mathbf{4 }</tex> || <tex>2 </tex> || <tex>\underbrace{2^{2^{\cdot^{\cdot^{\cdot^2}}}}}_{17}</tex> || <tex>\cdots</tex> || <tex>\cdots</tex> || <tex>\cdots</tex> || <tex>\cdots</tex>

|}

Функция, обратная функции Аккермана <tex>\mathrm{\alpha(m, n)}</tex>, равна минимальному <tex>i</tex> такому, что <tex>\mathrm{A \left (i, \left [\~~frac~~dfrac{m}{n} \right ] \right )} \geqslant \log n</tex>. Как видно из таблицы значений для функции Аккермана, обратная функция для любых значений, которые могут возникнуть при решении прикладных задач, не превышает 4, то есть можно считать, что операция <tex>\mathrm{get }</tex> выполняется за константное время.

===Анализ реализации с ранговой эвристикой===

Проведем анализ реализации с ранговой эвристикой. Будем доказывать, ~~будем доказывать более слабую оценку (итерированный логарифм~~ что амортизационная стоимость <tex>\mathrm{get} = \mathrm{O(\log^{*}n)} </tex>.{{Определение|definition='''Итерированный логарифм''' (англ. ''Iterated logarithm'')<tex>\mathrm{\log^*n}</tex> — минимальное число логарифмирований <tex>n</tex>, необходимое для получения значения, не превосходящего <tex>1</tex>.}}'''Пример''': <tex>\mathrm{\log^*_2 16} = 3</tex> Рассмотрим <tex> a n </tex> операций <tex> \mathrm{union} </tex> и <tex> b m </tex> операций <tex> \mathrm{get} </tex> (. Можем считать, что число операций <tex> \mathrm{union} </tex> равно числу элементов множества, так как количество операций <tex>\mathrm{union}</tex> не превосходит количество элементов множества <tex>n</tex>. Заметим, что <tex>m\geqslant n</tex>, так как при каждом вызове операции <tex>\mathrm{union}</tex> b дважды вызывается операция <tex> a \mathrm{get}</tex>).Не теряя общности, будем считать, что <tex> \mathrm{union } </tex> принимает в качестве аргументов представителей,

то есть <tex> \mathrm{union(v_1,v_2)} </tex> заменяем на <tex> \mathrm{union(get(v_1),get(v_2))} </tex>.

<tex>^*</tex><tex>\mathrm(\log^*n)</tex> — минимальное число логарифмирований <tex>n</tex>, необходимое для получения значения, не превосходящего <tex>1</tex>

Оценим стоимость операции <tex> \mathrm{get(v)} </tex>.

Обозначим <tex> \mathrm{R(v)} </tex> — ранг вершины, <tex>\mathrm{P(v)}</tex> — представитель множества, содержащего <tex>\mathrm{v}</tex>,

<tex> \mathrm{L(v)} </tex> — отец вершины,

<tex> \mathrm{K(v)} </tex> — количество вершин в поддереве, корнем которого является <tex> \mathrm{v }</tex>.

{{Утверждение

|statement=

<tex> \mathrm{R(P(v))} > \geqslant \mathrm{R(v)} </tex>

|proof=

Из Если <tex>\mathrm{v}</tex> — представитель множества, то <tex>\mathrm{P(v)}=\mathrm{v}</tex> и <tex> \mathrm{R(P(v))} = \mathrm{R(v)} </tex>. Иначе, из принципа работы функции <tex> \mathrm{~~get~~union} </tex> следует:

#<tex> \mathrm{R(L(v))}>\mathrm{R(v)} </tex>.

#Между <tex> \mathrm{v } </tex> и <tex> \mathrm{P(v)} </tex> существует путь вида: <tex> \mathrm{v } \rightarrow \mathrm{L(v)} \rightarrow \mathrm{L(L(v))} \rightarrow \dots \rightarrow \mathrm{P(v)} </tex>.

Записав неравенство из первого пункта вдоль пути из второго пункта, получаем требуемое.

}}

{{Утверждение

|statement=

<tex> \mathrm{R(v)} = i \Rightarrow {\mathrm{K(v)}} \geqslant {2^i }</tex>

|proof=

Докажем по индукции:

Из последнего утверждения следует:

#{{Утверждение|statement=<tex> \mathrm{R(v)} \leqslant \~~log_2a~~ log_2n </tex>.#}}{{Утверждение|statement=Количество вершин ранга <tex> i \leqslant \dfrac{n} {~~a \over~~ 2^i} </tex>.|proof=Если бы это было не так, то просуммировав количество вершин всех рангов, мы получили бы число большее <tex>n</tex>. Это противоречит условию, по которому <tex>n</tex> — число всех вершин. Значит утверждение верно.}}

{{Теорема

|statement=

Амортизационная стоимость <tex> \mathrm{get} = \mathrm{O(\log^{*}an)} </tex>

|proof=

~~Рассмотрим некоторое число <tex> x </tex>.~~

~~Разобьем наши ребра на три класса:~~

~~#Ведут в корень или в сына корня.~~

~~#<tex> \mathrm{R(P(v))} \geqslant x^{\mathrm{R(v)}}</tex>.~~

~~#Все остальные.~~

~~Обозначим эти классы <tex> T_1, T_2, T_3 </tex>.~~

~~Амортизационная стоимость~~

~~<center>~~Рассмотрим все вызовы функции <tex>~~S = {\sum_{~~\mathrm{get~~}} \limits}~~ (~~{\sum_{v:v \in \mathrm{get~~u)}</tex>. В процессе выполнения каждой операции двигаемся вверх по одному из деревьев, заканчивая поиск в его корне. Если вершина <tex>u</tex> не корень и не сын корня,~~v \in T_1} \limits 1}~~+~~{\sum_{v:v \in~~ то во время рекурсивных вызовов функции <tex>\mathrm{get(u)}~~,v \in T_2} \limits 1} + {\sum_{v: \in~~ </tex> текущее значение <tex>\mathrm{~~get~~R(L(u))}~~,v \in T_3} \limits 1} )~~ </ b tex> возрастает.Пусть </tex>,m</~~center~~tex>~~где~~ — количество вызовов операции <tex> ~~{v \in~~ \mathrm{get} (u)} </tex> ~~означает, что ребро~~, ~~начало которого находится в~~ <tex> v n</tex>~~, было пройдено во время выполнения текущего~~ — количество вызовов операции <tex> \mathrm{~~get~~union(v, u)} </tex>, и <tex>m\geqslant n</tex>. ~~Ребро~~ Разделим все вершины на <tex> v 4</tex> ~~эквивалентно вершине, в которой оно начинается.~~типа:

~~В силу того, что~~ :1. <tex>u</tex> — корень. Таких вызовов <tex>\mathrm{get(u)}</tex> будет ровно <tex>m</tex>.:2. <tex>u</tex> — сын корня. Таких вызовов <tex>\~~sum_~~mathrm{vget(u)}</tex> будет не больше чем <tex>m</tex>.Оставшиеся вершины разделим на:v :3. Быстро растущие вызовы — такие что <tex>\mathrm{R(P(u))} \in geqslant i^{\mathrm{~~get~~R(u)}}</tex>,v где <tex>i</tex> — число из диапазона <tex dpi="150">e ^{\~~in T_1~~frac{1}{e} } < i < 2</tex> <tex dpi="150">(e ^{\~~limits~~ frac{1} {e}}\approx </tex> <tex>1.44</tex><tex dpi= "150">)</tex>.:4. Медленно растущие вызовы — <tex>\mathrm{R(P(u))} < i^{\mathrm{OR(1u)}} </tex> ~~получаем:~~.

Для первых двух типов вершин одна операция <~~center~~tex>\mathrm{get(u)}</tex>работает за истинное время <tex>~~S =~~ \mathrm{O(1)} ~~+ {\sum_{\mathrm{get}} \limits} ~ {\sum_{v:v \in \mathrm{get},v \in T_2} \limits} 1~~</~~b+ {\sum_{\mathrm{get}} \limits} ~ {\sum_{v:v \in \mathrm{get}~~tex>,v поэтому их суммарное время работы не превышает <tex>2\~~in T_3} \limits} 1 / b~~cdot m</tex>.~~</center>~~

~~Во время~~ При каждом вложенном вызове функции <tex> \mathrm{get(u)} </tex> ~~после прохождения K ребер из второго класса~~ для вершин третьего типа ранг по условию возрастает до <tex> i^{\mathrm{R(~~v_1~~u)} }</tex>. Ранг вершины может меняться в пределах от <tex>0</tex> до <tex>\~~geqslant x^{x^~~log_2n</tex>. Значит количество рекурсивных вызовов равняется количеству возведений в степень <tex>\mathrm{R(n)}</tex> числа <tex>i</tex>,необходимых для достижения числа <tex>\log_2n</tex>. Или что то же самое, количеству логарифмирований по основанию <tex>i</tex> числа <tex>\log_2n</tex> для получения <tex>1</tex> и еще одному логарифмированию для получения <tex>0</tex>.Количество логарифмирований описывается функцией <tex dpi="130">\log^*_{i} \left (\log_2 n \right )</tex>.С учетом последнего логарифмирования формула примет вид <tex dpi="130">\log^*_{i}n</tex>.^Тогда время работы <tex>m</tex> быстро растущих вызовов равно <tex>\mathrm{xO(m\cdot \log^~~{R(v~~* n)~~}}}}}~~} </tex>.

~~Из выше сказанного и первого следствия второго утверждения получаем~~Поскольку количество вершин с рангом <tex>k</tex> не превышает число <tex>\dfrac{n}{2^k}</tex>, ~~что:~~то суммарное время работы медленно растущих вызовов равно

<texdpi="150"> \sum_u \limits i^{\mathrm{R(u)}}=\sum_{~~v:v~~ k=0}^{\log n} \in limits \sum_{\mathrm{~~get~~{R(u)}=k}},v \~~in T_2~~limits i^k \leqslant \sum_{k=0}^{\log n} \limitsi^k \cdot \frac{n}{2^k} \leqslant n \~~mathrm~~cdot \sum_{k=0}^{\logn} \limits \dfrac{i^*_x(\log_2a)k}{2^k} = \mathrm{O(~~\log^*a~~n)}</tex>.

</center>

~~Для того~~В итоге получаем, ~~чтобы~~ что суммарное время работы операции <tex> \mathrm{~~\log^*_x~~get(~~\log_2a~~u)} </tex> ~~существовал необходимо, чтобы~~ равняется <tex> ~~x > e ^{ 1 /e } \approx 1,44 </tex>.~~ ~~Рассмотрим сумму<center> <tex>{\sum_{~~T = \mathrm{~~get}~~O(m)} ~~\limits} ~ {\sum_{v:v \in~~ + \mathrm{~~get},v~~ O(m\~~in T_3}~~ cdot \~~limits} 1/b~~ < ~~{\sum_{\mathrm{get}} \limits} ~ {\sum_{v:v \in \mathrm{get},v \in T_3} \limits} 1/a~~ ~~</tex>. </center>~~ ~~Из первого утверждения и в силу использования сжатия путей следует,что <tex> \mathrm{R(P(x)~~log^* n)}~~</tex> cтрого увеличивается при переходе по ребру из <tex> T_3 </tex>.~~ ~~Как максимум через <tex> x^{~~+\mathrm{RO(kn)}~~} </tex> переходов ребро перестанет появляться в классе <tex> T_3 </tex>.~~ ~~<center><tex>{\sum_{\mathrm{get}} \limits}~ {\sum_{v:v \in \mathrm{get},v \in T_3} \limits} 1/a~~ = ~~{\sum_v \limits ~\sum_{~~\mathrm{~~get}: in ~ this ~~~ O(m\~~mathrm{get} ~ v~~ cdot \~~in T_3} \limits }~~ ~~1/a \leqslant \sum_v \limits x~~log^~~{\mathrm{R(v~~*n + n)}~~} /a~~</tex>.~~</center>~~ ~~Из второго следствия второго утверждения следует:<center>~~ С учетом того факта что <tex> {m\~~sum_{\mathrm{get}} \limits}~ {\sum_{v:v \in \mathrm{get},v \in T_3} \limits} 1/a \leqslant \sum_{Rank=0}^{\log_2a} \limits {ax^{Rank} \over 2^{Rank} a}~~geqslant n</tex>~~.</center>~~ ~~При <tex> x < 2~</tex>:<center><tex>{\sum_{\mathrm{get}} \limits}~ {\sum_{v:v \in \mathrm{get}~~,~~v \in T_3} \limits} 1/a\leqslant\sum_{Rank=0}^{\log_2a} \limits {x^{Rank} \over 2^{Rank}}\leqslant\sum_{Rank=0}^\infty \limits {x^{Rank} \over 2^{Rank}}\leqslant{ 2 \over 2-x } = \mathrm{O(1)}</tex>.</center>~~ ~~Итак~~ амортизированное время работы равно <tex> ~~S = \mathrm{O(1)} +~~ \mathrm{O(\log^*xn)} ~~+ \mathrm{O(1)} = \mathrm{O(\log^*x)} </tex>.В силу того, что интервал <tex>(1.45; 2)~~</tex> ~~не пустой, теорема доказана~~.

}}

~~==Ссылки==~~

* [http://habrahabr.ru/blogs/algorithm/104772/ Система непересекающихся множеств {{---}} описание этой реализации на habrahabr.ru]

* [http://ru.wikipedia.org/wiki/Функция_Аккермана Функция Аккермана {{---}} Википедия]

== См. также ==

* [[СНМ (наивные реализации)]]

== ~~Литература~~ Источники информации==* [http://habrahabr.ru/blogs/algorithm/104772/ Система непересекающихся множеств {{---}} описание этой реализации на habrahabr.ru]* [http://ru.wikipedia.org/wiki/Функция_Аккермана Функция Аккермана {{---}} Википедия]

* Томас Кормен, Чарльз Лейзерсон, Рональд Ривест, Клиффорд Штайн. Алгоритмы. Построение и анализ — Вильямс, 2010. - стр 589. — ISBN 978-5-8459-0857-4

[[Категория: Дискретная математика и алгоритмы]]

[[Категория: Структуры данных]]

I am dark black

693

правки

Изменения

СНМ (реализация с помощью леса корневых деревьев)

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты