Изменения

Splay-дерево

9497 байт добавлено, 03:45, 22 апреля 2018

Нет описания правки

'''Сплей-дерево ''' (англ. ''Splay-tree)''~~' {{---}}~~ ) — это [[Дерево поиска, наивная реализация | двоичное дерево поиска]]. Оно позволяет находить быстрее те данные, которые использовались недавно. Относится к разряду сливаемых деревьев. Сплей-дерево было придумано Робертом Тарьяном и Даниелем Слейтером в <tex>1983 </tex> году.

==Эвристики==

Для того, чтобы доступ к недавно найденным данным был быстрее, надо, чтобы эти данные находились ближе к корню. Этого мы можем добиться, используя различные эвристики:

* '''Move to Root''' {{---}} совершает повороты вокруг ребра <tex>(x, p)</tex>, где <tex>x</tex> - — найденная вершина, <tex>p</tex> - — ее предок, пока <tex>x</tex> не окажется корнем дерева. Однако можно построить такую последовательность операций, что амортизированное время доступа к вершине будет <tex> O\Omega(n) </tex>.

* '''Splay''' {{---}} также совершает повороты, но чередует различные виды поворотов, благодаря чему достигается логарифмическая амортизированная оценка. Она будет подробно описана ниже.

'''Пример''': При последовательном использовании операций "move to root" для вершин <tex>A</tex> и <tex>B</tex> требуется по <tex>6</tex> поворотов, в то время как при использовании операции "splay" для вершины <tex>B</tex> достаточно <tex>3</tex> поворотов.

[[file:Move_to_root.png|750px]]

[[file:Splay.png|750px]]

==Операции со splay-деревом==

===~~Splay~~splay(~~Tree~~tree, x)==="~~Splay~~splay" делится на <tex>3 </tex> случая:====~~Zig~~zig====Если <tex>p</tex> - — корень дерева с сыном <tex>x</tex>, то совершаем один поворот вокруг ребра <tex>(x, p)</tex>, делая <tex>x</tex> корнем дерева. Данный случай является крайним и выполняется только один раз в конце, если изначальная глубина <tex>x</tex> была нечетной.

[[file:~~ZigSplay~~Зиг.~~gif~~png|~~500px~~800px|~~Zig -~~ zig — поворот]]====~~Zig~~zig-~~Zig~~zig====Если <tex>p</tex> - — не корень дерева, а <tex>x</tex> и <tex>p</tex> - — оба левые или оба правые дети, то делаем поворот ребра <tex>(p, g)</tex>, где <tex>g</tex> отец <tex>p</tex>, а затем поворот ребра <tex>(x, p)</tex>.

[[file:~~ZigZigSplay~~Зиг_зиг.~~gif~~png|~~500px~~800px|~~Zig~~zig-zig - — поворот]]====~~Zig~~zig-~~Zag~~zag====Если <tex>p</tex> - — не корень дерева и <tex>x</tex> - — левый ребенок, а <tex>p</tex> - — правый, или наоборот, то делаем поворот вокруг ребра <tex>(x, p)</tex>, а затем поворот нового ребра <tex>(x, g)</tex>, где <tex>g</tex> - — бывший родитель <tex>p</tex>.

[[file:~~ZigZagSplay~~Зиг_заг2.~~gif~~png|~~500px~~900px|~~Zig~~zig-zag - — поворот]]

Данная операция занимает <tex>O(d)</tex> времени, где <tex>d</tex> - — длина пути от <tex>x</tex> до корня. В результате этой операции <tex>x</tex> становится корнем дерева, а расстояние до корня от каждой вершины сокращается примерно пополам, что связано с разделением случаев "zig-zig" и "zig-zag".

===~~Find~~find(~~Tree~~tree, x)===Эта операция выполняется как для обычного [[Дерево поиска, наивная реализация|бинарного дерева]], только после нее запускается операция ~~Splay~~splay.

===~~Merge~~merge(~~Tree1~~tree1, ~~Tree2~~tree2)===У нас есть два дерева <tex>~~Tree1~~\mathtt{tree1}</tex> и <tex>~~Tree2~~\mathtt{tree2}</tex>, причём подразумевается, что все элементы первого дерева меньше элементов второго. Запускаем ~~Splay~~ splay от самого большого элемента в дереве <tex>~~Tree1~~\mathtt{tree1}</tex> (пусть это элемент <tex>i</tex>). После этого корень <tex>~~Tree1~~\mathtt{tree1}</tex> содержит элемент <tex>i</tex>, при этом у него нет правого ребёнка. Делаем <tex>~~Tree2~~\mathtt{tree2}</tex> правым поддеревом <tex>i</tex> и возвращаем полученное дерево.

===~~Split~~split(~~Tree~~tree, x)===Запускаем ~~Splay~~ splay от элемента <tex>x</tex> и возвращаем два дерева, полученные отсечением правого или левого поддерева от корня, в зависимости от того, содержит корень элемент больше или не больше, чем <tex>x</tex>.

===~~Add~~add(~~Tree~~tree, x)===Запускаем ~~Split~~split(~~Tree~~tree, x), который нам возвращает деревья <tex>~~Tree1~~\mathtt{tree1}</tex> и <tex>~~Tree2~~\mathtt{tree2}</tex>, их подвешиваем к <tex>x</tex> как левое и правое поддеревья соответственно.

===~~Remove~~remove(~~Tree~~tree, x)=== Запускаем ~~Splay~~ splay от <tex>x</tex> элемента и возвращаем Merge от его детей.

==Анализ операции splay==

[[Амортизационный анализ | Амортизационный анализ]] сплей-дерева проводится с помощью метода потенциалов. Потенциалом рассматриваемого дерева назовём сумму рангов его вершин. Ранг вершины <tex>x</tex> — это величина, обозначаемая <tex>r(x)</tex> и равная <tex>\log_2 C(x)</tex>, где <tex>C(x)</tex> — количество вершин в поддереве с корнем в <tex>x</tex>.

{{Лемма

|id = Lemma1

|statement=

Амортизированное время операции splay вершины <tex>x</tex> в дереве с корнем <tex>t</tex> не превосходит <tex>3r(t) - 3r(x) + 1</tex>

Разберём случаи в зависимости от типа шага:

'''~~Zig~~zig'''. Поскольку выполнен один поворот, то ~~время~~ амортизированное время выполнения шага <tex>T = 1 + r'(x) + r'(p) - r(x) - r(p)</tex> (поскольку только у вершин <tex>x</tex> и <tex>p</tex> меняется ранг). Ранг вершины <tex>p</tex> уменьшился, поэтому <tex>T \le leqslant 1 + r'(x) - r(x)</tex>. Ранг вершины <tex>x</tex> увеличился, поэтому <tex>r'(x) - r(x) \ge geqslant 0</tex>. Следовательно, <tex>T \le leqslant 1 + 3r'(x) - 3r(x)</tex>. '''zig-zig'''. Выполнено два поворота, амортизированное время выполнения шага <tex>T = 2 + r'(x) + r'(p) + r'(g) - r(p) - r(x) - r(g)</tex>. Поскольку после поворотов поддерево с корнем в <tex>x</tex> будет содержать все вершины, которые были в поддереве с корнем в <tex>g</tex> (и только их), поэтому <tex>r'(x) = r(g)</tex>. Используя это равенство, получаем: <tex>T = 2 + r'(p) + r'(g) - r(x) - r(p) \leqslant 2 + r'(p) + r'(g) - 2r(x)</tex>, поскольку <tex>r(x) \leqslant r(p)</tex>. Далее, так как <tex>r'(p) \leqslant r'(x)</tex>, получаем, что <tex>T \leqslant 2 + r'(x) + r'(g) - 2r(x)</tex>. Мы утверждаем, что эта сумма не превосходит <tex>3(r'(x) - r(x))</tex>, то есть, что <tex>r(x) + r'(g) - 2r'(x) \leqslant -2</tex>. Преобразуем полученное выражение следующим образом: <tex>(r(x) - r'(x)) + (r'(g) - r'(x)) = \log_2 \dfrac {C(x)}{C'(x)} + \log_2 \dfrac {C'(g)}{C'(x)}</tex>.

~~'''Zig-zig'''. Выполнено два поворота~~Из рисунка видно, ~~амортизированное время выполнения шага~~ что <tex>~~T = 2 + r~~C'(xg) + r'C(px) ~~+ r~~\leqslant C'~~(g) - r(p) - r~~(x~~) - r(g~~)</tex>, значит, сумма выражений под логарифмами не превосходит единицы. ~~Поскольку после поворотов поддерево с корнем в~~ Далее, рассмотрим сумму логарифмов <tex>x\log_2 a + \log_2 b = \log_2 ab</tex> ~~будет содержать все вершины, которые были в поддереве с корнем в~~ . При <tex>ga + b \leqslant 1</tex> ~~(и только их), поэтому~~ произведение <tex>~~r'(x) = r(g)~~ab</tex>~~. Используя это равенство, получаем:~~ по неравенству между средними не превышает <tex>~~T = 2 + r'(p) + r'(g) - r(x) - r(p)~~ \~~le 2 + r'(p) + r'(g) - 2r(x)~~dfrac{1}{4}</tex>. А поскольку логарифм — функция возрастающая, ~~поскольку~~ то <tex>~~r(x)~~ \~~le r(p)~~log_2 ab \leqslant -2</tex>, что и является требуемым неравенством.

~~Далее~~'''zig-zag'''. Выполнено два поворота, амортизированное время выполнения шага <tex>T = 2 + r'(x) + r'(p) + r'(g) - r(x) - r(p) - r(g)</tex>. Поскольку <tex>r'(x) = r(g)</tex>, ~~так как~~ то <tex>T = 2 + r'(p) ~~\le~~ + r'(g) - r(x) - r(p)</tex>. Далее, ~~получаем~~так как <tex>r(x) \leqslant r(p)</tex>, ~~что~~ то <tex>T \le leqslant 2 + r'(xp) + r'(g) - 2r(x)</tex>.

Мы утверждаем, что эта сумма не превосходит <tex>32(r'(x) - r(x))</tex>, то есть, что <tex>r'(xp) + r'(g) - 2r'(x) \le leqslant -2</tex>. ~~Преобразуем полученное выражение следующим образом:~~ Но, поскольку <tex>~~(r(x) -~~ r'(x)p) + (r'(g) - r2r'(x)) = \log_2 \~~frac~~dfrac {C'(xp)}{C'(x)} + \log_2 \~~frac~~dfrac {C'(g)}{C'(x)}\leqslant -2</tex>- аналогично доказанному ранее, что и требовалось доказать.

~~Из рисунка видно~~Итого, получаем, что амортизированное время шага zig-zag не превосходит <tex>C2(r'(gx) ~~+ C~~- r(x)) \~~le C~~leqslant 3(r'(x)</tex>, значит, сумма выражений под логарифмами не превосходит единицы. Далее, рассмотрим сумму логарифмов <tex>\log_2 a + \log_2 b = \log_2 ab</tex>. При <tex>a + b \le 1</tex> произведение <tex>ab</tex> по неравенству между средними не превышает <tex>1/4</tex>. А поскольку логарифм - ~~функция возрастающая, то <tex>\log_2 ab \le -2~~r(x))</tex>~~, что и является требуемым неравенством~~.

~~'''Zig-zag'''. Выполнено два поворота, амортизированное~~ Поскольку за время выполнения операции splay выполняется не более одного шага типа zig, то суммарное время не будет превосходить <tex>~~T = 2 + r'~~3r(~~x) + r'(p) + r'(g~~t) - r3r(x) ~~- r(p) - r(g)~~+ 1</tex>, поскольку утроенные ранги промежуточных вершин сокращаются (входят в сумму как с плюсом, так и с минусом). ~~Поскольку~~ Тогда суммарное время работы splay <tex>r'T_{splay} \leqslant 3\log_2 N - 3\log_2 C(x) + 1 = rO(g\log_2 N)</tex>, то где <tex>N</tex>T — число элементов в дереве.}} = ~~2 + r'(p) + r'(g)~~ = Статическая оптимальность сплей-дерева =={{Теорема|statement=Если к ключам <tex>1 \ldots n</tex>, сложенным в сплей- ~~r(x)~~ дерево выполняется <tex>m</tex> запросов, к <tex>i</tex>- ~~r(p)~~му ключу осуществляется <tex>k_i</tex> запросов, где <tex>k_i > 0</tex>~~. Далее~~, ~~так как~~ то суммарное время работы не превышает <tex>rO(x) m \~~le r~~cdot H(pp_1, p_2, \ldots , p_n))</tex>, то где <tex>p_i = k_i / m</tex>, <tex>H</tex> — шенноновская энтропия|proof=Известно, что <tex>T H(p_1, p_2, \~~le 2 + r'(p) + r'(g~~ldots , p_n) = - 2rc \cdot \displaystyle \sum_{i=1}^n (xp_i \cdot \log_{2}p_i)</tex>{{---}} [[Энтропия_случайного_источника | шенноновская энтропия]].

~~Мы утверждаем, что эта сумма не превосходит~~ Пусть <tex>~~2(r'~~s(x) ~~- r~~= \displaystyle \sum_{y} w(x)y)</tex>~~, то есть, что~~ {{---}} количество вершин в поддереве с корнем в <tex>~~r'(p) + r'(g) - 2r'(~~x~~) \le -2~~</tex>. ~~Но, поскольку~~ А <tex>r~~'(p) + r'(g) - 2r'~~(x) = \~~log_2 \frac~~log_{~~C'(p)~~2}~~{C'~~s(x)~~} + \log_2 \frac{C'(g)}{C'(x)} \le -2~~</tex> {{- ~~аналогично доказанному ранее, что и требовалось доказать~~--}} ранг вершины.

~~Итого, получаем~~Обозначим за <tex>r</tex> корень <tex>splay</tex>-дерева.Из предыдущей теоремы известно, что ~~амортизированное время шага zig-zag не превосходит~~ <tex>~~2(r'(x) - r(x))~~ a_{splay} \le leqslant 1+3(r'(xr) - r(x))</tex>.

~~Поскольку за время выполнения операции splay выполняется не более одного шага типа zig~~Пусть <tex dpi="130">w(x_i) = p_i =</tex> <tex dpi="180"> {k_i \over m}</tex>, ~~то суммарное время не будет превосходить~~ тогда <tex dpi="130">k_i = p_i \cdot m</tex>.<br><tex>m+3mr(r)-3 \displaystyle \sum_{i=1}^n k_ir(x_i) \leqslant m+3mr(r)-3 \displaystyle \sum_{i+1}^n k_i\log_{2}w(x_i) =</tex> <tex>m+3mr(r)-3 \displaystyle \sum_{i=1}^n (p_i\cdot m\cdot \log_{2}p_i) = m(1+3r(tr)-3 \displaystyle \sum_{i=1}^n p_i\log_{2}p_i) = (*) </tex>Так как вершина <tex>r</tex> {{---}} корень <tex>splay</tex>- 3rдерева, то очевидно, что <tex>s = \displaystyle \sum_{y} w(xy) + = 1</tex>, ~~поскольку утроенные ранги промежуточных вершин сокращаются~~ следовательно <tex>r(r) = \log_{2}s(r)=0</tex>. Поэтому <tex>(*) = m(1+H(p_1,\ldots ,p_n)) = O(mH(~~входят в сумму как с плюсом~~p_1,\ldots , ~~так и с минусом~~p_n))</tex>, ч.т.д.

}}

==Теорема о близких запросах в сплей-дереве==

{{Теорема

|about =

о близких запросах в сплей-дереве

|statement =

Пусть в сплей-дерево сложены ключи <tex> 1, \dotsc, n </tex>. Зафиксируем один из ключей <tex> f </tex>. Пусть выполняется <tex> m </tex> запросов к ключам. Тогда суммарное время на запросы есть <tex> \displaystyle O(n \log_{2} n + m + \sum_{i=1}^{m} \log_2 ( \lvert q_{i} - f \rvert + 1)) </tex>, где <tex> q_{i} </tex> {{---}} значение в вершине, к которой обращаются в <tex> i </tex>-ый запрос.

|proof =

Для доказательства теоремы воспользуемся методом потенциалов:

<tex> a_{i} = t_{i} + \Phi_{i} - \Phi_{i-1} </tex>.

По условию выполняется <tex> m </tex> запросов, следовательно

<tex> T = \displaystyle \sum_{i=1}^{m} t_{i} = \sum_{i=1}^{m} \left (a_{i} + \Phi_{i-1} - \Phi_{i} \right) = \sum_{i=1}^{m} a_{i} + \sum_{i=1}^{m} \left ( \Phi_{i-1} - \Phi_{i} \right) </tex> <tex> (\ast) </tex>.

Введем следующие обозначения:

* Весом узла с ключом <tex> q </tex> будем называть величину <tex> w(q) =\displaystyle \dfrac {1}{\left (\lvert q - f \rvert + 1 \right )^{2}} </tex>.

* Размером узла, содержащего ключ <tex> q </tex>, будем называть величину <tex> s(q) = \displaystyle \sum_{y} w(y) </tex>, где <tex> y </tex> {{---}} узлы поддерева с корнем в <tex> q </tex>.

* <tex> r(q) = \log_{2}s(q) </tex> {{---}} ранг узла.

* Потенциал дерева после <tex> i </tex>-го запроса обозначим как <tex> \Phi_{i} = \displaystyle \sum_{q=1}^{n} r(q) = \displaystyle \sum_{q=1}^{n} \log_{2}s(q) </tex>.

Пусть <tex> W </tex> {{---}} вес дерева. Тогда <tex> W = \displaystyle \sum_{q=1}^{n} w(q) = \sum_{q=1}^{n} \dfrac {1}{\left (\lvert q - f \rvert + 1 \right)^{2}} \leqslant 2 \cdot \sum_{q=1}^{+\infty} \dfrac {1}{ \left ( \lvert q - f \rvert + 1 \right)^{2}} = O(1) </tex>.

Последнее верно, так как при фиксированном <tex> f </tex>, начиная с некоторого места, а именно <tex> q = f </tex>, ряд сходится.

Из определения размера узла следует, что <tex> w(q) \leqslant s(q) \leqslant W </tex>.

Также заметим, что для любого <tex> q </tex> от <tex> 1 </tex> до <tex> n </tex> верно, что <tex> w(q) \geqslant \displaystyle \dfrac {1}{n^{2}} </tex>, так как максимальное значение знаменателя в определении <tex> w(q) </tex> достигается при <tex> q = n </tex> и <tex> f = 1 </tex> или наоборот.

Тогда, воспользовавшись полученными оценками, найдем изменение потенциала сплей-дерева после <tex> m </tex> запросов:

<tex>\displaystyle \sum_{i=1}^{m} \left ( \Phi_{i-1} - \Phi_{i} \right) = \Phi_{0} - \Phi_{m} \leqslant \sum_{q=1}^{n} \log_{2} W - \sum_{q=1}^{n} \log_{2}w(q) = \sum_{q=1}^{n} \log_{2} \dfrac {W}{w(q)} </tex> <tex> \displaystyle = O \Biggl(\sum_{q=1}^{n} \log_{2} n^{2}\Biggr) = </tex> <tex> \displaystyle O\Biggl(2 \cdot\sum_{q=1}^{n} \log_{2} n\Biggr) = O\left (n \log_{2}n\right) </tex>.

Первое неравенство верно, так как максимальное значение потенциала достигается при <tex> s(q) = W </tex>, а минимальное при <tex> s(q) = w(q) </tex>, а значит изменение потенциала не превышает разности этих величин.

Обозначим за <tex> t </tex> корень сплей-дерева. Тогда, воспользовавшись вышеуказанной [[#Lemma1|леммой]] (можно показать, что она верна для любого фиксированного определения веса узла) получаем, что

<tex> \displaystyle a_{i} = 3 \cdot \left ( r(t) - r(q_{i}) \right) + 1 = O\left (\log_{2} \dfrac {s(t)}{s\left (q_{i}\right)}\right) + 1 = O\left (\log_{2} \dfrac {W}{w(q_{i})}\right) + 1 = </tex> <tex> O\left (\log_{2} \left (W \cdot \left (\lvert q_{i} - f \rvert + 1 \right)^{2} \right ) \right ) + 1 = O\left (\log_{2} \left (\lvert q_{i} - f \rvert + 1 \right) \right ) + 1 </tex>.

Докажем, что данное определение потенциала удовлетворяет условию [[Амортизационный анализ|теоремы о методе потенциалов]].

Для любого <tex> i </tex> верно, что <tex> a_{i} = O(\log_{2}(n)) </tex>, так как <tex> \lvert q_{i} - f \rvert + 1 \leqslant n </tex>, и <tex> \Phi_{i} = O(n\log_{2}(n)) </tex>, как было показано выше. Так как количество операций на запрос <tex>k = O(n) </tex>, то <tex> a_{i} = O(f(k,n)) </tex> и <tex> \Phi_{i} = O(kf(k,n)) </tex>, где <tex> f(k,n) </tex> {{---}} функция из теоремы о методе потенциалов, равная в данном случае <tex> \log_{2}n </tex>. Следовательно, потенциал удовлетворяет условию теоремы.

Тогда, подставляя найденные значения в формулу <tex> (\ast) </tex>, получаем, что

<tex>T=\displaystyle \sum_{i=1}^{m} \left ( O \left ( \log_{2} \left ( \lvert q_{i} - f \rvert + 1 \right) \right) + 1 \right ) + O\left ( n \log_{2} n \right) = </tex> <tex> \displaystyle O \left (n \log_{2} n + m + \displaystyle \sum_{i=1}^{m} \log_{2} \left ( \lvert q_{i} - f \rvert + 1 \right) \right)</tex>.

}}

Данная теорема показывает, что сплей-деревья поддерживают достаточно эффективный доступ к ключам, которые находятся близко к какому-то фиксированному ключу.

==Splay-деревья по неявному ключу==

Splay-дерево по неявному ключу полностью аналогично [[Декартово дерево по неявному ключу|декартову дереву по неявному ключу]], неявным ключом также будет количество элементов дерева, меньших данного. Аналогично, будем хранить вспомогательную величину <tex>C(x)</tex> — количество вершин в поддереве. К операциям, которые уже были представлены в декартовом дереве, добавляется splay, но пересчет <tex>C(x)</tex> в ней тривиален, так как мы точно знаем, куда перемещаются изменяемые поддеревья.

~~Для операции split нам необходимо хранить число вершин в поддереве~~== См. Это число может меняться вовремя операции splay, но при этом его легко поддерживать: мы точно знаем, куда переместятся поддеревья. Тогда после операции мы просто пересчитываем число элементов для также ==* [[2 ~~(zig) или~~ -3 ~~(zig~~дерево]]* [[B-~~zig, zig~~дерево]]* [[B+-~~zag) вершин. Остальные операции аналогичны~~ дерево]]* [[~~Декартово~~ АВЛ-дерево ~~по неявному ключу|декартову дереву по неявному ключу~~]]. ~~==Литература==~~* [[Красно-черное дерево]]

==Источники информации==*[~~http~~[wikipedia://en~~.wikipedia.org/wiki/Splay_tree~~ :Splay_Tree|Википедия {{--- }} Splay tree]]

*[http://www.cs.cmu.edu/~sleator/papers/self-adjusting.pdf Sleator, Daniel D.; Tarjan, Robert E."Self-Adjusting Binary Search Trees"]

Mervap

286

правок

Изменения

Splay-дерево

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты