Splay-дерево

Сплей-дерево (англ. Splay-tree) — это двоичное дерево поиска. Оно позволяет находить быстрее те данные, которые использовались недавно. Относится к разряду сливаемых деревьев. Сплей-дерево было придумано Робертом Тарьяном и Даниелем Слейтером в [math]1983[/math] году.

Эвристики

Для того, чтобы доступ к недавно найденным данным был быстрее, надо, чтобы эти данные находились ближе к корню. Этого мы можем добиться, используя различные эвристики:

Move to Root — совершает повороты вокруг ребра [math](x, p)[/math], где [math]x[/math] — найденная вершина, [math]p[/math] — ее предок, пока [math]x[/math] не окажется корнем дерева. Однако можно построить такую последовательность операций, что амортизированное время доступа к вершине будет [math] \Omega(n) [/math].
Splay — также совершает повороты, но чередует различные виды поворотов, благодаря чему достигается логарифмическая амортизированная оценка. Она будет подробно описана ниже.

Пример: При последовательном использовании операций "move to root" для вершин [math]A[/math] и [math]B[/math] требуется по [math]6[/math] поворотов, в то время как при использовании операции "splay" для вершины [math]B[/math] достаточно [math]3[/math] поворотов.

Операции со splay-деревом

splay(tree, x)

"splay" делится на [math]3[/math] случая:

zig

Если [math]p[/math] — корень дерева с сыном [math]x[/math], то совершаем один поворот вокруг ребра [math](x, p)[/math], делая [math]x[/math] корнем дерева. Данный случай является крайним и выполняется только один раз в конце, если изначальная глубина [math]x[/math] была нечетной.

zig-zig

Если [math]p[/math] — не корень дерева, а [math]x[/math] и [math]p[/math] — оба левые или оба правые дети, то делаем поворот ребра [math](p, g)[/math], где [math]g[/math] отец [math]p[/math], а затем поворот ребра [math](x, p)[/math].

zig-zag

Если [math]p[/math] — не корень дерева и [math]x[/math] — левый ребенок, а [math]p[/math] — правый, или наоборот, то делаем поворот вокруг ребра [math](x, p)[/math], а затем поворот нового ребра [math](x, g)[/math], где [math]g[/math] — бывший родитель [math]p[/math].

Данная операция занимает [math]O(d)[/math] времени, где [math]d[/math] — длина пути от [math]x[/math] до корня.

find(tree, x)

Эта операция выполняется как для обычного бинарного дерева, только после нее запускается операция splay.

merge(tree1, tree2)

У нас есть два дерева [math]\mathtt{tree1}[/math] и [math]\mathtt{tree2}[/math], причём подразумевается, что все элементы первого дерева меньше элементов второго. Запускаем splay от самого большого элемента в дереве [math]\mathtt{tree1}[/math] (пусть это элемент [math]i[/math]). После этого корень [math]\mathtt{tree1}[/math] содержит элемент [math]i[/math], при этом у него нет правого ребёнка. Делаем [math]\mathtt{tree2}[/math] правым поддеревом [math]i[/math] и возвращаем полученное дерево.

split(tree, x)

Запускаем splay от элемента [math]x[/math] и возвращаем два дерева, полученные отсечением правого или левого поддерева от корня, в зависимости от того, содержит корень элемент больше или не больше, чем [math]x[/math].

add(tree, x)

Запускаем split(tree, x), который нам возвращает деревья [math]\mathtt{tree1}[/math] и [math]\mathtt{tree2}[/math], их подвешиваем к [math]x[/math] как левое и правое поддеревья соответственно.

remove(tree, x)

Запускаем splay от [math]x[/math] элемента и возвращаем Merge от его детей.

Реализация операции splay

Bottom-up

В этой реализации операция splay производится при подъеме от целевой вершины до корня путем применения поворотов. Для подъема по дереву требуется доступ к вершине-родителю. Этого можно достичь либо путем хранения в каждой вершине ссылки на родителя, либо с помощью стека вершин на пути от корня к целевой.

Определим вспомогательные функции:

[math]\mathrm{rotate\_left}(v)[/math] — поворот ребра, соединяющего v и его правого сына
[math]\mathrm{rotate\_right}(v)[/math] — симметрично [math]\mathrm{rotate\_left}[/math]
[math]\mathrm{p}(v)[/math] — родитель вершины [math]v[/math]
[math]\mathrm{g}(v)[/math] — родитель родителя вершины [math]v[/math]

Приведем реализацию [math]\mathrm{p}[/math], [math]\mathrm{g}[/math], [math]\mathrm{rotate\_left}[/math]. Реализация [math]\mathrm{rotate\_right}[/math] симметрична. Положим, что для доступа к родительской вершине имеется соответствующее поле.

Node p(Node v):
  return v.parent

Node g(Node v):
  return p(p(v))

void rotate_left(Node v):
  Node p = p(v)
  Node r = v.right
  if (p != null)
    if (p.left == v)
      p.left = r
    else
      p.right = r
  Node tmp = r.left
  r.left = v
  v.right = tmp
  p(v) = r
  p(r) = p
  if (v.right != null)
    p(v) = v

Реализация splay:

void splay(Node v):
  while (p(v) != null)
    if (v == p(v).left)
      if (g(v) == null)
        rotate_right(p(v))
      else if (p(v) == g(v).left)
        rotate_right(g(v))
        rotate_right(p(v))
      else
        rotate_right(p(v))
        rotate_left(p(v))
    else
      if (g(v) == null)
        rotate_left(p(v))
      else if (p(v) == g(v).right)
        rotate_left(g(v))
        rotate_left(p(v))
      else
        rotate_left(p(v))
        rotate_right(p(v))

Преимуществом данного подхода является возможность инкапсуляции всех модификаций структуры дерева, включая создание вспомогательных переменных и нарушение инвариантов. Рекомендуется для использования в случае, когда есть прямой доступ к целевой для операции splay вершине, иначе требуется два прохода по пути от корня до вершины (первый — поиск вершины стандартным алгоритмом, второй — splay).

Top-down

Данная реализация не требует прямого доступа к целевой вершине, поскольку процесс перебалансировки происходит во время поиска вершины в дереве.

В процессе спуска во время операции splay дерево разбивается на три части: [math]L[/math], [math]M[/math], [math]R[/math]. Деревья [math]L[/math] и [math]R[/math] содержат все вершины исходного дерева, для которых на данном этапе известно, что они меньше или больше искомого элемента соответственно. Дерево [math]M[/math] содержит вершины, принадлежащие поддереву текущей вершины на пути к целевой в исходном дереве. Изначально деревья [math]L[/math] и [math]R[/math] пусты, а текущая вершина пути к целевой — корень.

За одну итерацию операции splay производится спуск на две вершины по пути поиска целевой. Пройденные ребра удаляются, и отсоединившиеся при этом поддеревья добавляются правым ребенком наибольшей по значению вершине дерева [math]L[/math] или левым ребенком к наименьшей по значению вершине дерева [math]R[/math]. При этом если происходит спуск оба раза в левых или правых детей, то перед присоединением производится поворот.

В конце пути производится слияние деревьев [math]L[/math], [math]M[/math] и [math]R[/math] таким образом, что новым корнем дерева становится вершина с целевым значением.

Приведем реализацию. Определим переменные:

[math]val[/math] — значение в целевой вершине
[math]t[/math] — текущая вершина, до и после splay — корень дерева
[math]l[/math] — наибольшая по значению вершина дерева [math]L[/math]
[math]r[/math] — наименьшая по значению вершина дерева [math]R[/math]
[math]l\_root[/math] — корень дерева [math]L[/math]
[math]r\_root[/math] — корень дерева [math]R[/math]

Определим вспомогательные функции:

[math]\mathrm{rotate\_left}(v)[/math] — поворот ребра, соединяющего [math]v[/math] и его правого сына
[math]\mathrm{rotate\_right}(v)[/math] — симметрично [math]\mathrm{rotate\_left}[/math]
[math]\mathrm{break\_left}(v)[/math] — удалить ребро, соединяющее [math]v[/math] и его правого сына, соединить [math]l[/math] с полученным деревом
[math]\mathrm{break\_right}(v)[/math] — симметрично [math]\mathrm{break\_left}[/math]
[math]\mathrm{assemble}()[/math] — слить деревья [math]L[/math], [math]M[/math] и [math]R[/math]

Приведем реализацию [math]\mathrm{rotate\_left}[/math], [math]\mathrm{break\_left}[/math], [math]\mathrm{assemble}[/math]. Реализация и [math]\mathrm{break\_right}[/math] симметрична.

Node rotate_left(Node v):
  Node r = v.right
  Note tmp = r.left
  r.left = v
  v.right = tmp
  return r

Node break_left(Node v):
  Node tmp = v.right
  v.right = null
  if (l == null)
    l_root = l = v
  else
    l.right = v
    l = v
  return tmp

void assemble():
  l.right = t.left
  r.left = t.right
  t.left = l_root
  t.right = r_root

Реализация splay:

void splay(Value val):
  while (t.value != val)
    if (val < t.value)
      if (val == t.left.value)
        t = break_right(t)
      else if (val < t.left.value)
        t = rotate_right(t)
        t = break_right(t)
      else
        t = break_right(t)
        t = break_left(t)
    else
      if (val == t.right.value)
        t = break_left(t)
      else if (val > t.right.value)
        t = rotate_left(t)
        t = break_left(t)
      else
        t = break_left(t)
        t = break_right(t)
  assemble()

Реализацию splay можно упростить, опустив вторую операцию удаления ребра в случае zig-zag. Приведем также ее:

void simplified_splay(Value val):
  while (t.value != val)
    if (val < t.value)
      if (val < t.left.value)
        t = rotate_right(t)
      t = break_right(t)
    else
      if (val > t.right.value)
        t = rotate_left(t)
      t = break_left(t)
  assemble()

Время работы

В обеих реализациях осуществляется проход по пути от корня к целевой вершине и/или обратно. По вышеупомянутой Лемме, путь состоит из [math]O(\log n)[/math] вершин. Обработка каждой вершины имеет сложность [math]O(1)[/math]. Таким образом, сложность приведенных выше операции splay — [math]O(\log n)[/math]

Анализ операции splay

Амортизационный анализ сплей-дерева проводится с помощью метода потенциалов. Потенциалом рассматриваемого дерева назовём сумму рангов его вершин. Ранг вершины [math]x[/math] — это величина, обозначаемая [math]r(x)[/math] и равная [math]\log_2 C(x)[/math], где [math]C(x)[/math] — количество вершин в поддереве с корнем в [math]x[/math].

Лемма:

Амортизированное время операции splay вершины в дереве с корнем не превосходит

Доказательство:

Проанализируем каждый шаг операции splay. Пусть [math]r'[/math] и [math]r[/math] — ранги вершин после шага и до него соответственно, [math]p[/math] — предок вершины [math]x[/math], а [math]g[/math] — предок [math]p[/math] (если есть).

Разберём случаи в зависимости от типа шага:

zig. Поскольку выполнен один поворот, то амортизированное время выполнения шага (поскольку только у вершин [math]x[/math] и [math]p[/math] меняется ранг). Ранг вершины [math]p[/math] уменьшился, поэтому . Ранг вершины [math]x[/math] увеличился, поэтому [math]r'(x) - r(x) \geqslant 0[/math]. Следовательно, .

zig-zig. Выполнено два поворота, амортизированное время выполнения шага . Поскольку после поворотов поддерево с корнем в [math]x[/math] будет содержать все вершины, которые были в поддереве с корнем в [math]g[/math] (и только их), поэтому [math]r'(x) = r(g)[/math]. Используя это равенство, получаем: , поскольку [math]r(x) \leqslant r(p)[/math].

Далее, так как [math]r'(p) \leqslant r'(x)[/math], получаем, что .

Мы утверждаем, что эта сумма не превосходит [math]3(r'(x) - r(x))[/math], то есть, что . Преобразуем полученное выражение следующим образом: .

Из рисунка видно, что , значит, сумма выражений под логарифмами не превосходит единицы. Далее, рассмотрим сумму логарифмов . При [math]a + b \leqslant 1[/math] произведение [math]ab[/math] по неравенству между средними не превышает [math]\dfrac{1}{4}[/math]. А поскольку логарифм — функция возрастающая, то [math]\log_2 ab \leqslant -2[/math], что и является требуемым неравенством.

zig-zag. Выполнено два поворота, амортизированное время выполнения шага . Поскольку [math]r'(x) = r(g)[/math], то . Далее, так как [math]r(x) \leqslant r(p)[/math], то .

Мы утверждаем, что эта сумма не превосходит [math]2(r'(x) - r(x))[/math], то есть, что . Но, поскольку - аналогично доказанному ранее, что и требовалось доказать.

Итого, получаем, что амортизированное время шага zig-zag не превосходит .

Поскольку за время выполнения операции splay выполняется не более одного шага типа zig, то суммарное время не будет превосходить , поскольку утроенные ранги промежуточных вершин сокращаются (входят в сумму как с плюсом, так и с минусом). Тогда суммарное время работы splay , где — число элементов в дереве.

Статическая оптимальность сплей-дерева

Теорема:

Если к ключам , сложенным в сплей-дерево выполняется запросов, к -му ключу осуществляется запросов, где , то суммарное время работы не превышает , где , — шенноновская энтропия

Доказательство:

Известно, что — шенноновская энтропия.

Пусть — количество вершин в поддереве с корнем в [math]x[/math]. А [math]r(x) = \log_{2} s(x)[/math] — ранг вершины.

Обозначим за [math]r[/math] корень [math]splay[/math]-дерева. Из предыдущей теоремы известно, что

Пусть [math]w(x_i) = p_i =[/math] [math] {k_i \over m}[/math], тогда [math]k_i = p_i \cdot m[/math].

Так как вершина — корень -дерева, то очевидно, что , следовательно . Поэтому , ч.т.д.

Теорема о близких запросах в сплей-дереве

Теорема (о близких запросах в сплей-дереве):

Пусть в сплей-дерево сложены ключи . Зафиксируем один из ключей . Пусть выполняется запросов к ключам. Тогда суммарное время на запросы есть , где — значение в вершине, к которой обращаются в -ый запрос.

Доказательство:

Для доказательства теоремы воспользуемся методом потенциалов:

.

По условию выполняется [math] m [/math] запросов, следовательно

[math] (\ast) [/math].

Введем следующие обозначения:

Весом узла с ключом [math] q [/math] будем называть величину .

Размером узла, содержащего ключ [math] q [/math], будем называть величину , где [math] y [/math] — узлы поддерева с корнем в [math] q [/math].

[math] r(q) = \log_{2}s(q) [/math] — ранг узла.

Потенциал дерева после [math] i [/math]-го запроса обозначим как .

Пусть [math] W [/math] — вес дерева. Тогда .

Последнее верно, так как при фиксированном [math] f [/math], начиная с некоторого места, а именно [math] q = f [/math], ряд сходится.

Из определения размера узла следует, что .

Также заметим, что для любого [math] q [/math] от [math] 1 [/math] до [math] n [/math] верно, что , так как максимальное значение знаменателя в определении [math] w(q) [/math] достигается при [math] q = n [/math] и [math] f = 1 [/math] или наоборот.

Тогда, воспользовавшись полученными оценками, найдем изменение потенциала сплей-дерева после [math] m [/math] запросов:

.

Первое неравенство верно, так как максимальное значение потенциала достигается при [math] s(q) = W [/math], а минимальное при [math] s(q) = w(q) [/math], а значит изменение потенциала не превышает разности этих величин.

Обозначим за [math] t [/math] корень сплей-дерева. Тогда, воспользовавшись вышеуказанной леммой (можно показать, что она верна для любого фиксированного определения веса узла) получаем, что

.

Докажем, что данное определение потенциала удовлетворяет условию теоремы о методе потенциалов.

Для любого [math] i [/math] верно, что [math] a_{i} = O(\log_{2}(n)) [/math], так как , и , как было показано выше. Так как количество операций на запрос [math]k = O(n) [/math], то [math] a_{i} = O(f(k,n)) [/math] и [math] \Phi_{i} = O(kf(k,n)) [/math], где [math] f(k,n) [/math] — функция из теоремы о методе потенциалов, равная в данном случае [math] \log_{2}n [/math]. Следовательно, потенциал удовлетворяет условию теоремы.

Тогда, подставляя найденные значения в формулу [math] (\ast) [/math], получаем, что

.

Данная теорема показывает, что сплей-деревья поддерживают достаточно эффективный доступ к ключам, которые находятся близко к какому-то фиксированному ключу.

Splay-деревья по неявному ключу

Splay-дерево по неявному ключу полностью аналогично декартову дереву по неявному ключу, неявным ключом также будет количество элементов дерева, меньших данного. Аналогично, будем хранить вспомогательную величину [math]C(x)[/math] — количество вершин в поддереве. К операциям, которые уже были представлены в декартовом дереве, добавляется splay, но пересчет [math]C(x)[/math] в ней тривиален, так как мы точно знаем, куда перемещаются изменяемые поддеревья.

См. также

Источники информации

Splay-дерево

Эвристики

Операции со splay-деревом

splay(tree, x)

zig

zig-zig

zig-zag

find(tree, x)

merge(tree1, tree2)

split(tree, x)

add(tree, x)

remove(tree, x)

Реализация операции splay

Bottom-up

Top-down

Время работы

Анализ операции splay

Статическая оптимальность сплей-дерева

Теорема о близких запросах в сплей-дереве

Splay-деревья по неявному ключу

См. также

Источники информации

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты