Splay-дерево — различия между версиями
Kabanov (обсуждение | вклад) м (→Статическая оптимальность сплей-дерева) |
Kabanov (обсуждение | вклад) (→Статическая оптимальность сплей-дерева) |
||
Строка 76: | Строка 76: | ||
Если к ключам <tex>1</tex>, ..., <tex>n</tex>, сложенным в сплей-дерево выполняется <tex>m</tex> запросов, к <tex>i</tex>-му ключу осуществляется <tex>k_i</tex> запросов, где <tex>k_i</tex> > 0, то суммарное время работы не превышает <tex>O(m * H(p_1, p_2, .., p_n))</tex>, где <tex>p_i = k_i / m</tex>, <tex>H</tex> - шенноновская энтропия | Если к ключам <tex>1</tex>, ..., <tex>n</tex>, сложенным в сплей-дерево выполняется <tex>m</tex> запросов, к <tex>i</tex>-му ключу осуществляется <tex>k_i</tex> запросов, где <tex>k_i</tex> > 0, то суммарное время работы не превышает <tex>O(m * H(p_1, p_2, .., p_n))</tex>, где <tex>p_i = k_i / m</tex>, <tex>H</tex> - шенноновская энтропия | ||
|proof= | |proof= | ||
+ | Известно, что <tex>H(p_1, p_2, .., p_n) = -c * \displaystyle \sum_{i=1}^n (p_i * \log_{2}p_i)</tex> - шенноновская энтропия.<br> | ||
+ | Пусть <tex>s(x) = \displaystyle \sum_{y} w(y)</tex> - количество вершин в поддереве с корнем в x. А <tex>r(x) = \log_{2} s(x)</tex> - ранг вершины.<br> | ||
+ | Обозначим за <tex>r</tex> корень splay-дерева. | ||
+ | Из предыдущей теоремы известно, что <tex>a_{splay} \leqslant 1+3(r(r)-r(x))</tex><br> | ||
+ | |||
+ | Пусть <tex dpi="130">w(x_i) = p_i =</tex> <tex dpi="180"> {k_i \over m}</tex>, тогда <tex dpi="130">k_i = p_i * m</tex>.<br> | ||
+ | <tex>m+3mr(r)-3 \displaystyle \sum_{i=1}^n k_ir(x_i) \leqslant m+3mr(r)-3 \displaystyle \sum_{i+1}^n k_i\log_{2}w(x_i) =</tex> <tex> m+3mr(r)-3 \displaystyle \sum_{i=1}^n (p_i*m*\log_{2}p_i) = m(1+3r(r)-3 \displaystyle \sum_{i=1}^n p_i\log_{2}p_i) = (*)</tex> | ||
+ | Так как вершина <tex>r</tex> - корень splay-дерева, то очевидно, что <tex>s = \displaystyle \sum_{y} w(y) = 1</tex>, следовательно <tex>r(r) = \log_{2}s(r)=0</tex>. Поэтому <tex>(*) = m(1+H(p_1,...,p_n)) = O(mH(p_1,...,p_n))</tex>, ч.т.д. | ||
}} | }} | ||
Версия 12:27, 9 июня 2013
Сплей-дерево (Splay-tree) — это двоичное дерево поиска. Оно позволяет находить быстрее те данные, которые использовались недавно. Относится к разряду сливаемых деревьев. Сплей-дерево было придумано Робертом Тарьяном и Даниелем Слейтером в 1983 году.
Содержание
Эвристики
Для того, чтобы доступ к недавно найденным данным был быстрее, надо, чтобы эти данные находились ближе к корню. Этого мы можем добиться, используя различные эвристики:
- Move to Root — совершает повороты вокруг ребра , где - найденная вершина, - ее предок, пока не окажется корнем дерева. Однако можно построить такую последовательность операций, что амортизированное время доступа к вершине будет .
- Splay — также совершает повороты, но чередует различные виды поворотов, благодаря чему достигается логарифмическая амортизированная оценка. Она будет подробно описана ниже.
Операции со splay-деревом
Splay(Tree, x)
"Splay" делится на 3 случая:
Zig
Если
- корень дерева с сыном , то совершаем один поворот вокруг ребра , делая корнем дерева. Данный случай является крайним и выполняется только один раз в конце, если изначальная глубина была нечетной.Zig-Zig
Если
- не корень дерева, а и - оба левые или оба правые дети, то делаем поворот ребра , где отец , а затем поворот ребра .Zig-Zag
Если
- не корень дерева и - левый ребенок, а - правый, или наоборот, то делаем поворот вокруг ребра , а затем поворот нового ребра , где - бывший родитель .Данная операция занимает
времени, где - длина пути от до корня.Find(Tree, x)
Эта операция выполняется как для обычного бинарного дерева, только после нее запускается операция Splay.
Merge(Tree1, Tree2)
У нас есть два дерева
и , причём подразумевается, что все элементы первого дерева меньше элементов второго. Запускаем Splay от самого большого элемента в дереве (пусть это элемент ). После этого корень содержит элемент , при этом у него нет правого ребёнка. Делаем правым поддеревом и возвращаем полученное дерево.Split(Tree, x)
Запускаем Splay от элемента
и возвращаем два дерева, полученные отсечением правого или левого поддерева от корня, в зависимости от того, содержит корень элемент больше или не больше, чем .Add(Tree, x)
Запускаем Split(Tree, x), который нам возвращает деревья
и , их подвешиваем к как левое и правое поддеревья соответственно.Remove(Tree, x)
Запускаем Splay от
элемента и возвращаем Merge от его детей.Анализ операции splay
Амортизационный анализ сплей-дерева проводится с помощью метода потенциалов. Потенциалом рассматриваемого дерева назовём сумму рангов его вершин. Ранг вершины
— это величина, обозначаемая и равная , где — количество вершин в поддереве с корнем в .Лемма: |
Амортизированное время операции splay вершины в дереве с корнем не превосходит |
Доказательство: |
Проанализируем каждый шаг операции splay. Пусть и — ранги вершин после шага и до него соответственно, — предок вершины , а — предок (если есть).Разберём случаи в зависимости от типа шага: Zig. Поскольку выполнен один поворот, то время амортизированное время выполнения шага (поскольку только у вершин и меняется ранг). Ранг вершины уменьшился, поэтому . Ранг вершины увеличился, поэтому . Следовательно, .Zig-zig. Выполнено два поворота, амортизированное время выполнения шага . Поскольку после поворотов поддерево с корнем в будет содержать все вершины, которые были в поддереве с корнем в (и только их), поэтому . Используя это равенство, получаем: , поскольку .Далее, так как , получаем, что .Мы утверждаем, что эта сумма не превосходит , то есть, что . Преобразуем полученное выражение следующим образом: .Из рисунка видно, что , значит, сумма выражений под логарифмами не превосходит единицы. Далее, рассмотрим сумму логарифмов . При произведение по неравенству между средними не превышает . А поскольку логарифм - функция возрастающая, то , что и является требуемым неравенством.Zig-zag. Выполнено два поворота, амортизированное время выполнения шага . Поскольку , то . Далее, так как , то .Мы утверждаем, что эта сумма не превосходит , то есть, что . Но, поскольку - аналогично доказанному ранее, что и требовалось доказать.Итого, получаем, что амортизированное время шага zig-zag не превосходит Поскольку за время выполнения операции splay выполняется не более одного шага типа zig, то суммарное время не будет превосходить . , поскольку утроенные ранги промежуточных вершин сокращаются (входят в сумму как с плюсом, так и с минусом). Тогда суммарное время работы splay , где - число элемнтов в дереве. |
Статическая оптимальность сплей-дерева
Теорема: |
Если к ключам , ..., , сложенным в сплей-дерево выполняется запросов, к -му ключу осуществляется запросов, где > 0, то суммарное время работы не превышает , где , - шенноновская энтропия |
Доказательство: |
Известно, что Пусть |
Splay-деревья по неявному ключу
Splay-дерево по неявному ключу полностью аналогично декартову дереву по неявному ключу, неявным ключом также будет количество элементов дерева, меньших данного. Аналогично, будем хранить вспомогательную величину — количество вершин в поддереве. К операциям, которые уже были представлены в декартовом дереве, добавляется splay, но пересчет в ней тривиален, так как мы точно знаем, куда перемещаются изменяемые поддеревья.