Splay-дерево — различия между версиями
(Теорема о близких запросах в сплей-дереве) |
|||
Строка 89: | Строка 89: | ||
Так как вершина <tex>r</tex> {{---}} корень <tex>splay</tex>-дерева, то очевидно, что <tex>s = \displaystyle \sum_{y} w(y) = 1</tex>, следовательно <tex>r(r) = \log_{2}s(r)=0</tex>. Поэтому <tex>(*) = m(1+H(p_1,...,p_n)) = O(mH(p_1,...,p_n))</tex>, ч.т.д. | Так как вершина <tex>r</tex> {{---}} корень <tex>splay</tex>-дерева, то очевидно, что <tex>s = \displaystyle \sum_{y} w(y) = 1</tex>, следовательно <tex>r(r) = \log_{2}s(r)=0</tex>. Поэтому <tex>(*) = m(1+H(p_1,...,p_n)) = O(mH(p_1,...,p_n))</tex>, ч.т.д. | ||
}} | }} | ||
+ | |||
+ | ==Теорема о близких запросах в сплей-дереве== | ||
{{Теорема | {{Теорема | ||
|about = | |about = | ||
о близких запросах в сплей-дереве | о близких запросах в сплей-дереве | ||
− | |||
|statement = | |statement = | ||
− | Пусть в сплей-дерево сложены ключи <tex> 1, \dotsc, n </tex>, зафиксируем один из ключей <tex> f </tex>, пусть выполняется <tex> m </tex> запросов к ключам. Тогда суммарное время на запросы есть <tex> \displaystyle O(n \log_{2} n + m + \sum_{i=1}^{m} \log_2 ( \lvert q_{i} - f \rvert + 1)) </tex>, где <tex> q_{i} </tex> {{---}} <tex> i </tex>- | + | Пусть в сплей-дерево сложены ключи <tex> 1, \dotsc, n </tex>, зафиксируем один из ключей <tex> f </tex>, пусть выполняется <tex> m </tex> запросов к ключам. Тогда суммарное время на запросы есть <tex> \displaystyle O(n \log_{2} n + m + \sum_{i=1}^{m} \log_2 ( \lvert q_{i} - f \rvert + 1)) </tex>, где <tex> q_{i} </tex> {{---}} значение элемента, к которому обращаются в <tex> i </tex>-ый запрос. |
|proof = | |proof = | ||
Строка 105: | Строка 106: | ||
По условию выполняется <tex> m </tex> запросов, следовательно | По условию выполняется <tex> m </tex> запросов, следовательно | ||
− | <tex> T = \displaystyle \sum_{i=1}^{m} t_{i} = \sum_{i=1}^{m} \left(a_{i} + \Phi_{i-1} - \Phi_{i} \right) = \sum_{i=1}^{m} a_{i} + | + | <tex> T = \displaystyle \sum_{i=1}^{m} t_{i} = \sum_{i=1}^{m} \left(a_{i} + \Phi_{i-1} - \Phi_{i} \right) = \sum_{i=1}^{m} a_{i} + \sum_{i=1}^{m} \left( \Phi_{i-1} - \Phi_{i} \right) </tex> <tex> (\ast) </tex>. |
Введем следующие обозначения: | Введем следующие обозначения: | ||
Строка 115: | Строка 116: | ||
* <tex> r(q) = \log_{2}s(q) </tex> {{---}} ранг узла. | * <tex> r(q) = \log_{2}s(q) </tex> {{---}} ранг узла. | ||
− | * Потенциал дерева обозначим как <tex> \ | + | * Потенциал дерева после <tex> i </tex>-го запроса обозначим как <tex> \Phi_{i} = \displaystyle \sum_{q=1}^{n} r(q) = \displaystyle \sum_{q=1}^{n} \log_{2}s(q) </tex>. |
Пусть <tex> W </tex> {{---}} вес дерева. Тогда <tex> W = \displaystyle \sum_{q=1}^{n} w(q) = \sum_{q=1}^{n} \frac {1}{\left(\lvert q - f \rvert + 1 \right)^{2}} \leqslant 2 \cdot \sum_{q=1}^{+\infty} \frac {1}{ \left ( \lvert q - f \rvert + 1 \right)^{2}} = O(1) </tex>. | Пусть <tex> W </tex> {{---}} вес дерева. Тогда <tex> W = \displaystyle \sum_{q=1}^{n} w(q) = \sum_{q=1}^{n} \frac {1}{\left(\lvert q - f \rvert + 1 \right)^{2}} \leqslant 2 \cdot \sum_{q=1}^{+\infty} \frac {1}{ \left ( \lvert q - f \rvert + 1 \right)^{2}} = O(1) </tex>. | ||
Строка 125: | Строка 126: | ||
Также заметим, что для любого <tex> q </tex> от <tex> 1 </tex> до <tex> n </tex> верно, что <tex> w(q) \geqslant \displaystyle \frac {1}{n^{2}} </tex>, так как максимальное значение знаменателя в определении <tex> w(q) </tex> достигается при <tex> q = n </tex> и <tex> f = 1 </tex> или наоборот. | Также заметим, что для любого <tex> q </tex> от <tex> 1 </tex> до <tex> n </tex> верно, что <tex> w(q) \geqslant \displaystyle \frac {1}{n^{2}} </tex>, так как максимальное значение знаменателя в определении <tex> w(q) </tex> достигается при <tex> q = n </tex> и <tex> f = 1 </tex> или наоборот. | ||
− | Тогда изменение потенциала | + | Тогда, воспользовавшись полученными оценками, найдем изменение потенциала сплей-дерева после <tex> m </tex> запросов: |
− | <tex> \ | + | <tex>\displaystyle \sum_{i=1}^{m} \left( \Phi_{i-1} - \Phi_{i} \right) = \Phi_{0} - \Phi_{m} \leqslant \sum_{q=1}^{n} \log_{2} W - \sum_{q=1}^{n} \log_{2}w(q) = \sum_{q=1}^{n} \log_{2} \frac {W}{w(q)} </tex> <tex> \displaystyle = O \Biggl(\sum_{q=1}^{n} \log_{2} n^{2}\Biggr) = </tex> <tex> \displaystyle O\Biggl(2 \cdot\sum_{q=1}^{n} \log_{2} n\Biggr) = O\left(n \log_{2}n\right) </tex>. |
− | Обозначим за <tex> t </tex> корень сплей-дерева. Тогда, воспользовавшись вышеуказанной [[#Lemma1|леммой]], получаем, что | + | Обозначим за <tex> t </tex> корень сплей-дерева. Тогда, воспользовавшись вышеуказанной [[#Lemma1|леммой]] (можно показать, что она верна для любого фиксированного определения веса узла) получаем, что |
<tex> \displaystyle a_{i} = 3 \cdot \left( r(t) - r(q_{i}) \right) + 1 = O\left(\log_{2} \frac{s(t)}{s\left(q_{i}\right)}\right) + 1 = O\left(\log_{2} \frac{W}{w(q_{i})}\right) + 1 = </tex> <tex> O\left(\log_{2} \left(W \cdot \left(\lvert q - f \rvert + 1 \right)^{2} \right ) \right ) + 1 = O\left(\log_{2} \left(\lvert q - f \rvert + 1 \right) \right ) + 1 </tex>. | <tex> \displaystyle a_{i} = 3 \cdot \left( r(t) - r(q_{i}) \right) + 1 = O\left(\log_{2} \frac{s(t)}{s\left(q_{i}\right)}\right) + 1 = O\left(\log_{2} \frac{W}{w(q_{i})}\right) + 1 = </tex> <tex> O\left(\log_{2} \left(W \cdot \left(\lvert q - f \rvert + 1 \right)^{2} \right ) \right ) + 1 = O\left(\log_{2} \left(\lvert q - f \rvert + 1 \right) \right ) + 1 </tex>. | ||
+ | |||
+ | Докажем, что данное определение потенциала удовлетворяет условию [[Амортизационный анализ|теоремы о методе потенциалов]]. | ||
+ | |||
+ | Для любого <tex> i </tex> верно, что <tex> a_{i} = O(\log_{2}(n)) </tex>, так как <tex> \lvert q - f \rvert + 1 \leqslant n </tex>, и <tex> \Phi_{i} = O(n\log_{2}(n)) </tex>, как было показано выше. Так как количество операций на запрос <tex>k = O(n) </tex>, то <tex> a_{i} = O(f(k,n)) </tex> и <tex> \Phi_{i} = O(kf(k,n)) </tex>, где <tex> f(k,n) </tex> {{---}} функция из теоремы о методе потенциалов, равная в данном случае <tex> \log_{2}n </tex>. Следовательно потенциал удовлетворяет условию теоремы. | ||
Тогда, подставляя найденные значения в формулу <tex> (\ast) </tex>, получаем, что | Тогда, подставляя найденные значения в формулу <tex> (\ast) </tex>, получаем, что | ||
− | <tex>T=\displaystyle \sum_{i=1}^{m} \left ( O \left( \log_{2} \left ( \lvert q_{i} - f \rvert + 1 \right) \right) + 1 \right ) + O\left ( n \log_{2} n \right) = </tex> <tex> \displaystyle O \left (n \log_{2} n + m + \displaystyle \sum_{i=1}^{m} \ | + | <tex>T=\displaystyle \sum_{i=1}^{m} \left ( O \left( \log_{2} \left ( \lvert q_{i} - f \rvert + 1 \right) \right) + 1 \right ) + O\left ( n \log_{2} n \right) = </tex> <tex> \displaystyle O \left (n \log_{2} n + m + \displaystyle \sum_{i=1}^{m} \log_{2} \left( \lvert q_{i} - f \rvert + 1 \right) \right)</tex>. |
+ | |||
+ | Данная теорема показывает, что сплей-деревья поддерживают достаточно эффективный доступ к ключам, которые находятся близко к какому-то фиксированному ключу. | ||
}} | }} |
Версия 01:32, 29 апреля 2014
Сплей-дерево (Splay-tree) — это двоичное дерево поиска. Оно позволяет находить быстрее те данные, которые использовались недавно. Относится к разряду сливаемых деревьев. Сплей-дерево было придумано Робертом Тарьяном и Даниелем Слейтером в 1983 году.
Содержание
Эвристики
Для того, чтобы доступ к недавно найденным данным был быстрее, надо, чтобы эти данные находились ближе к корню. Этого мы можем добиться, используя различные эвристики:
- Move to Root — совершает повороты вокруг ребра , где - найденная вершина, - ее предок, пока не окажется корнем дерева. Однако можно построить такую последовательность операций, что амортизированное время доступа к вершине будет .
- Splay — также совершает повороты, но чередует различные виды поворотов, благодаря чему достигается логарифмическая амортизированная оценка. Она будет подробно описана ниже.
Операции со splay-деревом
Splay(Tree, x)
"Splay" делится на 3 случая:
Zig
Если
- корень дерева с сыном , то совершаем один поворот вокруг ребра , делая корнем дерева. Данный случай является крайним и выполняется только один раз в конце, если изначальная глубина была нечетной.Zig-Zig
Если
- не корень дерева, а и - оба левые или оба правые дети, то делаем поворот ребра , где отец , а затем поворот ребра .Zig-Zag
Если
- не корень дерева и - левый ребенок, а - правый, или наоборот, то делаем поворот вокруг ребра , а затем поворот нового ребра , где - бывший родитель .Данная операция занимает
времени, где - длина пути от до корня.Find(Tree, x)
Эта операция выполняется как для обычного бинарного дерева, только после нее запускается операция Splay.
Merge(Tree1, Tree2)
У нас есть два дерева
и , причём подразумевается, что все элементы первого дерева меньше элементов второго. Запускаем Splay от самого большого элемента в дереве (пусть это элемент ). После этого корень содержит элемент , при этом у него нет правого ребёнка. Делаем правым поддеревом и возвращаем полученное дерево.Split(Tree, x)
Запускаем Splay от элемента
и возвращаем два дерева, полученные отсечением правого или левого поддерева от корня, в зависимости от того, содержит корень элемент больше или не больше, чем .Add(Tree, x)
Запускаем Split(Tree, x), который нам возвращает деревья
и , их подвешиваем к как левое и правое поддеревья соответственно.Remove(Tree, x)
Запускаем Splay от
элемента и возвращаем Merge от его детей.Анализ операции splay
Амортизационный анализ сплей-дерева проводится с помощью метода потенциалов. Потенциалом рассматриваемого дерева назовём сумму рангов его вершин. Ранг вершины
— это величина, обозначаемая и равная , где — количество вершин в поддереве с корнем в .Лемма: |
Амортизированное время операции splay вершины в дереве с корнем не превосходит |
Доказательство: |
Проанализируем каждый шаг операции splay. Пусть и — ранги вершин после шага и до него соответственно, — предок вершины , а — предок (если есть).Разберём случаи в зависимости от типа шага: Zig. Поскольку выполнен один поворот, то амортизированное время выполнения шага (поскольку только у вершин и меняется ранг). Ранг вершины уменьшился, поэтому . Ранг вершины увеличился, поэтому . Следовательно, .Zig-zig. Выполнено два поворота, амортизированное время выполнения шага . Поскольку после поворотов поддерево с корнем в будет содержать все вершины, которые были в поддереве с корнем в (и только их), поэтому . Используя это равенство, получаем: , поскольку .Далее, так как , получаем, что .Мы утверждаем, что эта сумма не превосходит , то есть, что . Преобразуем полученное выражение следующим образом: .Из рисунка видно, что , значит, сумма выражений под логарифмами не превосходит единицы. Далее, рассмотрим сумму логарифмов . При произведение по неравенству между средними не превышает . А поскольку логарифм - функция возрастающая, то , что и является требуемым неравенством.Zig-zag. Выполнено два поворота, амортизированное время выполнения шага . Поскольку , то . Далее, так как , то .Мы утверждаем, что эта сумма не превосходит , то есть, что . Но, поскольку - аналогично доказанному ранее, что и требовалось доказать.Итого, получаем, что амортизированное время шага zig-zag не превосходит Поскольку за время выполнения операции splay выполняется не более одного шага типа zig, то суммарное время не будет превосходить . , поскольку утроенные ранги промежуточных вершин сокращаются (входят в сумму как с плюсом, так и с минусом). Тогда суммарное время работы splay , где - число элемнтов в дереве. |
Статическая оптимальность сплей-дерева
Теорема: |
Если к ключам , ..., , сложенным в сплей-дерево выполняется запросов, к -му ключу осуществляется запросов, где > 0, то суммарное время работы не превышает , где , - шенноновская энтропия |
Доказательство: |
Известно, что шенноновская энтропия. —Пусть — количество вершин в поддереве с корнем в . А — ранг вершины.Обозначим за корень -дерева. Из предыдущей теоремы известно, чтоПусть |
Теорема о близких запросах в сплей-дереве
Теорема (о близких запросах в сплей-дереве): |
Пусть в сплей-дерево сложены ключи , зафиксируем один из ключей , пусть выполняется запросов к ключам. Тогда суммарное время на запросы есть , где — значение элемента, к которому обращаются в -ый запрос. |
Доказательство: |
Для доказательства теоремы воспользуемся методом потенциалов: . По условию выполняется запросов, следовательно. Введем следующие обозначения:
Пусть — вес дерева. Тогда .Последнее верно, так как при фиксированном , начиная с некоторого места, а именно , ряд сходится.Из определения размера узла следует, что .Также заметим, что для любого от до верно, что , так как максимальное значение знаменателя в определении достигается при и или наоборот.Тогда, воспользовавшись полученными оценками, найдем изменение потенциала сплей-дерева после запросов:. Обозначим за леммой (можно показать, что она верна для любого фиксированного определения веса узла) получаем, что корень сплей-дерева. Тогда, воспользовавшись вышеуказанной. Докажем, что данное определение потенциала удовлетворяет условию теоремы о методе потенциалов. Для любого верно, что , так как , и , как было показано выше. Так как количество операций на запрос , то и , где — функция из теоремы о методе потенциалов, равная в данном случае . Следовательно потенциал удовлетворяет условию теоремы.Тогда, подставляя найденные значения в формулу , получаем, чтоДанная теорема показывает, что сплей-деревья поддерживают достаточно эффективный доступ к ключам, которые находятся близко к какому-то фиксированному ключу. . |
Splay-деревья по неявному ключу
Splay-дерево по неявному ключу полностью аналогично декартову дереву по неявному ключу, неявным ключом также будет количество элементов дерева, меньших данного. Аналогично, будем хранить вспомогательную величину — количество вершин в поддереве. К операциям, которые уже были представлены в декартовом дереве, добавляется splay, но пересчет в ней тривиален, так как мы точно знаем, куда перемещаются изменяемые поддеревья.