Tango-дерево
Танго дерево Поиск Перестройка дерева
Динамическая оптимальность
Определение: |
Динамическая оптимальность (Dynamic Opt) |
Если мы разрешаем перестраивать деревья в процессе запроса, то splay-деревья не больше, чем в константу хуже оптимальных.
Гипотеза: |
Splay-деревья обладают динамической оптимальностью. То есть время работы splay-дерева |
Модель оптимального дерева
Рассмотрим ключи
и запросы , где – ключ, к которому мы обращаемся.Утверждение: |
Существует некоторое гипотетическое оптимальное дерево, которое на каждый запрос делает следующие вещи
|
Время работы tango-дерева
Оценка снизу на динамический оптимум
Визуализация работы с гипотетически оптимальным динамическим двоичным деревом поиска
Рассмотрим оси ключи от времени Поставим точки, которые соответствуют обращению по данному ключу в определенное время.
Множество точек определяет, что происходило с деревом.
Определение: |
Множество точек называется древесным (aboral), если выполняется следующее свойство: возьмем произвольный невырожденный прямоугольник(площадь прямоугольника больше нуля) с углами в наших точках. |
Утверждение: |
Множество точек удовлетворяет свойству древесности, если на любом прямоугольнике с вершинами в наших точках есть еще хотя бы одна точка, отличная от точек, на которых его построили. |
Теорема: |
Множество точек является фазовой диаграммой работы с некоторым деревом поиска тогда и только тогда, когда оно обладает свойством древесности. |
Доказательство: |
Пусть мы обращались к какому-то ключу в -ом запросе и к какому-то ключу в -ом запросе. Рассмотрим этот прямоугольник. На момент -го запроса рассмотрим в дереве поиска наименьшего общего предка и -- вершину .Если , то все хорошо, значит в дереве поиска она находится между и , поэтому мы к нему обращались в то время, когда шли к , значит есть точка на стороне нашего многоугольника.Если , то есть -- предок в момент -го запроса, тогда рассмотрим момент -го запроса, когда мы обращались к . Найдем в дереве поиска наименьшего общего предка вершин и на момент -го запроса. Если , тогда мы к нему обращались, и есть точка на стороне нашего прямоугольника. Если , то есть - предок в момент -го запроса, Значит «всплывал», и хотя бы раз, между этими моментами выполнялся поворот вокруг ребра от к родителю. То есть во время -го запроса был в поддереве , а во время -го запроса в поддереве , значит где-то между этими моментами выполнялся поворот вокруг ребра от к родителю, и мы обращались к , следовательно есть точка на правой стороне нашего прямоугольника(рисунок надо?)
Для любого прямоугольника, построенного на наших точках, есть еще одна точка на стороне. Докажем, что можно построить такое дерево, для которого наши точки будут соответствовать запросам. Рассмотрим наше множество точек. Построим из них декартово(!) дерево, где ключом будет ключ, а вспомогательным ключом – время, когда мы следующий раз обратимся к вершине, то есть для каждого найдем минимальный такой, что существует точкаПриоритет будет меняться по мере того, как мы будет симулировать работу с деревом поиска.
Если есть точка на левой стороне, то к мы обратимся раньше, чем к следовательно неверно, что приоритет больше чем приоритет На левой стороне точек нетЕсли на нижней стороне есть точка, значит есть точка, к которой мы обращались сейчас, ключ которой больше, чем у , но меньше , но тогда она должна быть нашим правым сыном, а не вершина .Если на правой стороне есть точка, то сейчас мы бы обращались к ней, а не к .Если на верхней стороне есть точка Поэтому при перестроении декартова дерева нам не потребуется переходить из нашей верхней зоны. с ключом меньше , мы будем обращаться к ней тогда же, когда и к , значит мы может перейти к прямоугольнику, построенному на точках и . Когда таких точек (как ) не останется, то мы получим прямоугольник, у которого нет точек на всех сторонах, а это противоречит исходному условию. |
Таким образом, мы получили какую-то offline оптимальность.
Рассмотрим наши запросы, отметим их точками, тогда время работы оптимального динамического дерева равно количество точек на диаграмме.
Получим нижнюю оценку на оптимум.
Если что-то работает за , значит это работает не более, чем в раз хуже.Рассмотрим запросы. Покроем их независимыми прямоугольниками. Прямоугольники независимы, если угол одного не лежит внутри другого. Можно показать, что
(число запросов) + максимальное число независимых прямоугольников * 1/2Вторая нижняя оценка Уилберра (Wilber)
Рассмотрим запрос
Пусть левая граница , правая граница Идем от ключа назад и ищем, когда в предыдущий раз мы обращались к этому ключу. И каждый раз, когда встречается значение больше, чем наше, но меньше правой границы, мы сдвигаем правую границу. Аналогично с левой границей. Когда-то рано или поздно наши границы встретятся в Можно показать, что из этой оценки выходит следующая оценка Напишем , если меняется правая граница и - если левая. Назовем количество смен на и обратно
Док-во упр
Следствие Рассмотрим n ключей и m запросов запросы x1 .. xm Организуем их в полное двоичное сбалансированное дерево. (см рисунок) Будем в этом дереве искать наши ключи в том порядке, в котором их искали !!!там Для каждой вершины будем запоминать ребро, по которому мы последний раз проходили при поиске ключей в дереве(назовем его жирное ребро).
Утверждается, что сумма по всем i (ch(i)) >= сумма по i изменения числа жирных ребер То есть если мы улучшили правую границу(мы искали что-то справа), а потом улучшили левую(искали слева), значит где-то по пути мы прошли туда-обратно и сменили жирное ребро.
Итак, tango-деревья
Пример
Пусть изначально все левые ребра были жирными. Операций первого становления ребра жирным O(n) – дают не существенный вклад в асимптотику.
Глубина нашего дерева logn Из каждой вершины выходит <= 2 ребер В общем случае одно жирное, другое нет Все наше дерево можно разбить на жирные пути
Каждый из этих жирных путей организуем в свое splay-дерево. Из каждой вершины будет выходить вспомогательная ссылка на корень splay-дерева, соответствующего жирному пути в котором лежит тот ее ребенок, в которой ведет из нее нежирное ребро.
Таким образом, все наши ключи организуют иерархичную структуру. Каждый жирный путь - splay-дерево, и каждое их них указывает на корень дерева, в котором лежит ее второй сын(при этом указатель ставится на само дерево, а не на сына)
Время работы (M + число изменений жирных ребер) * log log n
Поиск Поиск ключа x Ищем в корне tango-дерева – splay-дереве. Если не нашли, значит надо идти по нежирному ребру. Пойдем по нему(красная стрелка) и ищем в новом дереве. Поиск в splay-дереве(синем) дереве = высота от количества вершин (количество вершин - длина жирного пути = log n) = log log n
Поиск во всем дереве = (log log n) * число проходов по нежирному ребру.
Перестройка дерева
Перестраивать дерево так, чтобы оно соответствовало новым жирным ребрам. //Теперь мы изменяем жирное ребро, т е хотим отрезать 13 и подвесить 10 9 //Отрезать 13 легко, //- split по ключу, теперь х в корне, и отрезаем правое дерево. // Как обратно вставить 9 10 Merge в splay-дереве. T1<T2 сливаем в T, T1 – split от самой большой(самой правой) вершины, она становится конем, и в правое поддерево приклеиваем Т2.
Но у нас Т1 не меньше Т2 Посмотрим на общий случай Был жирный путь Мы в нем что-то искали, не нашли, остановились в вершине, и хотим другое ее поддерево подклеить в жирный путь. Заметим, что ее жирный путь с одной стороны в левом поддереве нашей вершины С другой стороны в правом поддереве какого-то предка. Соответственно, мы может наше splay-дерево разрезать на два по ключу, по которому мы искали. И вставим наше поддерево в жирный путь. Теперь надо отрезать старое жирное ребро. Закончили в какой-то вершине, лежащей в жирном пути. Надо посмотреть, в какую сторону вело жирное ребро. Оно вело туда, куда мы не шли. Мы знаем, что нужно вырезать из нашего дерева вершины, которые больше той, в которой мы закончили, но меньше того ключа, из которого мы последний раз шли не в ту сторону, в которую мы сейчас идем не по жирному ребру. Нас интересует ключ, который больше нашего, но который выше нас. Мы хотим отрезать все ключи, которые лежат в поддереве вершины в дереве жирных путей?. Но это дерево примитивное, оно является полным двоичным. В нем можем предподсчитать для каждой вершины минимум и максимум. Значит, мы знаем интервал значений вершин его правого поддерева. И режем по минимальному и максимальному значениям в этом поддереве.
Итого
Разрезаем жирные ребра, по которым мы не прошли. Берем ребро. Берем дерево. Берем вершину. Split. Она корень. Смотрим интервал в базовом дереве – какой диапазон ключей соответствует нашему сыну, вырезаем этот диапазон с помощью двух сплитов по rmin и по rmax. В новое независимое дерево ставим красный указатель на вершину. Старый красный указатель вел в дерево, которое надо слить с его предком. Разрезаем с другой стороны от нашей вершины и вставляем как сына по нежирному ребру к той вершине, от которой пошли.
Перестройка = 3 * split + 3 * merge, каждый из них за loglogn = (O(1) + 3*O(log log n) + 3*O(log log n)) * число изменений жирного ребра