Tango-дерево — различия между версиями
Строка 1: | Строка 1: | ||
− | '''Tango-дерево''' -- online бинарное дерево поиска с временем работы <tex> O(\log \log N) </tex>, которое изобрели Эрик Д. Демейн, Дион Хармон, Джон Яконо и Mihai Patrascu в 2004 году. | + | '''Tango-дерево''' {{---}} online бинарное дерево поиска с временем работы <tex> O(\log \log N) </tex>, которое изобрели Эрик Д. Демейн, Дион Хармон, Джон Яконо и Mihai Patrascu в 2004 году. |
Лучшая известная реализация на данный момент. | Лучшая известная реализация на данный момент. | ||
− | Время работы ''tango'' дерева <tex>O(OPT dyn * \log \log n)</tex> | + | Время работы ''tango''-дерева <tex>O(OPT dyn * \log \log n)</tex> |
==Динамическая оптимальность== | ==Динамическая оптимальность== | ||
{{Гипотеза | {{Гипотеза | ||
− | |statement=[http://neerc.ifmo.ru/wiki/index.php?title=Splay-дерево ''Splay'' деревья] обладают динамической оптимальностью. | + | |statement=[http://neerc.ifmo.ru/wiki/index.php?title=Splay-дерево ''Splay''-деревья] обладают динамической оптимальностью. |
− | То есть если мы разрешаем перестраивать деревья в процессе запроса, то ''splay'' деревья не больше, чем в константу хуже оптимальных. | + | То есть если мы разрешаем перестраивать деревья в процессе запроса, то ''splay''-деревья не больше, чем в константу хуже оптимальных. |
− | Время работы ''splay'' дерева <tex>O(OPT dyn)</tex> | + | Время работы ''splay''-дерева <tex>O(OPT dyn)</tex> |
}} | }} | ||
Строка 25: | Строка 25: | ||
====Визуализация работы с гипотетически оптимальным динамическим двоичным деревом поиска==== | ====Визуализация работы с гипотетически оптимальным динамическим двоичным деревом поиска==== | ||
− | Рассмотрим систему координат ключ -- время. | + | Рассмотрим систему координат ключ {{---}} время. |
Поставим точки, которые соответствуют обращению по данному ключу в определенное время. | Поставим точки, которые соответствуют обращению по данному ключу в определенное время. | ||
Строка 53: | Строка 53: | ||
Если <tex>t != x</tex>, то все хорошо, значит в дереве поиска она находится между <tex>x</tex> и <tex>y</tex>, поэтому мы к нему обращались в то время, когда шли к <tex>x</tex>, значит есть точка на стороне нашего многоугольника. | Если <tex>t != x</tex>, то все хорошо, значит в дереве поиска она находится между <tex>x</tex> и <tex>y</tex>, поэтому мы к нему обращались в то время, когда шли к <tex>x</tex>, значит есть точка на стороне нашего многоугольника. | ||
− | [[Файл:DariaPicture2.png|thumb|300px| t -- наименьший общий предок х и у | + | [[Файл:DariaPicture2.png|thumb|300px| t {{---}} наименьший общий предок х и у |
]] | ]] | ||
− | Если <tex>t = x</tex>, то есть <tex>x</tex> -- предок <tex>y</tex> в момент <tex>i</tex>-го запроса, | + | Если <tex>t = x</tex>, то есть <tex>x</tex> {{---}} предок <tex>y</tex> в момент <tex>i</tex>-го запроса, |
тогда рассмотрим момент <tex>j</tex>-го запроса, когда мы обращались к <tex>y</tex>. | тогда рассмотрим момент <tex>j</tex>-го запроса, когда мы обращались к <tex>y</tex>. | ||
Найдем в дереве поиска наименьшего общего предка <tex>t</tex> вершин <tex>x</tex> и <tex>y</tex> на момент <tex>j</tex>-го запроса. | Найдем в дереве поиска наименьшего общего предка <tex>t</tex> вершин <tex>x</tex> и <tex>y</tex> на момент <tex>j</tex>-го запроса. | ||
Если <tex>t != y</tex>, тогда мы к нему обращались, и есть точка на стороне нашего прямоугольника. | Если <tex>t != y</tex>, тогда мы к нему обращались, и есть точка на стороне нашего прямоугольника. | ||
− | Если <tex>t = y</tex>, то есть <tex>y</tex> -- предок <tex>x</tex> в момент <tex>j</tex>-го запроса, | + | Если <tex>t = y</tex>, то есть <tex>y</tex> {{---}} предок <tex>x</tex> в момент <tex>j</tex>-го запроса, |
Значит <tex>y</tex> «всплывал», и хотя бы раз, между этими моментами выполнялся поворот вокруг ребра от <tex>y</tex> к родителю. | Значит <tex>y</tex> «всплывал», и хотя бы раз, между этими моментами выполнялся поворот вокруг ребра от <tex>y</tex> к родителю. | ||
Строка 70: | Строка 70: | ||
Докажем, что можно построить такое дерево, для которого наши точки будут соответствовать запросам. | Докажем, что можно построить такое дерево, для которого наши точки будут соответствовать запросам. | ||
Рассмотрим наше множество точек. | Рассмотрим наше множество точек. | ||
− | Построим из них декартово(!) дерево, где ключом будет ключ, а вспомогательным ключом - | + | Построим из них декартово(!) дерево, где ключом будет ключ, а вспомогательным ключом {{---}} время, когда мы следующий раз обратимся к вершине, то есть для каждого <tex>x</tex> найдем минимальный <tex>y</tex> такой, что существует точка <tex>(x, y)</tex> |
[[Файл:DariaPicture3.png|thumb|300px| Построение декартова дерева | [[Файл:DariaPicture3.png|thumb|300px| Построение декартова дерева | ||
Строка 115: | Строка 115: | ||
Прямоугольники независимы, если угол одного не лежит внутри другого. | Прямоугольники независимы, если угол одного не лежит внутри другого. | ||
− | Можно показать, что <tex>OPT(x) >= M + 1/2* MP</tex>, где <tex>M</tex> -- число запросов, <tex>MP</tex> -- максимальное число независимых прямоугольников. | + | Можно показать, что <tex>OPT(x) >= M + 1/2* MP</tex>, где <tex>M</tex> {{---}} число запросов, <tex>MP</tex> {{---}} максимальное число независимых прямоугольников. |
То есть <tex>OPT(x) = \Omega(M + 1/2* MP)</tex> | То есть <tex>OPT(x) = \Omega(M + 1/2* MP)</tex> | ||
Строка 147: | Строка 147: | ||
Для каждой вершины будем запоминать ребро, по которому мы последний раз проходили при поиске ключей в дереве(назовем его жирное ребро). | Для каждой вершины будем запоминать ребро, по которому мы последний раз проходили при поиске ключей в дереве(назовем его жирное ребро). | ||
− | Утверждается, что <tex>\sum\limits_{i \in [1, n]} ch(i)</tex> >= <tex>\sum\limits_{i \in [1, n]} K</tex>, где <tex>K</tex> -- число изменений жирных ребер. | + | Утверждается, что <tex>\sum\limits_{i \in [1, n]} ch(i)</tex> >= <tex>\sum\limits_{i \in [1, n]} K</tex>, где <tex>K</tex> {{---}} число изменений жирных ребер. |
То есть если мы улучшили правую границу(мы искали что-то справа), а потом улучшили левую(искали слева), значит где-то по пути мы прошли туда-обратно и сменили жирное ребро. | То есть если мы улучшили правую границу(мы искали что-то справа), а потом улучшили левую(искали слева), значит где-то по пути мы прошли туда-обратно и сменили жирное ребро. | ||
Строка 157: | Строка 157: | ||
{{Определение | {{Определение | ||
− | |definition='''Жирное ребро'''(''Prefered Path'') -- ребро, соединяющее вершину с ее последним посещенным ребенком. | + | |definition='''Жирное ребро'''(''Prefered Path'') {{---}} ребро, соединяющее вершину с ее последним посещенным ребенком. |
}} | }} | ||
Строка 169: | Строка 169: | ||
]] | ]] | ||
− | Каждый из этих жирных путей организуем в свое ''splay'' дерево. | + | Каждый из этих жирных путей организуем в свое ''splay''-дерево. |
− | Из каждой вершины создадим вспомогательную ссылку на корень ''splay'' дерева, соответствующего жирному пути, в котором лежит тот ее ребенок, в который ведет из нее нежирное ребро. | + | Из каждой вершины создадим вспомогательную ссылку на корень ''splay''-дерева, соответствующего жирному пути, в котором лежит тот ее ребенок, в который ведет из нее нежирное ребро. |
[[Файл:DariaPicture8.png|600px| | [[Файл:DariaPicture8.png|600px| | ||
]] | ]] | ||
− | Таким образом, все наши ключи организуют иерархичную структуру -- ''Tango'' дерево. | + | Таким образом, все наши ключи организуют иерархичную структуру {{---}} ''Tango''-дерево. |
− | Каждый жирный путь -- ''splay'' дерево, и каждое их них указывает на корень дерева, в котором лежит ее второй сын(при этом указатель ставится на само дерево, а не на сына). | + | Каждый жирный путь {{---}} ''splay''-дерево, и каждое их них указывает на корень дерева, в котором лежит ее второй сын(при этом указатель ставится на само дерево, а не на сына). |
Глубина ''tango'' дерева <tex>\log n</tex>. | Глубина ''tango'' дерева <tex>\log n</tex>. | ||
− | Время работы <tex>(M + K) * \log \log n</tex>, где <tex>K</tex> -- число изменений жирных ребер. | + | Время работы <tex>(M + K) * \log \log n</tex>, где <tex>K</tex> {{---}} число изменений жирных ребер. |
− | <font color=green>Операций первого становления ребра жирным -- ''O(\log n)'', это дает несущественный вклад в асимптотику. </font> | + | <font color=green>Операций первого становления ребра жирным {{---}} ''O(\log n)'', это дает несущественный вклад в асимптотику. </font> |
===Поиск=== | ===Поиск=== | ||
Строка 190: | Строка 190: | ||
Поиск элемента в <tex>tango</tex> дереве схож с поиском в обычном дереве поиска. | Поиск элемента в <tex>tango</tex> дереве схож с поиском в обычном дереве поиска. | ||
− | Начинаем с поиска в жирном пути корня <tex>tango</tex> дерева | + | Начинаем с поиска в жирном пути корня <tex>tango</tex> дерева {{---}} <tex>splay</tex>-дереве. |
− | Если текущий жирный путь не содержит искомый элемент, то сделаем переход по вспомогательной ссылке(красная стрелка) и осуществим поиск в новом жирном пути(<tex>splay</tex> дереве). | + | Если текущий жирный путь не содержит искомый элемент, то сделаем переход по вспомогательной ссылке(красная стрелка) и осуществим поиск в новом жирном пути(<tex>splay</tex>-дереве). |
− | Поиск в <tex>splay</tex> дереве(синем) дереве = высота от количества вершин (количество вершин = длине жирного пути = <tex>\log n</tex>) = <tex>\log \log n</tex>. | + | Поиск в <tex>splay</tex>-дереве(синем) дереве = высота от количества вершин (количество вершин = длине жирного пути = <tex>\log n</tex>) = <tex>\log \log n</tex>. |
Поиск во всем дереве = <tex>(\log \log n)</tex> * число проходов по нежирному ребру. | Поиск во всем дереве = <tex>(\log \log n)</tex> * число проходов по нежирному ребру. | ||
Строка 209: | Строка 209: | ||
===Перестройка дерева=== | ===Перестройка дерева=== | ||
− | Для того, чтобы сохранить структуру <tex>tango</tex> дерева (<tex>splay</tex> дерево соответствует текущему жирному пути), мы должны обновлять его каждый раз, когда жирные ребра изменяются в результате поиска. | + | Для того, чтобы сохранить структуру <tex>tango</tex> дерева (<tex>splay</tex>-дерево соответствует текущему жирному пути), мы должны обновлять его каждый раз, когда жирные ребра изменяются в результате поиска. |
После изменения жирного ребра верхняя часть жирного пути отделяется от нижней части (которая становится самостоятельным жирным путем) и присоединяется к другому жирному пути (который становится нижней частью). | После изменения жирного ребра верхняя часть жирного пути отделяется от нижней части (которая становится самостоятельным жирным путем) и присоединяется к другому жирному пути (который становится нижней частью). | ||
− | Во-первых, мы должны запомнить для каждой вершины нашего изначального дерева поиска дополнительную информацию: <tex>minChild</tex> -- минимальное значение в поддереве текущей вершины, <tex>maxChild</tex> -- максимальное значение в поддереве. | + | Во-первых, мы должны запомнить для каждой вершины нашего изначального дерева поиска дополнительную информацию: <tex>minChild</tex> {{---}} минимальное значение в поддереве текущей вершины, <tex>maxChild</tex> {{---}} максимальное значение в поддереве. |
− | Во-вторых, нам понадобятся операции [http://neerc.ifmo.ru/wiki/index.php?title=Splay-дерево split] и [http://neerc.ifmo.ru/wiki/index.php?title=Splay-дерево merge], которые работают за <tex>O(\log k)</tex>, где <tex>k</tex> - число узлов в <tex>splay</tex> дереве. | + | Во-вторых, нам понадобятся операции [http://neerc.ifmo.ru/wiki/index.php?title=Splay-дерево split] и [http://neerc.ifmo.ru/wiki/index.php?title=Splay-дерево merge], которые работают за <tex>O(\log k)</tex>, где <tex>k</tex> {{---}} число узлов в <tex>splay</tex>- дереве. |
Пусть для того, чтобы найти вершину <tex>x</tex>, которая находится в дереве <tex>F</tex>, мы прошли по тонкому ребру из вершины <tex>t</tex>, находящейся в дереве <tex>A</tex>. | Пусть для того, чтобы найти вершину <tex>x</tex>, которая находится в дереве <tex>F</tex>, мы прошли по тонкому ребру из вершины <tex>t</tex>, находящейся в дереве <tex>A</tex>. | ||
Значит, нам нужно объединить деревья <tex>A</tex> и <tex>F</tex> и вырезать из дерева <tex>A</tex> подддерево <tex>D</tex>, в которое ведет жирное ребро из вершины <tex>t</tex>. | Значит, нам нужно объединить деревья <tex>A</tex> и <tex>F</tex> и вырезать из дерева <tex>A</tex> подддерево <tex>D</tex>, в которое ведет жирное ребро из вершины <tex>t</tex>. | ||
− | Пусть поддерево <tex>D</tex> -- правое. Для левого аналогично. | + | Пусть поддерево <tex>D</tex> {{---}} правое. Для левого аналогично. |
# Так как мы знаем интервал значений <tex>[l', r']</tex> вершины <tex>t</tex> в ее правом поддереве <tex>D</tex>, сделаем по концам отрезка две операции <tex>split</tex>. Теперь мы можем отрезать поддерево <tex>D</tex>. | # Так как мы знаем интервал значений <tex>[l', r']</tex> вершины <tex>t</tex> в ее правом поддереве <tex>D</tex>, сделаем по концам отрезка две операции <tex>split</tex>. Теперь мы можем отрезать поддерево <tex>D</tex>. | ||
Строка 229: | Строка 229: | ||
Таким образом, | Таким образом, | ||
− | перестройка = <tex>3 * split + 3 * merge = (O(1) + 3*O(\log \log n) + 3*O(\log \log n)) * K</tex>, где <tex>K</tex> -- число изменений жирного ребра. | + | перестройка = <tex>3 * split + 3 * merge = (O(1) + 3*O(\log \log n) + 3*O(\log \log n)) * K</tex>, где <tex>K</tex> {{---}} число изменений жирного ребра. |
Версия 20:04, 9 июня 2014
Tango-дерево — online бинарное дерево поиска с временем работы
, которое изобрели Эрик Д. Демейн, Дион Хармон, Джон Яконо и Mihai Patrascu в 2004 году. Лучшая известная реализация на данный момент.Время работы tango-дерева
Содержание
Динамическая оптимальность
Гипотеза: |
Splay-деревья обладают динамической оптимальностью.
То есть если мы разрешаем перестраивать деревья в процессе запроса, то splay-деревья не больше, чем в константу хуже оптимальных. Время работы splay-дерева |
Модель оптимального дерева
Рассмотрим ключи
и запросы , где – ключ, к которому мы обращаемся.Утверждение: |
Существует гипотетически оптимальное дерево, которое на каждый запрос делает следующие вещи
|
Оценка снизу на динамический оптимум
Визуализация работы с гипотетически оптимальным динамическим двоичным деревом поиска
Рассмотрим систему координат ключ — время. Поставим точки, которые соответствуют обращению по данному ключу в определенное время.
Множество точек определяет, что происходило с деревом.
Определение: |
Множество точек называется древесным (aboral), если выполняется следующее свойство: На сторонах любого невырожденного(площадь прямоугольника больше нуля) прямоугольника, построенного на двух точках, есть еще хотя бы одна точка. |
Теорема: |
Множество точек является фазовой диаграммой работы с некоторым деревом поиска тогда и только тогда, когда оно обладает свойством древесности. |
Доказательство: |
1. Фазовая диаграмма работы с деревом поиска обладает свойством древестности. Пусть мы обращались к какому-то ключу в -ом запросе и к какому-то ключу в -ом запросе. Рассмотрим этот прямоугольник. На момент -го запроса рассмотрим в дереве поиска наименьшего общего предка и -- вершину . Если , то все хорошо, значит в дереве поиска она находится между и , поэтому мы к нему обращались в то время, когда шли к , значит есть точка на стороне нашего многоугольника.Если , то есть — предок в момент -го запроса, тогда рассмотрим момент -го запроса, когда мы обращались к . Найдем в дереве поиска наименьшего общего предка вершин и на момент -го запроса.Если , тогда мы к нему обращались, и есть точка на стороне нашего прямоугольника. Если , то есть — предок в момент -го запроса, Значит «всплывал», и хотя бы раз, между этими моментами выполнялся поворот вокруг ребра от к родителю.То есть во время -го запроса был в поддереве , а во время -го запроса в поддереве , значит где-то между этими моментами выполнялся поворот вокруг ребра от к родителю, и мы обращались к , следовательно есть точка на правой стороне нашего прямоугольника.2. Если множество точек обладает свойством древесности, то оно является фазовой диаграммой работы с некоторым деревом поиска. Для любого прямоугольника, построенного на наших точках, есть еще одна точка на стороне. Докажем, что можно построить такое дерево, для которого наши точки будут соответствовать запросам. Рассмотрим наше множество точек. Построим из них декартово(!) дерево, где ключом будет ключ, а вспомогательным ключом — время, когда мы следующий раз обратимся к вершине, то есть для каждого найдем минимальный такой, что существует точкаПриоритет будет меняться по мере того, как мы будет симулировать работу с деревом поиска.Рассмотрим общий случай Есть очередная горизонталь, на которой есть точки. Они по построению в текущий момент имеют минимальный приоритет, поэтому как-то организованы в районе корня нашего декартового дерева. Обойдем эти точки. После этого мы должны перестроить наше дерево, изменив приоритеты. Утверждается, что выполняя повороты только внутри верхней части нашего дерево можно построить дерево в соответствии с новыми приоритетами. Почему? Предположим, что это не удалось сделать. У нас есть вершина , у которой есть правый сын , и приоритет больше чем у , их надо поменять, то есть дотронуться до вершины , чего мы делать не хотели в этой строке. Но тогда рассмотрим прямоугольник(мы обращались к ) А когда-то мы обратимся кЕсли есть точка на левой стороне, то к мы обратимся раньше, чем к следовательно неверно, что приоритет больше чем приоритет На левой стороне точек нет.Если на нижней стороне есть точка, значит есть точка, к которой мы обращались сейчас, ключ которой больше, чем у , но меньше , но тогда она должна быть нашим правым сыном, а не вершина .Если на правой стороне есть точка, то сейчас мы бы обращались к ней, а не к .Если на верхней стороне есть точка с ключом меньше , мы будем обращаться к ней тогда же, когда и к , значит мы может перейти к прямоугольнику, построенному на точках и .Когда таких точек (как Поэтому при перестроении декартова дерева нам не потребуется переходить из нашей верхней зоны. ) не останется, то мы получим прямоугольник, у которого нет точек на всех сторонах, а это противоречит исходному условию. |
Таким образом, мы получили какую-то offline оптимальность.
Рассмотрим наши запросы, отметим их точками, тогда время работы оптимального динамического дерева равно количество точек на диаграмме.
Получим нижнюю оценку на оптимум.
Если что-то работает за O(f * g), значит это работает не более, чем в g раз хуже.
Рассмотрим запросы. Покроем их независимыми прямоугольниками. Прямоугольники независимы, если угол одного не лежит внутри другого.
Можно показать, что
, где — число запросов, — максимальное число независимых прямоугольников.То есть
Вторая нижняя оценка Уилбера (Wilber)
Для каждого запроса
вычислим число Уилбера.Для ключа
рассмотрим ключиПусть
, где и -- левая и правая границы на момент i. Будем передвигать левую границу каждый раз, когда встречаем число . Аналогично правую. В каждый момент времени позиция может увеличиваться, уменьшаться.Напишем
, если изменяется правая граница и -- если левая.Числом Уилбера
называется количество смен на и обратно.Получаем следующую оценку
Теорема: |
Рассмотрим ключей и запросов запросы
Организуем их в полное двоичное сбалансированное дерево. Будем в этом дереве искать наши ключи в том порядке, в котором их искали в оптимальное дереве. Для каждой вершины будем запоминать ребро, по которому мы последний раз проходили при поиске ключей в дереве(назовем его жирное ребро). Утверждается, что То есть если мы улучшили правую границу(мы искали что-то справа), а потом улучшили левую(искали слева), значит где-то по пути мы прошли туда-обратно и сменили жирное ребро. >= , где — число изменений жирных ребер. |
Tango-деревья
Построение
Определение: |
Жирное ребро(Prefered Path) — ребро, соединяющее вершину с ее последним посещенным ребенком. |
Рассмотрим бинарное дерево поиска.
Изначально сделаем все левые ребра жирными.
Разобьем наше дерево на жирные пути.
Каждый из этих жирных путей организуем в свое splay-дерево.
Из каждой вершины создадим вспомогательную ссылку на корень splay-дерева, соответствующего жирному пути, в котором лежит тот ее ребенок, в который ведет из нее нежирное ребро.
Таким образом, все наши ключи организуют иерархичную структуру — Tango-дерево.
Каждый жирный путь — splay-дерево, и каждое их них указывает на корень дерева, в котором лежит ее второй сын(при этом указатель ставится на само дерево, а не на сына).
Глубина tango дерева
.Время работы
, где — число изменений жирных ребер.Операций первого становления ребра жирным — O(\log n), это дает несущественный вклад в асимптотику.
Поиск
Поиск элемента в
дереве схож с поиском в обычном дереве поиска.Начинаем с поиска в жирном пути корня
дерева — -дереве.Если текущий жирный путь не содержит искомый элемент, то сделаем переход по вспомогательной ссылке(красная стрелка) и осуществим поиск в новом жирном пути(
-дереве).Поиск в
-дереве(синем) дереве = высота от количества вершин (количество вершин = длине жирного пути = ) = .Поиск во всем дереве =
* число проходов по нежирному ребру.Пример
Перестройка дерева
Для того, чтобы сохранить структуру
дерева ( -дерево соответствует текущему жирному пути), мы должны обновлять его каждый раз, когда жирные ребра изменяются в результате поиска. После изменения жирного ребра верхняя часть жирного пути отделяется от нижней части (которая становится самостоятельным жирным путем) и присоединяется к другому жирному пути (который становится нижней частью).Во-первых, мы должны запомнить для каждой вершины нашего изначального дерева поиска дополнительную информацию:
— минимальное значение в поддереве текущей вершины, — максимальное значение в поддереве.Во-вторых, нам понадобятся операции split и merge, которые работают за , где — число узлов в - дереве.
Пусть для того, чтобы найти вершину
, которая находится в дереве , мы прошли по тонкому ребру из вершины , находящейся в дереве . Значит, нам нужно объединить деревья и и вырезать из дерева подддерево , в которое ведет жирное ребро из вершины .Пусть поддерево
— правое. Для левого аналогично.- Так как мы знаем интервал значений вершины в ее правом поддереве , сделаем по концам отрезка две операции . Теперь мы можем отрезать поддерево .
- Все ключи дерева меньше (так как бинарное дерево поиска), поэтому выполним операцию по максимальному значению , меньшему .
- Выполним операцию merge деревьев и .
- Выполним операцию merge деревьев и .
- Выполним операцию merge деревьев и .
- Проведем тонкое ребро от вершины к дереву .
Таким образом, перестройка =
, где — число изменений жирного ребра.