Level Ancestor problem — различия между версиями
Romech (обсуждение | вклад) |
Romech (обсуждение | вклад) |
||
Строка 14: | Строка 14: | ||
== Алгоритм лестниц == | == Алгоритм лестниц == | ||
− | === | + | === Longest path decomposition === |
Разобьем все вершины на пути следующим образом. Обойдем дерево с помощью обхода в глубину, пусть мы стоим в вершине | Разобьем все вершины на пути следующим образом. Обойдем дерево с помощью обхода в глубину, пусть мы стоим в вершине | ||
<tex>v</tex>, обойдем всех ее детей, добавив <tex>v</tex> в путь, идущий в самое глубокое поддерево, | <tex>v</tex>, обойдем всех ее детей, добавив <tex>v</tex> в путь, идущий в самое глубокое поддерево, | ||
Строка 32: | Строка 32: | ||
'''int''' n = h(v); ''<font color="green">// получаем глубину вершины <tex>v</tex></font>'' | '''int''' n = h(v); ''<font color="green">// получаем глубину вершины <tex>v</tex></font>'' | ||
n = n - k; ''<font color="green">// на столько необходимо подняться до ответа</font>'' | n = n - k; ''<font color="green">// на столько необходимо подняться до ответа</font>'' | ||
− | i = <tex>\ | + | i = <tex>\log_2 n</tex>; |
v = p_i[v] ''<font color="green">// делаем максимально большой прыжок вверх</font>'' | v = p_i[v] ''<font color="green">// делаем максимально большой прыжок вверх</font>'' | ||
i = n - i; ''<font color="green">// на столько осталось еще подняться</font>'' | i = n - i; ''<font color="green">// на столько осталось еще подняться</font>'' | ||
Строка 40: | Строка 40: | ||
Рассмотрим путь, на котором лежит вершина <tex>v</tex> до удвоения. Он длины хотя бы <tex>2^i</tex>, так как мы точно знаем, что существует вершина потомок <tex>v</tex>, расстояние до которого ровно <tex>2^i</tex> (это вершина, из которой мы только что пришли). Значит, после удвоения этот путь стал длины хотя бы <tex>2^{i + 1}</tex>, причем хотя бы <tex>2^i</tex> вершин в нем - предки <tex>v</tex>. Это означает, что вершина, которую мы ищем, находится на этом пути (иначе бы мы могли до этого прыгнуть еще на <tex>2^i</tex> вверх). Так как мы знаем позицию <tex>v</tex> в этом пути, то нужную вершину мы можем найти за <tex>O(1)</tex>. | Рассмотрим путь, на котором лежит вершина <tex>v</tex> до удвоения. Он длины хотя бы <tex>2^i</tex>, так как мы точно знаем, что существует вершина потомок <tex>v</tex>, расстояние до которого ровно <tex>2^i</tex> (это вершина, из которой мы только что пришли). Значит, после удвоения этот путь стал длины хотя бы <tex>2^{i + 1}</tex>, причем хотя бы <tex>2^i</tex> вершин в нем - предки <tex>v</tex>. Это означает, что вершина, которую мы ищем, находится на этом пути (иначе бы мы могли до этого прыгнуть еще на <tex>2^i</tex> вверх). Так как мы знаем позицию <tex>v</tex> в этом пути, то нужную вершину мы можем найти за <tex>O(1)</tex>. | ||
− | Таким образом, наш алгоритм работает за | + | Таким образом, наш алгоритм работает за <tex>\langle O(n\log n), O(1)\rangle </tex> времени и за <tex>O(n\log n)</tex> памяти. Методом четырех русских данный метод можно улучшить до <tex>\langle O(n), O(1)\rangle </tex> с помощью оптимизации предподсчета. |
== The Macro-Micro-Tree Algorithm == | == The Macro-Micro-Tree Algorithm == | ||
В данном разделе мы докажем, что предподсчет предыдущего алгоритма можно улучшить до <tex>O(n)</tex>. | В данном разделе мы докажем, что предподсчет предыдущего алгоритма можно улучшить до <tex>O(n)</tex>. | ||
Строка 47: | Строка 47: | ||
*Воспользуемся алгоритмом лестниц, но будем выполнять предподсчет только для листьев. | *Воспользуемся алгоритмом лестниц, но будем выполнять предподсчет только для листьев. | ||
Рассмотрим как можно улучшить данный алгоритм: | Рассмотрим как можно улучшить данный алгоритм: | ||
− | *Зададим некую функцию <tex>S(n) = \dfrac{1}{4} \ | + | *Зададим некую функцию <tex>S(n) = \dfrac{1}{4} \log_2 n</tex> |
*Посчитаем размер поддерева для каждой вершины с помощью обхода в глубину, после чего удалим все вершины размер поддерева которых меньше чем <tex>S(n)</tex>. | *Посчитаем размер поддерева для каждой вершины с помощью обхода в глубину, после чего удалим все вершины размер поддерева которых меньше чем <tex>S(n)</tex>. | ||
*Забудем на время про удаленные поддеревья, для оставшегося дерева наш алгоритм работает за <tex>\langle O(\dfrac{n}{S(n)} \log n + n), O(1)\rangle </tex>. Получаем алгоритм <tex>\langle O(n), O(1) \rangle </tex>. Для удаленных поддеревьев же выполним полный предподсчет: таких деревьев не более чем <tex>2^{2S(n)}</tex>, что дает асимптотику предподсчета <tex>O(\sqrt{n} \log^2{n}) = o(n) = O(n)</tex>. | *Забудем на время про удаленные поддеревья, для оставшегося дерева наш алгоритм работает за <tex>\langle O(\dfrac{n}{S(n)} \log n + n), O(1)\rangle </tex>. Получаем алгоритм <tex>\langle O(n), O(1) \rangle </tex>. Для удаленных поддеревьев же выполним полный предподсчет: таких деревьев не более чем <tex>2^{2S(n)}</tex>, что дает асимптотику предподсчета <tex>O(\sqrt{n} \log^2{n}) = o(n) = O(n)</tex>. | ||
Строка 59: | Строка 59: | ||
но тогда и время предподсчета в наивной реализации (посчитать подъемы для всех вершин) ухудшится до <tex>\langle O(n \log n), | но тогда и время предподсчета в наивной реализации (посчитать подъемы для всех вершин) ухудшится до <tex>\langle O(n \log n), | ||
O(\log n)\rangle </tex> времени и <tex>O(n \log n)</tex> памяти. Также альтернативой данным двум алгоритмам является полный предподсчет всех возможных запросов, что соответственно дает нам асимптотику <tex>\langle O(n^2), O(1)\rangle </tex>времени и <tex>O(n^2)</tex> памяти. | O(\log n)\rangle </tex> времени и <tex>O(n \log n)</tex> памяти. Также альтернативой данным двум алгоритмам является полный предподсчет всех возможных запросов, что соответственно дает нам асимптотику <tex>\langle O(n^2), O(1)\rangle </tex>времени и <tex>O(n^2)</tex> памяти. | ||
+ | <center> | ||
− | |||
+ | {| class="wikitable" align="center" style="color: blue; background-color:#ffffff;" cellpadding="10" | ||
+ | |+ | ||
+ | !colspan="5"| Сравнение асимптотик | ||
+ | |-align="center" | ||
+ | ! | ||
+ | |! width="12%" | <tex>Предподсчет</tex> | ||
+ | |! width="12%" | <tex>Ответ</tex> | ||
+ | |! width="12%" | <tex>Память</tex> | ||
+ | |-align="center" | ||
+ | !Обычный подьем до нужного уровня | ||
+ | |<tex>O(n)</tex>||<tex>O(n)</tex>||<tex>O(n)</tex> | ||
+ | |-align="center" | ||
+ | !Двоичные подъемы | ||
+ | |<tex>O(n \log n)</tex>||<tex>O(\log n)</tex>||<tex>O(n \log n)</tex> | ||
+ | !Декомпозиция | ||
+ | |<tex>O(n)</tex>||<tex>O(\log n)</tex>||<tex>O(n)</tex> | ||
+ | !Алгоритм лестниц | ||
+ | |<tex>O(n \log n)</tex>||<tex>O(1)</tex>||<tex>O(n \log n)</tex> | ||
+ | !Macro-Micro-Tree Algorithm | ||
+ | |<tex>O(n)</tex>||<tex>O(1)</tex>||<tex>O(n)</tex> | ||
+ | |} | ||
+ | </center> | ||
+ | |||
+ | == Примечания == | ||
+ | [https://www.mi.fu-berlin.de/en/inf/groups/abi/teaching/lectures/lectures_past/WS0910/V____Discrete_Mathematics_for_Bioinformatics__P1/material/scripts/treedecomposition1.pdf Longest path decomposition] | ||
== См. также == | == См. также == | ||
*[[Метод двоичного подъёма]] | *[[Метод двоичного подъёма]] |
Версия 17:36, 18 мая 2019
Задача о уровне предка (англ. "Level Ancestor problem") является задачей о превращении данного подвешенного дерева
в структуру данных, которая сможет определить предка любого узла на заданном расстоянии от корня дерева.
Задача: |
Дано подвешенное дерево | c вершинами. Поступают запросы вида , для каждого из которых необходимо найти предка вершины , который находится на расстоянии от корня дерева .
Содержание
Использование Heavy-light декомпозиции
Этот алгоритм базируется на различных способах декомпозиции дерева (выберем heavy-light декомпозицию), из свойств этого разбиения следует, что подняться на любую высоту из вершины мы можем за время . Данное разбиение можно строить за , что дает нам алгоритм за .
В данном примере поступает запрос LA(v,2), на который алгоритм должен дать ответ h.
Алгоритм лестниц
Longest path decomposition
Разобьем все вершины на пути следующим образом. Обойдем дерево с помощью обхода в глубину, пусть мы стоим в вершине
, обойдем всех ее детей, добавив в путь, идущий в самое глубокое поддерево, т.е. в котором находится вершина с самой большой глубиной. Для каждой вершины сохраним номер пути в который она входит.Ladder decomposition
Увеличим каждый путь в два раза вверх, для каждого нового пути сохраним все входящие в него вершины, а для каждой вершины сохраним ее номер в пути, в который она входит. Построение обычной longest-path декомпозиции займет у нас
времени (обход в глубину), соответственно удлиннение каждого пути ухудшит асимптотику до .После этого посчитаем двоичные подъемы для каждой вершины за
, что соответственно не ухудшит асимптотику.Псевдокод
Пусть после этого нам пришел запрос
.function LA(int v,int k): int n = h(v); // получаем глубину вершиныn = n - k; // на столько необходимо подняться до ответа i = ; v = p_i[v] // делаем максимально большой прыжок вверх i = n - i; // на столько осталось еще подняться return way[num_on_way[v] - i]; // так как теперь и ответ находятся на одном пути
Доказательство корректности
Рассмотрим путь, на котором лежит вершина
до удвоения. Он длины хотя бы , так как мы точно знаем, что существует вершина потомок , расстояние до которого ровно (это вершина, из которой мы только что пришли). Значит, после удвоения этот путь стал длины хотя бы , причем хотя бы вершин в нем - предки . Это означает, что вершина, которую мы ищем, находится на этом пути (иначе бы мы могли до этого прыгнуть еще на вверх). Так как мы знаем позицию в этом пути, то нужную вершину мы можем найти за .Таким образом, наш алгоритм работает за
времени и за памяти. Методом четырех русских данный метод можно улучшить до с помощью оптимизации предподсчета.The Macro-Micro-Tree Algorithm
В данном разделе мы докажем, что предподсчет предыдущего алгоритма можно улучшить до
. Для начала рассмотрим алгоритм >, где это количество листьев.- С помощью обхода в глубину запомним по одному листу в ее поддереве для каждой вершины
- Воспользуемся алгоритмом лестниц, но будем выполнять предподсчет только для листьев.
Рассмотрим как можно улучшить данный алгоритм:
- Зададим некую функцию
- Посчитаем размер поддерева для каждой вершины с помощью обхода в глубину, после чего удалим все вершины размер поддерева которых меньше чем .
- Забудем на время про удаленные поддеревья, для оставшегося дерева наш алгоритм работает за . Получаем алгоритм . Для удаленных поддеревьев же выполним полный предподсчет: таких деревьев не более чем , что дает асимптотику предподсчета .
В итоге полученный алгоритм действительно работает за
времени и за памяти.Сравнение с наивными реализациями
Используя DFS посчитаем глубину каждой вершины дерева (это можно сделать за предподсчета двоичных подъемов , но тогда и время предподсчета в наивной реализации (посчитать подъемы для всех вершин) ухудшится до времени и памяти. Также альтернативой данным двум алгоритмам является полный предподсчет всех возможных запросов, что соответственно дает нам асимптотику времени и памяти.
), после чего можем из вершины подняться до необходимой глубины вершины , что так же в худшем случае работает за . Получили алгоритм за времени и памяти, где время ответа на запрос можно улучшить до c помощью
Сравнение асимптотик | |||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Обычный подьем до нужного уровня | |||||||||||||||
Двоичные подъемы | Декомпозиция | Алгоритм лестниц | Macro-Micro-Tree Algorithm |