Heavy-light декомпозиция — различия между версиями

Материал из Викиконспекты
Перейти к: навигация, поиск
(Вычисление LCA)
м (rollbackEdits.php mass rollback)
 
(не показаны 34 промежуточные версии 5 участников)
Строка 17: Строка 17:
 
</ul>
 
</ul>
  
Множество подобных запросов делаются за время за полином от логарифма (обычно <tex>O(\log^2{n})</tex>) с помощью Heavy-light декомпозиции.
+
Множество подобных запросов делаются за время за полином от логарифма (обычно <tex>O(\log^2{n})</tex>) с помощью heavy-light декомпозиции.
 
==Описание декомпозиции==
 
==Описание декомпозиции==
 
[[Файл:Heavylight.png|thumb|right|800x280px|Пример разбиения. В вершинах указан размер поддерева.]]
 
[[Файл:Heavylight.png|thumb|right|800x280px|Пример разбиения. В вершинах указан размер поддерева.]]
 
Необходимо составить такую декомпозицию дерева на множество рёберно-непересекающихся путей, что при прохождении от одной вершины до другой произойдет смена не более <tex>O(\log{n})</tex> путей из декомпозиции.
 
Необходимо составить такую декомпозицию дерева на множество рёберно-непересекающихся путей, что при прохождении от одной вершины до другой произойдет смена не более <tex>O(\log{n})</tex> путей из декомпозиции.
  
Декомпозиция заключается в классификации всех рёбер дерева <tex>T</tex> в 2 вида: легкие и тяжёлые. Введём функцию <tex>s(v)</tex>, которая будет обозначать размер поддерева вершины <tex>v</tex>.
+
Декомпозиция заключается в классификации всех рёбер дерева <tex>T</tex> в <tex>2</tex> вида: легкие и тяжёлые. Введём функцию <tex>s(v)</tex>, которая будет обозначать размер поддерева вершины <tex>v</tex>.
  
'''Тяжёлые ребра''' (англ. ''heavy edge'') {{---}} ребра <tex>(u, v)</tex> такие, что <tex>s(v) \geqslant</tex> <tex dpi="150">\frac{s(u)}{2}</tex>.
+
'''Тяжёлые ребра''' (англ. ''heavy edge'') {{---}} ребра <tex>(u, v)</tex> такие, что <tex>s(v) \geqslant</tex> <tex dpi="150">\dfrac{s(u)}{2}</tex>.
  
 
'''Лёгкие ребра''' (англ. ''light edge'') {{---}} соответственно все остальные.
 
'''Лёгкие ребра''' (англ. ''light edge'') {{---}} соответственно все остальные.
  
Очевидно, что из вершины может выходить как максимум одно тяжёлое ребро, т.к. иначе у нас есть два поддерева по как минимум <tex dpi="150">\frac{s(u)}{2}</tex> вершин, а также сама вершина <tex>u</tex>. Итого <tex>s(u) + 1</tex> вершин, тогда как у нас всего <tex>s(u)</tex> вершин в поддереве.
+
Очевидно, что из вершины может выходить как максимум одно тяжёлое ребро, т.к. иначе у нас есть два поддерева по как минимум <tex dpi="150">\dfrac{s(u)}{2}</tex> вершин, а также сама вершина <tex>u</tex>. Итого <tex>s(u) + 1</tex> вершин, тогда как у нас всего <tex>s(u)</tex> вершин в поддереве.
  
 
Теперь рассмотрим вершины, из которых не ведет вниз ни одно тяжёлое ребро. Будем идти от них вверх до корня или пока не пройдем легкое ребро. Получится какое-то множество путей. Утверждается, что полученная таким образом декомпозиция будет являться искомой и корректной.
 
Теперь рассмотрим вершины, из которых не ведет вниз ни одно тяжёлое ребро. Будем идти от них вверх до корня или пока не пройдем легкое ребро. Получится какое-то множество путей. Утверждается, что полученная таким образом декомпозиция будет являться искомой и корректной.
Строка 37: Строка 37:
 
Докажем по отдельности корректность декомпозиции.
 
Докажем по отдельности корректность декомпозиции.
 
# Все рёбра покрыты путями. <br>Есть два типа вершин: те, из которых ведёт ровно одно тяжёлое ребро и те, из которых не ведёт ни одного тяжёлого ребра. Для первого типа вершин мы дойдем до них некоторым путём через тяжёлое ребро снизу по определению выбора путей, а лёгкие рёбра ведущие из неё возьмем как последние рёбра в соответствующих путях. Для второго типа вершин мы по определению выбора путей возьмем их как начальные и пойдем вверх. <br>Таким образом все рёбра будут покрыты.
 
# Все рёбра покрыты путями. <br>Есть два типа вершин: те, из которых ведёт ровно одно тяжёлое ребро и те, из которых не ведёт ни одного тяжёлого ребра. Для первого типа вершин мы дойдем до них некоторым путём через тяжёлое ребро снизу по определению выбора путей, а лёгкие рёбра ведущие из неё возьмем как последние рёбра в соответствующих путях. Для второго типа вершин мы по определению выбора путей возьмем их как начальные и пойдем вверх. <br>Таким образом все рёбра будут покрыты.
# Все пути не пересекаются. <br>Докажем от противного. Пусть мы взяли какое-то ребро дважды. Это значит, что из какой-то вершины вело более чем одно тяжёлое ребро, чего быть не могло. Получили противоречие.
+
# Все пути не пересекаются. <br>Докажем от противного. Пусть мы взяли какое-то ребро дважды. Это значит, что из какой-то вершины <tex>v</tex> ведет более <tex>1</tex> тяжелого ребра в детей. Эти ребра относятся к разным путями, однако пути имеют хотя бы общее ребро {{---}} ребро из <tex>v</tex> в отца <tex>v</tex>. Более <tex>1</tex> тяжелого ребра из вершины идти не может, следовательно, получили противоречие.
# При прохождении пути от вершины <tex>v</tex> до вершины <tex>u</tex> произойдет смена не более, чем <tex>O(\log{n})</tex> путей. <br>Докажем эквивалентный факт, что при пути от любой вершины до корня мы сменим не более, чем <tex>O(\log{n})</tex> путей. Рассмотрим лёгкое ребро. Заметим, что проход вниз по такому ребру уменьшает размер поддерева как минимум в 2 раза. Но смена пути может произойти только при переходе по лёгкому ребру. Таким образом мы сменим не более <tex>O(\log{n})</tex> путей.
+
# При прохождении пути от вершины <tex>v</tex> до вершины <tex>u</tex> произойдет смена не более, чем <tex>O(\log{n})</tex> путей. <br>Докажем эквивалентный факт, что при пути от любой вершины до корня мы сменим не более, чем <tex>O(\log{n})</tex> путей. Рассмотрим лёгкое ребро. Заметим, что проход вниз по такому ребру уменьшает размер поддерева как минимум в <tex>2</tex> раза. Но смена пути может произойти только при переходе по лёгкому ребру. Таким образом мы сменим не более <tex>O(\log{n})</tex> путей.
 
}}
 
}}
  
  
Существует вариант Heavy-light декомпозиции на вершинно-непересекающихся путях. Чтобы получить такой путь нужно всего-лишь выкинуть последнее ребро из всех путей в рёберно-непересекающейся декомпозиции. Это может быть удобно при решении задач, где веса находятся не на рёбрах, а на вершинах и соответствующие запросы также делаются на вершинах.
+
Существует вариант heavy-light декомпозиции на вершинно-непересекающихся путях. Чтобы получить такой путь нужно всего-лишь выкинуть последнее ребро из всех путей в рёберно-непересекающейся декомпозиции. Это может быть удобно при решении задач, где веса находятся не на рёбрах, а на вершинах и соответствующие запросы также делаются на вершинах.
  
 
==Применение==
 
==Применение==
 
===Сумма на пути===
 
===Сумма на пути===
Классическая задача о сумме на пути в дереве с <tex>n</tex> вершинами решается с помощью Heavy-light декомпозиции за время <tex>O(\log^2{n})</tex>. Возможны модификации веса.
+
Классическая задача о сумме на пути в дереве с <tex>n</tex> вершинами может быть решена с помощью heavy-light декомпозиции за время <tex>O(\log^2{n})</tex>. Возможны модификации веса.
  
Построим [[Дерево отрезков. Построение|дерево отрезков]] над каждым путём. Рассмотрим запрос <tex>sum(u, v)</tex>. Найдем вершину <tex>c</tex>, которая является <tex>LCA(u, v)</tex> (например с помощью [[Метод двоичного подъема|двоичного подъема]]. Мы разбили запрос на два: <tex>(u, c)</tex> и <tex>(c, v)</tex>, на каждый из которых можно легко ответить разбив его на множество путей из декомпозиции и ответив на каждый путь из этого множества по отдельности за <tex>O(\log{n})</tex> с помощью дерева отрезков на этом пути. Всего таких путей нужно будет рассмотреть <tex>O(\log{n})</tex>. Итого мы способны решить эту задачу за время <tex>O(\log^2{n})</tex>.
+
Построим [[Дерево отрезков. Построение|дерево отрезков]] над каждым путём. Рассмотрим запрос <tex>sum(u, v)</tex>. Найдем вершину <tex>c</tex>, которая является <tex>\mathrm{LCA}(u, v)</tex> (например с помощью [[Метод двоичного подъема|двоичного подъема]]. Мы разбили запрос на два: <tex>(u, c)</tex> и <tex>(c, v)</tex>, на каждый из которых можно легко ответить разбив его на множество путей из декомпозиции и ответив на каждый путь из этого множества по отдельности за <tex>O(\log{n})</tex> с помощью дерева отрезков на этом пути. Всего таких путей нужно будет рассмотреть <tex>O(\log{n})</tex>. Итого мы способны решить эту задачу за время <tex>O(\log^2{n})</tex>.
  
 
Хоть это и не самый эффективный способ для решения этой задачи, но можно заметить, что навесив дерево отрезков на каждый путь мы способны отвечать на любые операции, определяемые на множестве, на котором данная операция ассоциативна, и существует нейтральный элемент относительно этой операции, то есть на моноиде (операции, поддерживаемые деревом отрезков), такие как: сумма на пути, максимум на пути, количество рёбер на пути, удовлетворяющих какому-то свойству.
 
Хоть это и не самый эффективный способ для решения этой задачи, но можно заметить, что навесив дерево отрезков на каждый путь мы способны отвечать на любые операции, определяемые на множестве, на котором данная операция ассоциативна, и существует нейтральный элемент относительно этой операции, то есть на моноиде (операции, поддерживаемые деревом отрезков), такие как: сумма на пути, максимум на пути, количество рёбер на пути, удовлетворяющих какому-то свойству.
 
===LCA===
 
===LCA===
Задача о наименьшем общем предке для двух вершин в дереве с <tex>n</tex> вершинами решается с помощью heavy-light декомпозиции. Воспользуемся основной идеей: декомпозиция разбивает все вершины дерева на вершинно-непересекающиеся пути так, что поднимаясь от любой вершины до корня дерева придется сменить не более <tex>\log{n}</tex> различных путей.
+
Задача о наименьшем общем предке для двух вершин в дереве с <tex>n</tex> вершинами также может быть решена с помощью heavy-light декомпозиции. Воспользуемся основной идеей: декомпозиция разбивает все вершины дерева на реберно-непересекающиеся пути так, что поднимаясь от любой вершины до корня дерева придется сменить не более <tex>\log{n}</tex> различных путей.
 +
 
 +
{{Лемма
 +
|id=Лемма1
 +
|statement=Пусть есть вершины <tex>u</tex> и <tex>v</tex>, лежащие на разных путях. При этом <tex>U</tex>, <tex>V</tex> — корни путей, на которых они лежат. Если <tex>U</tex> более удален от корня дерева, чем <tex>V</tex>, то <tex>\mathrm{LCA}(u, v) = \mathrm{LCA}(U, v)</tex>.
 +
 
 +
|proof=Допустим, пути не пересекаются. Предположим, что <tex>\mathrm{LCA}(u, v)</tex> и <tex>\mathrm{LCA}(U, v)</tex> это разные вершины. Тогда существует вершина, на пути от <tex>u</tex> к <tex>U</tex>, являющаяся <tex>\mathrm{LCA}</tex>. Значит <tex>\mathrm{LCA}</tex> должен принадлежать двум путям, но по предположению пути не пересекаются. Тем самым пришли к противоречию.
 +
 
 +
Теперь рассмотрим случай, когда пути пересекаются. Пути не могут совпадать более, чем в одной вершине, так как построенная декомпозиция является реберно-непересекающейся. При этом корень одного из путей является вершиной другого (либо корни совпадают, что равносильно), поскольку в противном случае пути пересекаются в более чем <tex>1</tex> вершине, что противоречит предыдущему условию. <tex>\mathrm{LCA}</tex> должен принадлежать двум путям, значит именно этот корень и будет <tex>\mathrm{LCA}</tex>.
 +
}}
  
 
====Препроцессинг====
 
====Препроцессинг====
Построим декомпозицию. Для каждой вершины, помимо её предка, будем хранить дополнительно следующие значения:
+
Построим heavy-light декомпозицию данного нам дерева. Для каждой вершины, помимо её предка, будем хранить дополнительно следующие значения:
 
# Расстояние до корня дерева. <br />Вычисляется за <tex>O(1)</tex> с помощью времен входа\выхода в каждую вершину.
 
# Расстояние до корня дерева. <br />Вычисляется за <tex>O(1)</tex> с помощью времен входа\выхода в каждую вершину.
# Номер предка. <br /> Предком назовем ту вершину, которая является начальной в том пути, на котором лежит текущая вершина. Очевидно, что имея разбиение на пути, найти предка можно за <tex>O(1)</tex>.
+
# Корень пути, на котором лежит вершина. <br /> Поскольку вершина может принадлежать нескольким путям, выберем тот, чья начальная вершина наиболее удалена от корня дерева. Имея разбиение на пути, найти корень можно за <tex>O(1)</tex>.
# Номер вершины, в которую выходит первое ребро пути, ведущего из предка в вершину. <br />Аналогично, находится за <tex>O(1)</tex> при построении.
+
# Вторая вершина этого пути. <br />Аналогично, находится за <tex>O(1)</tex> при построении.
  
 
====Вычисление LCA====
 
====Вычисление LCA====
Будем рекурсивно подниматься в направлении корня. Пусть на данной итерации рассматриваем вершины <tex>u</tex>, <tex>v</tex>.
+
Найдем <tex>\mathrm{LCA}</tex> для двух вершин. Для этого будем рекурсивно подниматься от этих вершин в направлении корня. Пусть на данной итерации рассматриваем вершины <tex>u</tex> и <tex>v</tex>. Заметим, что если эти вершины лежат на одном пути, то ответ {{---}} это такая вершина (<tex>u</tex> или <tex>v</tex>), которая находится ближе к корню. Очевидно, что если расстояние от корня до <tex>u</tex> меньше, чем расстояние до <tex>v</tex>, то <tex>u</tex> является предком <tex>v</tex>. Иначе, наоборот.
  
Пусть вершина <tex>a</tex> {{---}} первая вершина пути из предка вершины <tex>u</tex> в вершину <tex>u</tex>, а  <tex>b</tex> {{---}} первая вершина пути из предка вершины <tex>v</tex> в вершину <tex>v</tex>.  
+
Для проверки этого условия недостаточно знать только корни путей, потому что несколько путей могу иметь общий корень. Но любые два пути пересекаются не более чем в одной вершине. Воспользуемся этим фактом.
  
* Заметим, что если <tex>a</tex> = <tex>b</tex>, то или <tex>u</tex> лежит на пути от корня к <tex>v</tex>, или наоборот. За LCA примем ту вершину, которая лежит ближе к корню, т.е расстояние от корня до которой минимально. Очевидно, что если расстояние от <tex>a</tex> до корня меньше, чем расстояние от <tex>b</tex> до корня, то <tex>a</tex> является предком <tex>b</tex>, а не наоборот.
+
Пусть <tex>a</tex> и <tex>b</tex> {{---}} вторые вершины путей, содержащих вершины <tex>u</tex> и <tex>v</tex> соответственно. Важно заметить, что любая вершина, помимо корня дерева является некорневой вершиной какого-либо другого пути, поэтому такие <tex>a</tex> и <tex>b</tex> всегда существуют.  
  
* Иначе, вершины лежат на разных путях {{---}} ответ не изменится, если вместо одной из вершин взять корень того пути, на котором она лежит. Эту операцию будем производить с той вершиной, чей предок наименее удален от корня. Рекурсивно запустимся от выбранной и оставшейся вершин.
+
* Заметим, что если <tex>a</tex> = <tex>b</tex>, то <tex>u</tex> и <tex>v</tex> лежат на одном пути. Этот случай мы уже рассмотрели ранее.
  
 +
* Если это не так, то вершины лежат на разных путях. По лемме, так как пути реберно не пересекаются, то ответ не изменится, если вместо одной из вершин взять корень того пути, на котором она лежит. Эту операцию будем производить с той вершиной, чей предок наиболее удален от корня. Рекурсивно запустимся от выбранной и оставшейся вершин.
  
Очевидно, что в результате придем или в одну и ту же вершину, или одна из вершин окажется на пути от корня к другой. Тем самым мы найдем LCA.
+
Очевидно, что в результате придем или в одну и ту же вершину, или одна из вершин окажется на пути от корня к другой. Тем самым мы найдем <tex>\mathrm{LCA}</tex>.
  
 
====Псевдокод====
 
====Псевдокод====
  
<code>
+
Объявим несколько массивов для хранения дополнительной информации:
  <font color=darkgreen>// turn[<tex>u</tex>] {{---}} номер вершины, первой на пути из <tex>last</tex> в <tex> u </tex></font>
+
* <tex>\mathtt{dist}</tex> {{---}} расстояние  от корня до вершины.
  '''int''' turn[MAXN];
+
* <tex>\mathtt{last}</tex> {{---}} начало пути, на котором лежит вершина. Из всех путей выбирается путь с самой удаленной от корня дерева начальной вершины.
  <font color=darkgreen>// Расстояние от корня до вершины</font>
+
* <tex>\mathtt{turn}</tex> {{---}} вторая вершина этого пути.
  '''int''' dist[MAXN];
+
 
  <font color=darkgreen>// Начало пути, на котором лежит вершина</font>
+
Ниже представлен псевдокод функции получения наименьшего общего предка:
  '''int''' last[MAXN];
 
 
 
  <font color=darkgreen>//...
 
  // Построение декомпозиции
 
  //...</font>
 
 
    
 
    
 
   <font color=darkgreen>// Находит наименьшего общего предка вершин <tex>u</tex> и <tex>v</tex></font>
 
   <font color=darkgreen>// Находит наименьшего общего предка вершин <tex>u</tex> и <tex>v</tex></font>
   '''int''' lca('''int''' u, '''int''' v):
+
   '''int''' lca('''int''' u, '''int''' v)
     <font color=darkgreen>// Проверяем вершины, в которые идут ребра из предков.</font>
+
     <font color=darkgreen>// Проверяем вторые вершины путей, содержащих <tex>u</tex> и <tex>v</tex>.</font>
     '''if''' (turn[u] == turn[v]):
+
     '''if''' (turn[u] == turn[v])
 
       <font color=darkgreen>// Ответ найден, выберем ближайшую к корню.</font>
 
       <font color=darkgreen>// Ответ найден, выберем ближайшую к корню.</font>
       '''if''' (dist[u] < dist[v]):
+
       '''if''' (dist[u] < dist[v])
 
         '''return''' u
 
         '''return''' u
       '''else''':
+
       '''else'''
 
         '''return''' v
 
         '''return''' v
     <font color=darkgreen>// Рекурсивно запустимся от вершины, чей предок наиболее удален от корня.</font>
+
   
     '''if''' (dist[last[u]] > dist[last[v]]):
+
     <font color=darkgreen>// Рекурсивно запустимся от вершины, чей предок наиболее удален от корня дерева.</font>
 +
     '''if''' (dist[last[u]] > dist[last[v]])
 
       '''return''' lca(last[u], v)
 
       '''return''' lca(last[u], v)
 
     '''return''' lca(last[v], u)
 
     '''return''' lca(last[v], u)
</code>
 
  
====Ассимптотика====
+
====Асимптотика====
* '''Память''': Для реализации алгоритма требуется <tex>O(n)</tex> памяти.
+
* '''Память''': для реализации алгоритма требуется <tex>O(n)</tex> памяти.
 
* '''Препроцессинг''': heavy-light декомпозиция строится за <tex>O(n)</tex>, вся дополнительная информация считается за <tex>O(1)</tex> для каждой из вершин.
 
* '''Препроцессинг''': heavy-light декомпозиция строится за <tex>O(n)</tex>, вся дополнительная информация считается за <tex>O(1)</tex> для каждой из вершин.
* '''Запросы''': По свойству heavy-light декомпозиции, на пути от вершины к корню мы сменим не более <tex>\log n</tex> путей. Значит время выполнения запроса также <tex>O(\log n)</tex>.
+
* '''Запросы''': по свойству heavy-light декомпозиции, на пути от вершины к корню мы сменим не более <tex>\log n</tex> путей. Значит время выполнения запроса также <tex>O(\log n)</tex>.
  
 
==Реализация==
 
==Реализация==
Строка 115: Строка 120:
 
</ul>
 
</ul>
 
Пример реализации запроса суммы на пути:
 
Пример реализации запроса суммы на пути:
<code>
+
 
  '''int''' query('''int''' u, '''int''' v):
+
  '''int''' query('''int''' u, '''int''' v)
 
     '''int''' res = 0
 
     '''int''' res = 0
 
     '''int''' root = корень пути, в котором находится u
 
     '''int''' root = корень пути, в котором находится u
     '''while''' root не является предком v <font color=green>// поднимаемся до тех пор, пока наш путь не содержит общего предка u и v</font>
+
     '''while''' root не является предком v <font color=green>     // поднимаемся до тех пор, пока наш путь не содержит общего предка u и v</font>
 
         segmentTree = дерево отрезков, соответствующее пути, в котором лежит u
 
         segmentTree = дерево отрезков, соответствующее пути, в котором лежит u
 
         res += segmentTree.sum(0, pathPos(u))
 
         res += segmentTree.sum(0, pathPos(u))
         u = предок root              <font color=green>// вырезали нижний путь и подняли нижнюю вершину до нижней вершины следующего пути</font>
+
         u = предок root              <font color=green>   // вырезали нижний путь и подняли нижнюю вершину до нижней вершины следующего пути</font>
 
         root = корень пути, в котором находится u
 
         root = корень пути, в котором находится u
 +
   
 
     root = корень пути, в котором находится v
 
     root = корень пути, в котором находится v
     '''while''' root не является предком u <font color=green>// аналогично прошлому while, но с другой стороны</font>
+
     '''while''' root не является предком u <font color=green>     // аналогично прошлому while, но с другой стороны</font>
 
         segmentTree = дерево отрезков, соответствующее пути, в котором лежит v
 
         segmentTree = дерево отрезков, соответствующее пути, в котором лежит v
 
         res += segmentTree.sum(0, pathPos(v))
 
         res += segmentTree.sum(0, pathPos(v))
 
         v = предок root
 
         v = предок root
 
         root = корень пути, в котором находится v
 
         root = корень пути, в котором находится v
 +
   
 
     <font color=green>// последний путь (тот, что содержит общего предка) обрезан с двух сторон полученными вершинами</font>
 
     <font color=green>// последний путь (тот, что содержит общего предка) обрезан с двух сторон полученными вершинами</font>
 
     segmentTree = дерево отрезков, соответствующее пути в котором лежит u
 
     segmentTree = дерево отрезков, соответствующее пути в котором лежит u
 
     res += segmentTree.sum(min(pathPos(u), pathPos(v)), max(pathPos(u), pathPos(v)))
 
     res += segmentTree.sum(min(pathPos(u), pathPos(v)), max(pathPos(u), pathPos(v)))
 
     '''return''' res
 
     '''return''' res
</code>
 
  
 
== См.также ==
 
== См.также ==
Строка 144: Строка 150:
 
*[http://en.wikipedia.org/wiki/Heavy_path_decomposition Wikipedia — Heavy path decomposition]
 
*[http://en.wikipedia.org/wiki/Heavy_path_decomposition Wikipedia — Heavy path decomposition]
 
*[http://e-maxx.ru/algo/heavy_light MAXimal :: algo :: Heavy-light декомпозиция]
 
*[http://e-maxx.ru/algo/heavy_light MAXimal :: algo :: Heavy-light декомпозиция]
 +
* [https://habrahabr.ru/post/198464 Habrahabr {{---}} Алгоритм поиска наименьшего общего предка в дереве ]
  
 
[[Категория: Алгоритмы и структуры данных]]
 
[[Категория: Алгоритмы и структуры данных]]
 
[[Категория: Задача о наименьшем общем предке]]
 
[[Категория: Задача о наименьшем общем предке]]
 
[[Категория: Структуры данных]]
 
[[Категория: Структуры данных]]

Текущая версия на 19:27, 4 сентября 2022

Heavy-light декомпозиция — техника разбиения подвешенного дерева на множество путей для решения задач о запросах на пути в дереве (в том числе с модификациями).

Описание задачи

Задача:
Имеется подвешенное дерево [math]T[/math] c [math]n[/math] вершинами и необходимо проводить операции на нем на пути от вершины [math]v[/math] до вершины [math]u[/math].

Примеры запросов:

  • сумма на пути,
  • максимум на пути,
  • количество рёбер на пути, вес которых больше заданного [math]c[/math].

Примеры модификаций:

  • модификация одного ребра,
  • прибавление к весу всех рёбер на пути,
  • установка веса всех рёбер на пути в заданное [math]c[/math].

Множество подобных запросов делаются за время за полином от логарифма (обычно [math]O(\log^2{n})[/math]) с помощью heavy-light декомпозиции.

Описание декомпозиции

Пример разбиения. В вершинах указан размер поддерева.

Необходимо составить такую декомпозицию дерева на множество рёберно-непересекающихся путей, что при прохождении от одной вершины до другой произойдет смена не более [math]O(\log{n})[/math] путей из декомпозиции.

Декомпозиция заключается в классификации всех рёбер дерева [math]T[/math] в [math]2[/math] вида: легкие и тяжёлые. Введём функцию [math]s(v)[/math], которая будет обозначать размер поддерева вершины [math]v[/math].

Тяжёлые ребра (англ. heavy edge) — ребра [math](u, v)[/math] такие, что [math]s(v) \geqslant[/math] [math]\dfrac{s(u)}{2}[/math].

Лёгкие ребра (англ. light edge) — соответственно все остальные.

Очевидно, что из вершины может выходить как максимум одно тяжёлое ребро, т.к. иначе у нас есть два поддерева по как минимум [math]\dfrac{s(u)}{2}[/math] вершин, а также сама вершина [math]u[/math]. Итого [math]s(u) + 1[/math] вершин, тогда как у нас всего [math]s(u)[/math] вершин в поддереве.

Теперь рассмотрим вершины, из которых не ведет вниз ни одно тяжёлое ребро. Будем идти от них вверх до корня или пока не пройдем легкое ребро. Получится какое-то множество путей. Утверждается, что полученная таким образом декомпозиция будет являться искомой и корректной.

Утверждение:
Полученная декомпозиция является искомой.
[math]\triangleright[/math]

Докажем по отдельности корректность декомпозиции.

  1. Все рёбра покрыты путями.
    Есть два типа вершин: те, из которых ведёт ровно одно тяжёлое ребро и те, из которых не ведёт ни одного тяжёлого ребра. Для первого типа вершин мы дойдем до них некоторым путём через тяжёлое ребро снизу по определению выбора путей, а лёгкие рёбра ведущие из неё возьмем как последние рёбра в соответствующих путях. Для второго типа вершин мы по определению выбора путей возьмем их как начальные и пойдем вверх.
    Таким образом все рёбра будут покрыты.
  2. Все пути не пересекаются.
    Докажем от противного. Пусть мы взяли какое-то ребро дважды. Это значит, что из какой-то вершины [math]v[/math] ведет более [math]1[/math] тяжелого ребра в детей. Эти ребра относятся к разным путями, однако пути имеют хотя бы общее ребро — ребро из [math]v[/math] в отца [math]v[/math]. Более [math]1[/math] тяжелого ребра из вершины идти не может, следовательно, получили противоречие.
  3. При прохождении пути от вершины [math]v[/math] до вершины [math]u[/math] произойдет смена не более, чем [math]O(\log{n})[/math] путей.
    Докажем эквивалентный факт, что при пути от любой вершины до корня мы сменим не более, чем [math]O(\log{n})[/math] путей. Рассмотрим лёгкое ребро. Заметим, что проход вниз по такому ребру уменьшает размер поддерева как минимум в [math]2[/math] раза. Но смена пути может произойти только при переходе по лёгкому ребру. Таким образом мы сменим не более [math]O(\log{n})[/math] путей.
[math]\triangleleft[/math]


Существует вариант heavy-light декомпозиции на вершинно-непересекающихся путях. Чтобы получить такой путь нужно всего-лишь выкинуть последнее ребро из всех путей в рёберно-непересекающейся декомпозиции. Это может быть удобно при решении задач, где веса находятся не на рёбрах, а на вершинах и соответствующие запросы также делаются на вершинах.

Применение

Сумма на пути

Классическая задача о сумме на пути в дереве с [math]n[/math] вершинами может быть решена с помощью heavy-light декомпозиции за время [math]O(\log^2{n})[/math]. Возможны модификации веса.

Построим дерево отрезков над каждым путём. Рассмотрим запрос [math]sum(u, v)[/math]. Найдем вершину [math]c[/math], которая является [math]\mathrm{LCA}(u, v)[/math] (например с помощью двоичного подъема. Мы разбили запрос на два: [math](u, c)[/math] и [math](c, v)[/math], на каждый из которых можно легко ответить разбив его на множество путей из декомпозиции и ответив на каждый путь из этого множества по отдельности за [math]O(\log{n})[/math] с помощью дерева отрезков на этом пути. Всего таких путей нужно будет рассмотреть [math]O(\log{n})[/math]. Итого мы способны решить эту задачу за время [math]O(\log^2{n})[/math].

Хоть это и не самый эффективный способ для решения этой задачи, но можно заметить, что навесив дерево отрезков на каждый путь мы способны отвечать на любые операции, определяемые на множестве, на котором данная операция ассоциативна, и существует нейтральный элемент относительно этой операции, то есть на моноиде (операции, поддерживаемые деревом отрезков), такие как: сумма на пути, максимум на пути, количество рёбер на пути, удовлетворяющих какому-то свойству.

LCA

Задача о наименьшем общем предке для двух вершин в дереве с [math]n[/math] вершинами также может быть решена с помощью heavy-light декомпозиции. Воспользуемся основной идеей: декомпозиция разбивает все вершины дерева на реберно-непересекающиеся пути так, что поднимаясь от любой вершины до корня дерева придется сменить не более [math]\log{n}[/math] различных путей.

Лемма:
Пусть есть вершины [math]u[/math] и [math]v[/math], лежащие на разных путях. При этом [math]U[/math], [math]V[/math] — корни путей, на которых они лежат. Если [math]U[/math] более удален от корня дерева, чем [math]V[/math], то [math]\mathrm{LCA}(u, v) = \mathrm{LCA}(U, v)[/math].
Доказательство:
[math]\triangleright[/math]

Допустим, пути не пересекаются. Предположим, что [math]\mathrm{LCA}(u, v)[/math] и [math]\mathrm{LCA}(U, v)[/math] это разные вершины. Тогда существует вершина, на пути от [math]u[/math] к [math]U[/math], являющаяся [math]\mathrm{LCA}[/math]. Значит [math]\mathrm{LCA}[/math] должен принадлежать двум путям, но по предположению пути не пересекаются. Тем самым пришли к противоречию.

Теперь рассмотрим случай, когда пути пересекаются. Пути не могут совпадать более, чем в одной вершине, так как построенная декомпозиция является реберно-непересекающейся. При этом корень одного из путей является вершиной другого (либо корни совпадают, что равносильно), поскольку в противном случае пути пересекаются в более чем [math]1[/math] вершине, что противоречит предыдущему условию. [math]\mathrm{LCA}[/math] должен принадлежать двум путям, значит именно этот корень и будет [math]\mathrm{LCA}[/math].
[math]\triangleleft[/math]

Препроцессинг

Построим heavy-light декомпозицию данного нам дерева. Для каждой вершины, помимо её предка, будем хранить дополнительно следующие значения:

  1. Расстояние до корня дерева.
    Вычисляется за [math]O(1)[/math] с помощью времен входа\выхода в каждую вершину.
  2. Корень пути, на котором лежит вершина.
    Поскольку вершина может принадлежать нескольким путям, выберем тот, чья начальная вершина наиболее удалена от корня дерева. Имея разбиение на пути, найти корень можно за [math]O(1)[/math].
  3. Вторая вершина этого пути.
    Аналогично, находится за [math]O(1)[/math] при построении.

Вычисление LCA

Найдем [math]\mathrm{LCA}[/math] для двух вершин. Для этого будем рекурсивно подниматься от этих вершин в направлении корня. Пусть на данной итерации рассматриваем вершины [math]u[/math] и [math]v[/math]. Заметим, что если эти вершины лежат на одном пути, то ответ — это такая вершина ([math]u[/math] или [math]v[/math]), которая находится ближе к корню. Очевидно, что если расстояние от корня до [math]u[/math] меньше, чем расстояние до [math]v[/math], то [math]u[/math] является предком [math]v[/math]. Иначе, наоборот.

Для проверки этого условия недостаточно знать только корни путей, потому что несколько путей могу иметь общий корень. Но любые два пути пересекаются не более чем в одной вершине. Воспользуемся этим фактом.

Пусть [math]a[/math] и [math]b[/math] — вторые вершины путей, содержащих вершины [math]u[/math] и [math]v[/math] соответственно. Важно заметить, что любая вершина, помимо корня дерева является некорневой вершиной какого-либо другого пути, поэтому такие [math]a[/math] и [math]b[/math] всегда существуют.

  • Заметим, что если [math]a[/math] = [math]b[/math], то [math]u[/math] и [math]v[/math] лежат на одном пути. Этот случай мы уже рассмотрели ранее.
  • Если это не так, то вершины лежат на разных путях. По лемме, так как пути реберно не пересекаются, то ответ не изменится, если вместо одной из вершин взять корень того пути, на котором она лежит. Эту операцию будем производить с той вершиной, чей предок наиболее удален от корня. Рекурсивно запустимся от выбранной и оставшейся вершин.

Очевидно, что в результате придем или в одну и ту же вершину, или одна из вершин окажется на пути от корня к другой. Тем самым мы найдем [math]\mathrm{LCA}[/math].

Псевдокод

Объявим несколько массивов для хранения дополнительной информации:

  • [math]\mathtt{dist}[/math] — расстояние от корня до вершины.
  • [math]\mathtt{last}[/math] — начало пути, на котором лежит вершина. Из всех путей выбирается путь с самой удаленной от корня дерева начальной вершины.
  • [math]\mathtt{turn}[/math] — вторая вершина этого пути.

Ниже представлен псевдокод функции получения наименьшего общего предка:

 // Находит наименьшего общего предка вершин [math]u[/math] и [math]v[/math]
 int lca(int u, int v)
   // Проверяем вторые вершины путей, содержащих [math]u[/math] и [math]v[/math].
   if (turn[u] == turn[v])
     // Ответ найден, выберем ближайшую к корню.
     if (dist[u] < dist[v])
       return u
     else
       return v
    
   // Рекурсивно запустимся от вершины, чей предок наиболее удален от корня дерева.
   if (dist[last[u]] > dist[last[v]])
     return lca(last[u], v)
   return lca(last[v], u)

Асимптотика

  • Память: для реализации алгоритма требуется [math]O(n)[/math] памяти.
  • Препроцессинг: heavy-light декомпозиция строится за [math]O(n)[/math], вся дополнительная информация считается за [math]O(1)[/math] для каждой из вершин.
  • Запросы: по свойству heavy-light декомпозиции, на пути от вершины к корню мы сменим не более [math]\log n[/math] путей. Значит время выполнения запроса также [math]O(\log n)[/math].

Реализация

Ниже будет приведена реализация запроса сумма на пути между любыми двумя вершинами в дереве без запросов модификации. Все запросы, сводящиеся к навешиванию дерева отрезков на пути из декомпозиции делаются похожим образом.

Опущены некоторые детали реализации: построение и дерево отрезков.

  • [math]\mathrm{pathPos}[/math] — функция, позволяющая найти смещение вершины в пути относительно корня пути,
  • [math]\mathrm{getValue(\mathtt{i}, \mathtt{j})}[/math] — функция, позволяющая найти вес [math]\mathtt{j}[/math]-ого ребра в [math]\mathtt{i}[/math]-ом пути.

Пример реализации запроса суммы на пути:

int query(int u, int v)
    int res = 0
    int root = корень пути, в котором находится u
    while root не является предком v      // поднимаемся до тех пор, пока наш путь не содержит общего предка u и v
        segmentTree = дерево отрезков, соответствующее пути, в котором лежит u
        res += segmentTree.sum(0, pathPos(u))
        u = предок root                   // вырезали нижний путь и подняли нижнюю вершину до нижней вершины следующего пути
        root = корень пути, в котором находится u
    
    root = корень пути, в котором находится v
    while root не является предком u      // аналогично прошлому while, но с другой стороны
        segmentTree = дерево отрезков, соответствующее пути, в котором лежит v
        res += segmentTree.sum(0, pathPos(v))
        v = предок root
        root = корень пути, в котором находится v
    
    // последний путь (тот, что содержит общего предка) обрезан с двух сторон полученными вершинами
    segmentTree = дерево отрезков, соответствующее пути в котором лежит u
    res += segmentTree.sum(min(pathPos(u), pathPos(v)), max(pathPos(u), pathPos(v)))
    return res

См.также

Источники информации