Алгоритм Хьюи — различия между версиями
| Shersh (обсуждение | вклад) м (переименовал Алгоритм Хью в Алгоритм Хьюи: так вроде правильней) | Nikitaevg (обсуждение | вклад)  | ||
| Строка 1: | Строка 1: | ||
| {{Задача | {{Задача | ||
| − | |definition=Дано  | + | |definition=Дано [[Основные определения теории графов#oriented_grath|ориентированный]] [[Дерево, эквивалентные определения#tree|дерево]], вершины которого раскрашены в цвета. Найти <tex>dc:V\rightarrow \{1\ldots k\}</tex>, где <tex>dc(u) -</tex> число различных цветов в поддереве с корнем в вершине <tex>u</tex>. Время работы: <tex>O(V)</tex>}} | 
| __TOC__ | __TOC__ | ||
| ==Алгоритм решения== | ==Алгоритм решения== | ||
| − | Для начала  | + | Будем в каждой вершине дерева хранить по числу, так, чтобы для каждого поддерева ответом была сумма всех значений в вершинах в данном поддереве. Для начала каждой вершине в качестве значения присвоим <tex>1</tex>. Теперь, если бы все вершины имели различные цвета, надо было бы пройти снизу вверх по дереву и просуммировать для каждой вершины числа, записанные в её детях. Но некоторые вершины будут иметь одинаковые цвета, и это надо как-то учитывать. Для этого запустим [[Обход в глубину, цвета вершин|обход в глубину]]. Также будем хранить для каждого цвета последнюю посещенную вершину данного цвета в массиве <tex>last[k]</tex>. Теперь, заходя в <tex>i</tex>-ую вершину с цветом <tex>col</tex>, смотрим: если вершина с таким цветом еще не встречалась, то просто присваиваем <tex>last[col]=i</tex>, иначе, если вершина с данным цветом уже встречалась, то находим [[Сведение задачи LCA к задаче RMQ|наименьшего общего предка]] данной вершины и последней вершины с таким цветом и вычитаем из их предка <tex>1</tex>, присваиваем <tex>last[col]=i</tex>. Теперь при выходе из вершины можно просуммировать числа в ее детях и получить ответ для данной вершины, так как для нее все дети уже подсчитаны. Таким образом, алгоритм запускает один обход в глубину, на каждой итерации которого ищет наименьшего общего предка. Если искать наименьшего общего предка за <tex>O(1)</tex>, к примеру [[Алгоритм Фарака-Колтона и Бендера|алгоритмом Фарака-Колтона и Бендера]], то сложность работы алгоритма будет <tex>O(V)</tex>. | 
| − | Пример | + | ==Пример== | 
| − | + | {| class = "wikitable" | |
| − | [[Файл:algo_0.png| | + | ! № шага !! Изображение !! Описание | 
| − | + | |-align="center" | |
| − | + | | 0 | |
| − | [[Файл:algo_1.png| | + | | [[Файл:algo_0.png|300px]] | 
| − | + | | Расставим у каждой вершины <tex>1</tex>. | |
| − | + | |-align="center" | |
| − | [[Файл:algo_2.png| | + | | 1 | 
| − | + | | [[Файл:algo_1.png|300px]] | |
| − | + | | Выходим из <tex>8</tex>-ой вершины. Так как желтых вершин еще не было, запоминаем её как последнюю желтую. | |
| − | [[Файл: | + | |-align="center" | 
| − | + | | 2 | |
| − | + | | [[Файл:algo_2.png|300px]] | |
| − | [[Файл: | + | | <tex>4</tex>-ая вершина. Последняя желтая <tex>-\ 8</tex>-ая. Их LCA <tex>\ -4</tex>-ая вершина. Вычитаем из значения <tex>4</tex>-ой вершины <tex>1</tex> и запоминаем текущую как последнюю желтую. | 
| − | + | |-align="center" | |
| − | + | | 8 | |
| − | [[Файл: | + | | [[Файл:8.png|300px]] | 
| + | | Пропустим несколько тривиальных шагов. Выходим из <tex>11</tex>-ой вершины. Последней посещенной зеленой была <tex>5</tex>-ая (не <tex>3</tex>-я). Вычитаем из их LCA (<tex>1</tex>-ой вершины) <tex>1</tex> и запоминаем <tex>11</tex>-ую как последнюю зеленую. | ||
| + | |-align="center" | ||
| + | | 9 | ||
| + | | [[Файл:9.png|300px]] | ||
| + | | Выходим из <tex>7</tex>-ой вершины. Последней синей была <tex>2</tex>-ая. Вычтем из их LCA <tex>1</tex> и запомним <tex>7</tex>-ую как последнюю синюю. | ||
| + | |-align="center" | ||
| + | | суммирование | ||
| + | | [[Файл:algo_12.png|300px]] | ||
| + | |Пропустим еще два шага. В результате суммирования получаем в каждой вершине ответ на задачу для поддерева. | ||
| + | |- | ||
| + | |} | ||
| ==Псевдокод== | ==Псевдокод== | ||
| − |   '''func''' dfs (Node v)''':''' | + |  '''int''' col[MAX_COL], used[MAX_N], sum[MAX_N] | 
| − |      used[v]  | + | |
| + |   '''func''' dfs('''Node''' v)''':''' | ||
| + |      used[v] = <b>true</b> | ||
|      '''for''' <tex>u \in v.children</tex> |      '''for''' <tex>u \in v.children</tex> | ||
|          '''if''' !used[u] |          '''if''' !used[u] | ||
|              dfs(u) |              dfs(u) | ||
| − |          sum[v]  | + |          sum[v] += sum[u] | 
|      '''if''' last[col[v]] != -1 |      '''if''' last[col[v]] != -1 | ||
| − |           sum[lca(v, last[col[v]])] - | + |           sum[lca(v, last[col[v]])]-- | 
| − |      last[col[v]]  | + |      last[col[v]] = v | 
| − |   '''func''' hugh (int n, int k, Node root)''':''' | + |   '''func''' hugh('''int''' n, '''int''' k, '''Node''' root)''':''' | 
|      '''for''' <tex>v \in V</tex> |      '''for''' <tex>v \in V</tex> | ||
| − |          used[v]  | + |          used[v] = <b>false</b> | 
| − |          sum[v]  | + |          sum[v] = 1 | 
| − |      '''for'''  | + |      '''for''' i = 1 to k | 
| − |          last[ | + |          last[i] = -1 | 
| − |      dfs (root) | + |      dfs(root) | 
| ==Обоснование корректности== | ==Обоснование корректности== | ||
| Строка 57: | Строка 70: | ||
| }} | }} | ||
| − | Для того, чтобы учитывать вершины с одинаковым цветом, для каждой вершины требуется найти наименьшего общего предка этой вершины и вершин, предшествующих данной по времени выхода с таким же цветом и вычесть из значения этого предка 1. Так, при конечном подсчете значение наименьшего общего предка данной вершины и любой вершины, предшествующей данной с тем же цветом, уменьшится на 1, так как наименьший предок этой точки и любой предшествующей того же цвета находится на пути из наименьшего общего предка этой группы точек. А как раз это и требуется - для каждой пары точек одного цвета учесть данный факт в их наименьшем общем предке. И по лемме, чтобы взять наименьшего общего предка текущей вершины и всех предшествующих вершин с данным цветом, надо взять наименьшего общего предка данной вершины и предыдущей вершины с данным цветом, он будет наименьшим для всех. | + | Для того, чтобы учитывать вершины с одинаковым цветом, для каждой вершины требуется найти наименьшего общего предка этой вершины и вершин, предшествующих данной по времени выхода с таким же цветом и вычесть из значения этого предка <tex>1</tex>. Так, при конечном подсчете значение наименьшего общего предка данной вершины и любой вершины, предшествующей данной с тем же цветом, уменьшится на <tex>1</tex>, так как наименьший предок этой точки и любой предшествующей того же цвета находится на пути из наименьшего общего предка этой группы точек. А как раз это и требуется - для каждой пары точек одного цвета учесть данный факт в их наименьшем общем предке. И по лемме, чтобы взять наименьшего общего предка текущей вершины и всех предшествующих вершин с данным цветом, надо взять наименьшего общего предка данной вершины и предыдущей вершины с данным цветом, он будет наименьшим для всех. | 
| [[Файл:hugh.png|300px]] | [[Файл:hugh.png|300px]] | ||
| ==См. также== | ==См. также== | ||
| + | [[Алгоритм Тарьяна поиска LCA за O(1) в оффлайн]] | ||
| + | |||
| + | [[Метод двоичного подъема]] | ||
| + | |||
| + | [[Категория: Алгоритмы и структуры данных]] | ||
Версия 21:17, 16 января 2016
| Задача: | 
| Дано ориентированный дерево, вершины которого раскрашены в цвета. Найти , где число различных цветов в поддереве с корнем в вершине . Время работы: | 
Алгоритм решения
Будем в каждой вершине дерева хранить по числу, так, чтобы для каждого поддерева ответом была сумма всех значений в вершинах в данном поддереве. Для начала каждой вершине в качестве значения присвоим . Теперь, если бы все вершины имели различные цвета, надо было бы пройти снизу вверх по дереву и просуммировать для каждой вершины числа, записанные в её детях. Но некоторые вершины будут иметь одинаковые цвета, и это надо как-то учитывать. Для этого запустим обход в глубину. Также будем хранить для каждого цвета последнюю посещенную вершину данного цвета в массиве . Теперь, заходя в -ую вершину с цветом , смотрим: если вершина с таким цветом еще не встречалась, то просто присваиваем , иначе, если вершина с данным цветом уже встречалась, то находим наименьшего общего предка данной вершины и последней вершины с таким цветом и вычитаем из их предка , присваиваем . Теперь при выходе из вершины можно просуммировать числа в ее детях и получить ответ для данной вершины, так как для нее все дети уже подсчитаны. Таким образом, алгоритм запускает один обход в глубину, на каждой итерации которого ищет наименьшего общего предка. Если искать наименьшего общего предка за , к примеру алгоритмом Фарака-Колтона и Бендера, то сложность работы алгоритма будет .
Пример
Псевдокод
int col[MAX_COL], used[MAX_N], sum[MAX_N] func dfs(Node v): used[v] = true for if !used[u] dfs(u) sum[v] += sum[u] if last[col[v]] != -1 sum[lca(v, last[col[v]])]-- last[col[v]] = v func hugh(int n, int k, Node root): for used[v] = false sum[v] = 1 for i = 1 to k last[i] = -1 dfs(root)
Обоснование корректности
| Лемма: | 
| Наименьшим общим предком вершины и группы вершин, предшествующих по времени выхода, является наименьший общий предок данной вершины и последней, предшествующей ей из группы. | 
| Доказательство: | 
| Рассмотрим дерево как последовательность букв, когда при входе в вершину или выходе из нее записывается ее буква. Пусть рассматриваемая вершина , а последняя рассмотренная из той же группы , их наименьший общий предок . Рассмотрим два варианта расположения этих двух вершин.Теперь возьмем вершину , которая встречается до выхода из . Перебрав несложные пять случаев, можно легко убедиться, что наименьший общий предок и будет ниже, чем наименьший общий предок и . | 
Для того, чтобы учитывать вершины с одинаковым цветом, для каждой вершины требуется найти наименьшего общего предка этой вершины и вершин, предшествующих данной по времени выхода с таким же цветом и вычесть из значения этого предка . Так, при конечном подсчете значение наименьшего общего предка данной вершины и любой вершины, предшествующей данной с тем же цветом, уменьшится на , так как наименьший предок этой точки и любой предшествующей того же цвета находится на пути из наименьшего общего предка этой группы точек. А как раз это и требуется - для каждой пары точек одного цвета учесть данный факт в их наименьшем общем предке. И по лемме, чтобы взять наименьшего общего предка текущей вершины и всех предшествующих вершин с данным цветом, надо взять наименьшего общего предка данной вершины и предыдущей вершины с данным цветом, он будет наименьшим для всех.









