Алгоритм Хьюи
Задача: |
Дано ориентированное дерево, вершины которого раскрашены в цвета. Найти , где число различных цветов в поддереве с корнем в вершине . Время работы: |
Простое решение
Ответ на задачу можно получить достаточно просто с помощью битовых масок. Для начала в каждую вершину поместим битовую маску с цветом данной вершины. Запустим обход в глубину и на выходе из каждой вершины будем записывать в неё результат побитового масок её детей и её самой. Таким образом в каждой вершине будет храниться битовая маска с цветами, лежащими в данном поддереве. Общая сложность алгоритма будет , где количество цветов. Если количество цветов меньше размера машинного слова, то сложность составит .
Алгоритм решения
Будем в каждой вершине дерева хранить по числу, так, чтобы для каждого поддерева ответом была сумма всех значений в вершинах в данном поддереве. Для начала каждой вершине в качестве значения присвоим
. Теперь, если бы все вершины имели различные цвета, надо было бы пройти снизу вверх по дереву и просуммировать для каждой вершины числа, записанные в её детях. Но некоторые вершины будут иметь одинаковые цвета, и это надо как-то учитывать.Для этого запустим обход в глубину. Также будем хранить для каждого цвета последнюю посещенную вершину данного цвета в массиве наименьшего общего предка данной вершины и последней вершины с таким цветом и вычитаем из их предка , присваиваем . Теперь при выходе из вершины можно просуммировать числа в ее детях и получить ответ для данной вершины, так как для нее все дети уже подсчитаны.
. Теперь, заходя в -ую вершину с цветом , смотрим: если вершина с таким цветом еще не встречалась, то просто присваиваем , иначе, если вершина с данным цветом уже встречалась, то находимТаким образом, алгоритм запускает один обход в глубину, на каждой итерации которого ищет наименьшего общего предка. Если искать наименьшего общего предка за алгоритмом Фарака-Колтона и Бендера, то сложность работы алгоритма будет .
, к примеруПример
Псевдокод
int col[MAX_COL], used[MAX_N], sum[MAX_N] func dfs(Node v): used[v] = true forv.children if !used[u] dfs(u) sum[v] += sum[u] if last[col[v]] != -1 sum[lca(v, last[col[v]])]-- last[col[v]] = v func hugh(int n, int k, Node root): for used[v] = false sum[v] = 1 for i = 1 to k last[i] = -1 dfs(root)
Обоснование корректности
Лемма: |
Наименьшим общим предком вершины и группы вершин, предшествующих по времени выхода, является наименьший общий предок данной вершины и последней, предшествующей ей из группы. |
Доказательство: |
Рассмотрим дерево как последовательность букв, когда при входе в вершину или выходе из нее записывается ее буква. Пусть рассматриваемая вершина , а последняя рассмотренная из той же группы , их наименьший общий предок . Рассмотрим два варианта расположения этих двух вершин. Теперь возьмем вершину , которая встречается до выхода из . Перебрав несложные пять случаев, можно легко убедиться, что наименьший общий предок и будет ниже, чем наименьший общий предок и . |
Для того, чтобы учитывать вершины с одинаковым цветом, для каждой вершины требуется найти наименьшего общего предка этой вершины и вершин, предшествующих данной по времени выхода с таким же цветом и вычесть из значения этого предка
. Так, при конечном подсчете значение наименьшего общего предка данной вершины и любой вершины, предшествующей данной с тем же цветом, уменьшится на , так как наименьший предок этой точки и любой предшествующей того же цвета находится на пути из наименьшего общего предка этой группы точек. А как раз это и требуется для каждой пары точек одного цвета учесть данный факт в их наименьшем общем предке. И по лемме, чтобы взять наименьшего общего предка текущей вершины и всех предшествующих вершин с данным цветом, надо взять наименьшего общего предка данной вершины и предыдущей вершины с данным цветом, он будет наименьшим для всех.