Алгоритм Хьюи — различия между версиями

Материал из Викиконспекты
Перейти к: навигация, поиск
м (rollbackEdits.php mass rollback)
 
(не показаны 4 промежуточные версии 3 участников)
Строка 5: Строка 5:
  
 
==Простое решение==
 
==Простое решение==
Ответ на задачу можно получить достаточно просто с помощью битовых масок. Для начала в каждую вершину поместим битовую маску с цветом данной вершины. Запустим [[Обход в глубину, цвета вершин|обход в глубину]] и на выходе из каждой вершины будем записывать в неё результат побитового <tex>OR</tex> масок её детей и её самой. Таким образом в каждой вершине будет храниться битовая маска с цветами, лежащими в данном поддереве. Общая сложность алгоритма будет <tex>O(V \cdot K)</tex>, где <tex>K</tex> - количество цветов. Если количество цветов меньше размера машинного слова, то сложность будет <tex>O(V)</tex>.
+
Ответ на задачу можно получить достаточно просто с помощью битовых масок. Для начала в каждую вершину поместим битовую маску с цветом данной вершины. Запустим [[Обход в глубину, цвета вершин|обход в глубину]] и на выходе из каждой вершины будем записывать в неё результат побитового <tex>OR</tex> масок её детей и её самой. Таким образом в каждой вершине будет храниться битовая маска с цветами, лежащими в данном поддереве. Общая сложность алгоритма будет <tex>O(V \cdot K)</tex>, где <tex>K\ -</tex> количество цветов. Если количество цветов меньше размера машинного слова, то сложность составит <tex>O(V)</tex>.
  
 
==Алгоритм решения==
 
==Алгоритм решения==
Строка 49: Строка 49:
 
   
 
   
 
  '''func''' dfs('''Node''' v)''':'''
 
  '''func''' dfs('''Node''' v)''':'''
     used[v] = <b>true</b>
+
     used[v] = ''true''
 
     '''for''' <tex>u \in</tex> v.children
 
     '''for''' <tex>u \in</tex> v.children
 
         '''if''' !used[u]
 
         '''if''' !used[u]
Строка 60: Строка 60:
 
  '''func''' hugh('''int''' n, '''int''' k, '''Node''' root)''':'''
 
  '''func''' hugh('''int''' n, '''int''' k, '''Node''' root)''':'''
 
     '''for''' <tex>v \in V</tex>
 
     '''for''' <tex>v \in V</tex>
         used[v] = <b>false</b>
+
         used[v] = ''false''
 
         sum[v] = 1
 
         sum[v] = 1
     '''for''' i = 1 to k
+
     '''for''' i = 1 '''to''' k
 
         last[i] = -1
 
         last[i] = -1
 
     dfs(root)
 
     dfs(root)
  
 
==Обоснование корректности==
 
==Обоснование корректности==
{{Лемма
+
Отсортируем вершины по времени входа. Рассмотрим вершину <tex>v</tex>, в поддереве которой <tex>k</tex> вершин одного цвета. Так как мы обходим вершины в порядке времени входа, эти <tex>k</tex> вершин мы обойдем последовательно. Их наименьший общий предок будет лежать в данном поддереве. Следовательно мы вычтем <tex>k-1</tex> раз единицу из вершины <tex>v</tex>. Для любых других двух вершин их наименьший общий предок не будет лежать в данном поддереве. Следовательно для каждого поддерева учтется по одной вершине каждого цвета, существующего в данном поддереве.
|statement = Наименьшим общим предком вершины и группы вершин, предшествующих по времени выхода, является наименьший общий предок данной вершины и последней, предшествующей ей из группы.
 
|proof = Рассмотрим дерево как последовательность букв, когда при входе в вершину или выходе из нее записывается ее буква. Пусть рассматриваемая вершина <tex>-\ u</tex>, а последняя рассмотренная из той же группы <tex> -\ v</tex>, их наименьший общий предок <tex>-\ w</tex>. Рассмотрим два варианта расположения этих двух вершин.
 
 
 
[[Файл:proof_1.png|200px]]
 
[[Файл:proof_2.png|200px]]
 
 
 
Теперь возьмем вершину <tex>z</tex>, которая встречается до выхода из <tex>v</tex>. Перебрав несложные пять случаев, можно легко убедиться, что наименьший общий предок <tex>u</tex> и <tex>v</tex> будет ниже, чем наименьший общий предок <tex>u</tex> и <tex>x</tex>.
 
}}
 
 
 
Для того, чтобы учитывать вершины с одинаковым цветом, для каждой вершины требуется найти наименьшего общего предка этой вершины и вершин, предшествующих данной по времени выхода с таким же цветом и вычесть из значения этого предка <tex>1</tex>. Так, при конечном подсчете значение наименьшего общего предка данной вершины и любой вершины, предшествующей данной с тем же цветом, уменьшится на <tex>1</tex>, так как наименьший предок этой точки и любой предшествующей того же цвета находится на пути из наименьшего общего предка этой группы точек. А как раз это и требуется <tex>-</tex> для каждой пары точек одного цвета учесть данный факт в их наименьшем общем предке. И по лемме, чтобы взять наименьшего общего предка текущей вершины и всех предшествующих вершин с данным цветом, надо взять наименьшего общего предка данной вершины и предыдущей вершины с данным цветом, он будет наименьшим для всех.
 
 
 
[[Файл:hugh.png|300px]]
 
  
 
==См. также==
 
==См. также==

Текущая версия на 19:35, 4 сентября 2022

Задача:
Дано ориентированное дерево, вершины которого раскрашены в цвета. Найти [math]dc:V\rightarrow \{1\ldots k\}[/math], где [math]dc(u) -[/math] число различных цветов в поддереве с корнем в вершине [math]u[/math]. Время работы: [math]O(V)[/math]


Простое решение

Ответ на задачу можно получить достаточно просто с помощью битовых масок. Для начала в каждую вершину поместим битовую маску с цветом данной вершины. Запустим обход в глубину и на выходе из каждой вершины будем записывать в неё результат побитового [math]OR[/math] масок её детей и её самой. Таким образом в каждой вершине будет храниться битовая маска с цветами, лежащими в данном поддереве. Общая сложность алгоритма будет [math]O(V \cdot K)[/math], где [math]K\ -[/math] количество цветов. Если количество цветов меньше размера машинного слова, то сложность составит [math]O(V)[/math].

Алгоритм решения

Будем в каждой вершине дерева хранить по числу, так, чтобы для каждого поддерева ответом была сумма всех значений в вершинах в данном поддереве. Для начала каждой вершине в качестве значения присвоим [math]1[/math]. Теперь, если бы все вершины имели различные цвета, надо было бы пройти снизу вверх по дереву и просуммировать для каждой вершины числа, записанные в её детях. Но некоторые вершины будут иметь одинаковые цвета, и это надо как-то учитывать.

Для этого запустим обход в глубину. Также будем хранить для каждого цвета последнюю посещенную вершину данного цвета в массиве [math]last[k][/math]. Теперь, заходя в [math]i[/math]-ую вершину с цветом [math]col[/math], смотрим: если вершина с таким цветом еще не встречалась, то просто присваиваем [math]last[col]=i[/math], иначе, если вершина с данным цветом уже встречалась, то находим наименьшего общего предка данной вершины и последней вершины с таким цветом и вычитаем из их предка [math]1[/math], присваиваем [math]last[col]=i[/math]. Теперь при выходе из вершины можно просуммировать числа в ее детях и получить ответ для данной вершины, так как для нее все дети уже подсчитаны.

Таким образом, алгоритм запускает один обход в глубину, на каждой итерации которого ищет наименьшего общего предка. Если искать наименьшего общего предка за [math]O(1)[/math], к примеру алгоритмом Фарака-Колтона и Бендера, то сложность работы алгоритма будет [math]O(V)[/math].

Пример

№ шага Изображение Описание
0 Algo 0.png Расставим у каждой вершины [math]1[/math].
1 Algo 1.png Выходим из [math]8[/math]-ой вершины. Так как желтых вершин еще не было, запоминаем её как последнюю желтую.
2 Algo 2.png [math]4[/math]-ая вершина. Последняя желтая [math]-\ 8[/math]-ая. Их LCA [math]\ -4[/math]-ая вершина. Вычитаем из значения [math]4[/math]-ой вершины [math]1[/math] и запоминаем текущую как последнюю желтую.
8 8.png Пропустим несколько тривиальных шагов. Выходим из [math]11[/math]-ой вершины. Последней посещенной зеленой была [math]5[/math]-ая (не [math]3[/math]-я). Вычитаем из их LCA ([math]1[/math]-ой вершины) [math]1[/math] и запоминаем [math]11[/math]-ую как последнюю зеленую.
9 9.png Выходим из [math]7[/math]-ой вершины. Последней синей была [math]2[/math]-ая. Вычтем из их LCA [math]1[/math] и запомним [math]7[/math]-ую как последнюю синюю.
суммирование Algo 12.png Пропустим еще два шага. В результате суммирования получаем в каждой вершине ответ на задачу для поддерева.

Псевдокод

int col[MAX_COL], used[MAX_N], sum[MAX_N]

func dfs(Node v):
   used[v] = true
   for [math]u \in[/math] v.children
       if !used[u]
           dfs(u)
       sum[v] += sum[u]
   if last[col[v]] != -1
        sum[lca(v, last[col[v]])]--
   last[col[v]] = v
       
func hugh(int n, int k, Node root):
   for [math]v \in V[/math]
       used[v] = false
       sum[v] = 1
   for i = 1 to k
       last[i] = -1
   dfs(root)

Обоснование корректности

Отсортируем вершины по времени входа. Рассмотрим вершину [math]v[/math], в поддереве которой [math]k[/math] вершин одного цвета. Так как мы обходим вершины в порядке времени входа, эти [math]k[/math] вершин мы обойдем последовательно. Их наименьший общий предок будет лежать в данном поддереве. Следовательно мы вычтем [math]k-1[/math] раз единицу из вершины [math]v[/math]. Для любых других двух вершин их наименьший общий предок не будет лежать в данном поддереве. Следовательно для каждого поддерева учтется по одной вершине каждого цвета, существующего в данном поддереве.

См. также