Алгоритмы на деревьях

Материал из Викиконспекты
Перейти к: навигация, поиск

Диаметр дерева

Определение:
Диаметр дерева (англ. diameter of a tree) — максимальная длина (в рёбрах) кратчайшего пути в дереве между любыми двумя вершинами.


Пусть дан граф [math]G = \langle V, E \rangle [/math]. Тогда диаметром [math]d[/math] называется [math]\max\limits_{u, v \in V} dist(v, u)[/math], где [math]dist[/math] — кратчайшее расстояние между вершинами.

Алгоритм

  • Возьмём любую вершину [math] v \in V [/math] и найдём расстояния до всех других вершин. [math]d[i] = dist(v, i)[/math]
  • Возьмём вершину [math] u \in V [/math] такую, что [math]d[u] \geqslant d[t][/math] для любого [math]t[/math]. Снова найдём расстояние от [math]u[/math] до всех остальных вершин. Самое большое расстояние — диаметр дерева.

Расстояние до остальных вершин будем искать алгоритмом [math]BFS[/math].

Реализация

//граф g представлен списком смежности 
int diameterTree(list<list<int>> g):        
    v = u = w = 0
    d = bfs(g, v)
    for i = 0, i < n, i++
         if d[i] > d[u]
              u = i
    d = bfs(g, u)
    for i = 0, i < n, i++
          if d[i] > d[w]
               w = i
    return d[w]

Обоснование корректности

Будем пользоваться свойством, что в любом дереве больше одного листа. Исключительный случай — дерево из одной вершины, но алгоритм сработает верно и в этом случае.

Теорема:
Искомое расстояние — расстояние между двумя листами.
Доказательство:
[math]\triangleright[/math]
Пусть искомое расстояние — расстояние между вершинами [math]a, b[/math], где [math]b[/math] не является листом. Так как [math]b[/math] не является листом, то её степень больше единицы, следовательно, из неё существует ребро в непосещённую вершину (дважды посетить вершину [math]b[/math] мы не можем).
[math]\triangleleft[/math]

После запуска алгоритма получим дерево [math]BFS[/math].

Теорема:
В дереве [math]BFS[/math] не существует ребер между вершинами из разных поддеревьев некоторого их общего предка.
Доказательство:
[math]\triangleright[/math]

Предположим, существует ребро [math]u, v[/math] между соседними поддеревьями:

Рассмотрим первую вершину, в которую приведет наш алгоритм, пусть это вершина [math]u[/math], тогда в ходе рассмотрения всех смежных вершин [math]u[/math] мы добавим в список вершину [math]v[/math], тем самым исключив возможность попадания их в разные поддеревья.
[math]\triangleleft[/math]


Мы свели задачу к нахождению вершины [math]w[/math], такой что сумма глубин поддеревьев максимальна.

Докажем, что одно из искомых поддеревьев содержит самый глубокий лист. Пусть нет, тогда, взяв расстояние от [math]w[/math] до глубочайшего листа, мы можем улучшить ответ.

Таким образом мы доказали, что нам нужно взять вершину [math]u[/math] с наибольшей глубиной после первого [math]BFS[/math], очевидно, что ей в пару надо сопоставить вершину [math]w[/math], такую что [math]dist(u, w)[/math] максимально. Вершину [math]w[/math] можно найти запуском [math]BFS[/math] из [math]u[/math].

Оценка времени работы

Все операции кроме [math]BFS[/math][math]O(1)[/math]. [math]BFS[/math] работает за линейное время, запускаем мы его два раза. Получаем [math]O(|V| + |E|)[/math].

Центр дерева

Определения

Определение:
Эксцентриситет вершины [math]e(v)[/math] (англ. eccentricity of a vertex) — [math]\max\limits_{u\in V} dist(v, u)[/math], где [math]V[/math] — множество вершин связного графа [math]G[/math].


Определение:
Радиус [math]r(G)[/math] (англ. radius) — наименьший из эксцентриситетов вершин графа [math]G[/math].


Определение:
Центральная вершина (англ. central vertex) — вершина графа [math]G[/math], такая что [math]e(v) = r(G)[/math]


Определение:
Центр графа [math]G[/math] (англ. center of a graph) — множество всех центральных вершин графа [math]G[/math].
Примеры деревьев с одной и двумя центральными вершинами
Графы, у которых показан эксцентриситет каждой вершины

Алгоритм

Наивный алгоритм

Найдём центр графа исходя из его определения.

  • Построим матрицу [math]A_{n \times n}[/math] ([math]n[/math] — мощность множества [math]V[/math]), где [math]a_{ij} = d_{ij}[/math], то есть матрицу кратчайших путей. Для её построения можно воспользоваться алгоритмом Флойда-Уоршелла или Дейкстры.
  • Подсчитаем максимум в каждой строчке матрицы [math]A[/math]. Таким образом, получим массив длины [math]n[/math].
  • Найдём наименьший элемент в этом массиве. Эта вершина и есть центр графа. В том случае, когда вершин несколько, все они являются центрами.

Асимптотика зависит от используемого способа подсчета кратчайших путей. При Флойде это будет [math]O(V^3)[/math], а при Дейкстре — максимум из асимптотики конкретной реализации Дейкстры и [math]O(V^2)[/math], за которую мы находим максимумы в матрице.

Алгоритм для дерева за O(n)

Теорема:
Каждое дерево имеет центр, состоящий из одной вершины или из двух смежных вершин.
Доказательство:
[math]\triangleright[/math]
Утверждение очевидно для деревьев с одной и двумя вершинами. Покажем, что у любого другого дерева [math]T[/math] те же центральные вершины, что и у дерева [math]T'[/math], полученного из [math]T[/math] удалением всех его висячих вершин. Расстояние от данной вершины дерева [math]u[/math] до любой другой вершины [math]v[/math] достигает наибольшего значения, когда [math]v[/math] – висячая вершина. Таким образом, эксцентриситет каждой вершины дерева [math]T'[/math] точно на единицу меньше эксцентриситета этой же вершины в дереве [math]T[/math], следовательно, центры этих деревьев совпадают. Продолжим процесс удаления и получим требуемое.
[math]\triangleleft[/math]

Собственно, алгоритм нахождения центра описан в доказательстве теоремы.

  • Пройдёмся по дереву обходом в глубину и пометим все висячие вершины числом [math]0[/math].
  • Обрежем помеченные вершины.
  • Образовавшиеся листья пометим числом [math]1[/math] и тоже обрежем.
  • Будем повторять, пока на текущей глубине не окажется не более двух листьев, и при этом в дереве будет тоже не более двух листьев.

Оставшиеся листья являются центром дерева.

Для того, чтобы алгоритм работал за [math]O(n)[/math], нужно обрабатывать листья по одному, поддерживая в очереди два последовательных по глубине слоя.

См. также

Источники информации