Алгоритмы на деревьях
Диаметр дерева - максимальная длина (в рёбрах) кратчайшего пути между любыми двумя вершинами. Алгоритм в этой статье находит диаметр в дереве.
Пусть дан граф
Тогда диаметром называется , где — кратчайшее расстояние между вершинамиАлгоритм
Возьмём любую вершину
и найдём расстояния до всех других вершин.
Возьмём вершину такую, что для любого .Снова найдём расстояние от до всех остальных вершин. Самое большое расстояние — диаметр дерева.
Расстояние до остальных вершин будем искать алгоритмом .
Реализация
int diameterTree(graph g) { v = u = w = 0; d = bfs(g, v); for (i = 0; i < n; i++) if (d[i] > d[u]) u = i; bfs(g, u); for (i = 0; i < n; i++) if (d[i] > d[w]) w = i; return d[w]; }
Обоснование корректности
Будем пользоваться свойством, что в любом дереве больше одного листа. Исключительный случай-дерево из одной вершины,но алгоритм сработает верно и в этом случае.
Теорема: |
Искомое расстояние - есть расстояние между двумя листами. |
Доказательство: |
Пусть искомое расстояние - есть расстояние между вершинами | где - не является листом. Т.к. b не является листом, то значит её степень 1 => из неё существует ребро в непосещенную вершину (дважды посетить вершину мы не можем). Лемма доказана.
После запуска алгоритма получим дерево .
Теорема: |
В дереве BFS не существует ребер между вершинами из разных поддеревьев некоторого их общего предка. |
Доказательство: |
Предположим существует ребро Рассмотрим первую вершину в которую приведет наш алгоритм, предположим это вершина между соседними поддеревьями: , тогда в ходе рассмотрения всех смежных вершин мы добавим в список вершину , тем самым исключив возможность попадания их в разные поддеревья. |
Мы свели задачу к нахождению вершины , такой, что сумма глубин поддеревьев максимальна.
Докажем, что одно из искомых поддеревьев содержит самый глубокий лист. Пусть нет, тогда взяв расстояние от
до глубочайшего листа мы можем улучшить ответ.Таким образом мы доказали, что нам нужно взять вершину
с наибольшей глубиной после первого , очевидно что ей в пару надо сопоставить вершину , что — максимально. Очевидно, что проблема решается запуском bfs из .
Оценка производительности
Все операции кроме
— . работает линейное время, запускаем мы его 2 раза.Получаем .