СНМ (списки с весовой эвристикой) — различия между версиями
(→Проблема наивной реализации) |
|||
Строка 7: | Строка 7: | ||
== Проблема наивной реализации == | == Проблема наивной реализации == | ||
[[Файл:ve.png|thumb|400px|Реализация без весовой эвристики]] | [[Файл:ve.png|thumb|400px|Реализация без весовой эвристики]] | ||
− | Рассмотрим реализацию системы непересекающихся множеств с помощью списков, для каждого элемента | + | Рассмотрим реализацию системы непересекающихся множеств с помощью списков, для каждого элемента которых будем хранить указатель на представителя и на следующий элемент. |
+ | |||
+ | При такой реализации операция init для создания n множеств из одного элемента займет <tex>O(n)</tex> времени. Для выполнения операции findSet достаточно перейти по ссылке на представителя за <tex>O(1)</tex>. Узким местом такой реализации является операция union. Хотя мы можем объединить два списка за <tex>O(1)</tex>, но обновить указатели на представителя для одного из списков мы можем лишь за время пропорциональное количеству элементов. | ||
+ | |||
+ | Нетрудно придумать последовательность из n - 1 операций union, требующую <tex>O(n^2)</tex> времени. Достаточно каждый раз сливать одно и тоже множество с одним новым элементом в том порядке, чтобы требовалось обновить указатели на представителя именно элементам "большого" множества. Поскольку i-ая операция union обновляет i указателей, общее количество указателей, обновленных всеми n - 1 операциями union равно <tex>\sum\limits_{i=1}^{n-1} i = O(n^2)</tex>. Отсюда следует, что амортизированное время выполнения операции union составляет <tex>O(n)</tex>. | ||
== Реализация с весовой эвристикой == | == Реализация с весовой эвристикой == |
Версия 23:04, 23 апреля 2012
Содержание
Определение
Определение: |
Весовая эвристика (weighted-union heuristic) — улучшение наивной реализации СНМ, при котором список включает поле длины списка, и добавление идет всегда меньшего списка к большему. |
Проблема наивной реализации
Рассмотрим реализацию системы непересекающихся множеств с помощью списков, для каждого элемента которых будем хранить указатель на представителя и на следующий элемент.
При такой реализации операция init для создания n множеств из одного элемента займет
времени. Для выполнения операции findSet достаточно перейти по ссылке на представителя за . Узким местом такой реализации является операция union. Хотя мы можем объединить два списка за , но обновить указатели на представителя для одного из списков мы можем лишь за время пропорциональное количеству элементов.Нетрудно придумать последовательность из n - 1 операций union, требующую
времени. Достаточно каждый раз сливать одно и тоже множество с одним новым элементом в том порядке, чтобы требовалось обновить указатели на представителя именно элементам "большого" множества. Поскольку i-ая операция union обновляет i указателей, общее количество указателей, обновленных всеми n - 1 операциями union равно . Отсюда следует, что амортизированное время выполнения операции union составляет .Реализация с весовой эвристикой
Минусом наивной реализации являлось то, что при слиянии двух множеств, например относительно большого и из одного элемента, мы пытались обновить указатели для большого числа элементов, хотя гораздо быстрее было бы поменять указатель лишь одному. Отсюда следуют очевидная оптимизация — давайте будем для каждого множества хранить его размер и изменять указатели на представителя всегда элементам из "меньшего" списка. Эта оптимизация называется весовой эвристикой и позволяет добиться асимптотики
для n операций union. Хотя одна операция union по-прежнему может потребовать действий, если оба множества имеют членов.Доказательство оценки времени выполнения
Утверждение: |
При использовании связанных списков для представления СНМ и применении весовой эвристики, последовательность из m операций makeSet, union, и findSet, n из которых составляют операции makeSet, требует для выполнения времени. |
Оценим время работы необходимое для обновления указателей на представителя в операциях union. Оценим количество обновлений отдельно для каждого элемента.
Оказывается, что для каждого элемента мы можем обновить указатель не более раз. Это связано с тем, что при каждом объединении множество в котором оказывается объект увеличивается не менее чем вдвое. Действительно, так как мы обновляем указатель на представителя элементу, то этот элемент находился в меньшем из множеств (согласно нашей эвристике), но тогда размер второго множества не меньше. Тогда после первого обновления элемент содержится в множестве в котором не менее двух элементов, после второго — четырех, и так далее. В силу того, что множество не может содержать более n элементов, количество обновлений не превосходит .Таким образом, общее время, необходимое для обновления указателей для n элементов, составляет .Необходимо также отметить, что слить два списка и обновить поле длины при выполнении union можно за Отсюда легко понять, что время необходимое для выполнения всей последовательности из m операций составит . . операций makeSet, findSet и часть работы операции union на обновление поля длины и слияния списков, каждая из которых выполняется за константное время и суммарное время обновления указателей на представителя операцией union для каждого элемента. |
Другие реализации
Источники
- Томас Х. Кормен, Чарльз И. Лейзерсон, Рональд Л. Ривест, Клиффорд Штайн Алгоритмы: построение и анализ — 2-е изд. — М.: «Вильямс», 2007. — с. 585—588. — ISBN 5-8489-0857-4