Красно-черное дерево
Красно-чёрное дерево (англ. red-black tree) — двоичное дерево поиска, в котором баланс осуществляется на основе "цвета" узла дерева, который принимает только два значения: "красный" (англ. red) и "чёрный" (англ. black).
При этом все листья дерева являются фиктивными и не содержат данных, но относятся к дереву и являются чёрными.
Для экономии памяти фиктивные листья можно сделать одним общим фиктивным листом.
Содержание
Свойства
Красно-чёрным называется бинарное поисковое дерево, у которого каждому узлу сопоставлен дополнительный атрибут — цвет и для которого выполняются следующие свойства (англ. red-black properties):
- Каждый узел промаркирован красным или чёрным цветом
- Корень и конечные узлы (листья) дерева — чёрные
- У красного узла родительский узел — чёрный
- Все простые пути из любого узла x до листьев содержат одинаковое количество чёрных узлов
- Чёрный узел может иметь чёрного родителя
В книге Кормена "Алгоритмы: построение и анализ" дается немного иное определение красно-черного дерева, а именно: красно-чёрное дерево — это двоичное дерево поиска, вершины которого разделены на красные и черные. Таким образом, каждая вершина хранит один дополнительный бит — её цвет. При этом должны выполняться определенные требования, которые гарантируют, что глубины любых двух листьев отличаются не более, чем в два раза, поэтому дерево можно назвать сбалансированным (англ. balanced).
По Кормену двоичное дерево поиска является красно-чёрным, если обладает следующими свойствами:
- Каждая вершина — либо красная, либо черная
- Каждый лист — черный
- Если вершина красная, оба ее ребенка черные
- Все пути, идущие от корня к листьям, содержат одинаковое количество черных вершин
Из свойств красно-черного дерева понятно, почему "глубины любых двух листьев отличаются не более, чем в два раза", поэтому определения можно считать эквивалентными.
Определим ослабленное красно-чёрное дерево как красно-чёрное дерево, корень которого может быть как чёрным, так и красным. Останется ли оно после этого красно-черным? При добавлении вершины около корня могут возникнуть повороты, и корневая вершина перейдет в какое-то поддерево. Из-за этого может возникнуть ситуация, в которой подряд будут идти две красные вершины. Если мы продолжим вставлять элементы подобным образом, свойства дерева перестанут выполняться и оно перестанет быть сбалансированным. Таким образом, время выполнения некоторых операций ухудшится.
Высота красно-черного дерева
Определение: |
Будем называть чёрной высотой (англ. black-height) вершины | число чёрных вершин на пути из в лист, не учитывая саму вершину .
Лемма: |
В красно-черном дереве с черной высотой количество внутренних вершин не менее . |
Доказательство: |
Если рассмотреть лист (фиктивную вершину), то для нее лемма верна. Рассмотрим внутреннюю вершину | . Пусть . Тогда если ее потомок — черный, то высота , а если красный, то . Таким образом, по предположению индукции, в поддеревьях содержится не менее вершин, а во всём дереве, соответственно, не менее .
Теорема: |
Красно-чёрное дерево с ключами имеет высоту . |
Доказательство: |
Если обычная высота дерева равна , то черная высота дерева будет не меньше и, по лемме, количество внутренних вершин в дереве
Прологарифмировав неравенство, имеем:
|
Операции
Вставка элемента
Каждый элемент вставляется вместо листа, поэтому для выбора места вставки идём от корня до тех пор, пока указатель на следующего сына не станет
(то есть этот сын — лист). Вставляем вместо него новый элемент с -потомками и красным цветом. Теперь проверяем балансировку. Если отец нового элемента красный, то достаточно рассмотреть только два случая:1. "Дядя" этого узла тоже красный. Тогда просто перекрашиваем "отца" и "дядю" в чёрный цвет, а "деда" — в красный. Проверяем, не нарушает ли он теперь балансировку. Если в результате этих перекрашиваний мы дойдём до корня, то в нём в любом случае ставим чёрный цвет.
2. "Дядя" чёрный. Если выполнить только перекрашивание, то может нарушиться постоянство чёрной высоты дерева по всем ветвям. Поэтому выполняем поворот. Если добавляемый узел был правым потомком, то необходимо сначала выполнить левое вращение, которое сделает его левым потомком.
Удаление вершины
При удалении вершины могут возникнуть три случая в зависимости от количества её детей:
- Если у вершины нет детей, то изменяем указатель на неё у родителя на .
- Если у неё только один ребёнок, то делаем у родителя ссылку на него вместо этой вершины.
- Если же имеются оба ребёнка, то находим вершину со следующим значением ключа. У такой вершины нет левого ребёнка. Удаляем уже эту вершину описанным во втором пункте способом, скопировав её ключ в изначальную вершину.
Проверим балансировку дерева. Так как при удалении красной вершины свойства дерева не нарушаются, то восстановление балансировки потребуется только при удалении чёрной. Рассмотрим ребёнка удалённой вершины.
1. Если брат этого ребёнка красный, то делаем вращение вокруг ребра между отцом и братом, тогда брат становится родителем отца. Красим его в чёрный, а отца - в красный цвет.
2. Если брат текущей вершины был чёрным, то получаем три случая:
- Оба ребёнка у брата чёрные. Красим брата в красный цвет и рассматриваем далее отца вершины.
- Если у брата правый ребёнок чёрный, а левый красный, то перекрашиваем брата и его левого сына и делаем вращение.
- Если у брата правый ребёнок красный, то перекрашиваем брата в цвет отца, его ребёнка и отца - в чёрный, делаем вращение и выходим из алгоритма.
Продолжаем тот же алгоритм, пока текущая вершина чёрная и мы не дошли до корня дерева. Из рассмотренных случаев ясно, что при удалении выполняется не более трёх вращений.
Объединение красно-чёрных деревьев
Объединение двух красно-чёрных деревьев
и по элементу x выполняется, когда и . Найдём чёрные высоты деревьев. Предположим также, что . Тогда в дереве ищем среди чёрных вершин, имеющих чёрную высоту , вершину с наибольшим ключом. Пусть — поддерево с корнем . Объединяем это дерево с в одно с красным корнем . Теперь родителем вершины становится бывший отец вершины . Осталось восстановить свойства красно-черного дерева, чтобы у красной вершины не было красных детей. Делается аналогично алгоритму добавления вершины.Так как общее время выполнения каждой из операций порядка высоты дерева ,то все они выполняются за
.Рассмотрим пример объединения двух красно-чёрных деревьев и вершины
:Узнаём чёрную высоту левого и правого дерева. Чёрная высота левого и правого деревьев равна
и соответственно. Так как чёрная высота левого дерева больше, то ищем в левом дереве чёрную вершину, имеющую чёрную высоту правого дерева, с наибольшим ключом. Чёрная высота вершины левого дерева равна высоте правого дерева и ключ является наибольшим. Поэтому вершина становится левым сыном вершины , а правое дерево будет правым сыном. Вершина станет правым сыном вершины :Далее проверяем: не нарушили ли мы свойства красно-чёрного дерева. Так как присутствует нарушение(у красной вершины есть красный сын), то перекрасим вершины и сделаем поворот:
Преимущества красно-чёрных деревьев
При вставке выполняется не более
вращений.Алгоритм вставки и удаления может быть написан в один проход сверху вниз, вместо алгоритма, который использует рекурсивный проход вниз, родительские указатели или явный стек для обеспечения возможности пройти назад вверх, чтобы провести перебалансировку.
Процедуру балансировки практически всегда можно выполнять параллельно с процедурами поиска, так как алгоритм поиска не зависит от атрибута цвета узлов.
Сбалансированность этих деревьев хуже, чем у АВЛ, но работа по поддержанию сбалансированности в красно-чёрных деревьях обычно эффективнее. Для балансировки красно-чёрного дерева производится минимальная работа по сравнению с АВЛ-деревьями.
Использует всего 1 бит дополнительной памяти для хранения цвета вершины. Но на самом деле в современных вычислительных системах память выделяется кратно байтам, поэтому это не является преимуществом относительно, например, АВЛ-дерева, которое хранит 2 бита. Однако есть реализации красно-чёрного дерева, которые хранят значение цвета в бите. Пример — Boost Multiindex. В этой реализации уменьшается потребление памяти красно-чёрным деревом, так как бит цвета хранится не в отдельной переменной, а в одном из указателей узла дерева.
Красно-чёрные деревья являются наиболее активно используемыми на практике самобалансирующимися деревьями поиска. В частности, ассоциативные контейнеры библиотеки STL(map, set, multiset, multimap) основаны на красно-чёрных деревьях.