Изменения

Рандомизированное бинарное дерево поиска

446 байт добавлено, 18:59, 24 мая 2015

Нет описания правки

'''Рандомизированное бинарное дерево поиска ''' (англ. ''Randomized binary search tree, RBST''~~, RBST~~) {{---}} структура данных, реализующая бинарное дерево поиска.

==Основная идея и связанные определения==

<tex>P[size(L) = i] = \frac{1}n, i = 1..n</tex>.

}}

Из определения следует, что каждый ключ в RBST размера n может оказаться корнем с вероятностью <tex>\frac{1}{n}</ntex>.

Идея RBST состоит в том, что хранимое дерево постоянно является рандомизированным бинарным деревом поиска. Далее подробно будет описана реализация операций над RBST, которая позволит добиться этой цели. Заметим лишь, что хранение RBST в памяти ничем не отличается от хранения обычного дерева поиска: хранится указатель на корень; в каждой вершине хранятся указатели на её сыновей.

===Вставка===

Рассмотрим рекурсивный алгоритм вставки ключа <tex>x</tex> в RBST, состоящее из <tex>n</tex> вершин. С вероятностью <tex dpi = "150">\frac{1}{n+1}</tex> вставим ключ в корень дерева, используя процедуру ~~''insert_at_root''~~<tex>\mathrm{insert\_at\_root}</tex>. С вероятностью <tex dpi = "150">1 - \frac{1}{n+1} = \frac{n}{n+1}</tex> вставим его в правое поддерево, если он больше корня, или в левое поддерево, если меньше. Ниже приведён псевдокод процедуры вставки ''<tex>\mathrm{insert''}</tex>, процедуры ~~''insert_at_root''~~<tex>\mathrm{insert\_at\_root}</tex>, а также процедуры ''<tex>\mathrm{split(k)''}</tex>, разбивающей дерево на два поддерева, в одном из которых все ключи строго меньше <tex>k</tex>, а в другом больше, либо равны; приведена достаточно очевидная рекурсивная реализация. (через Node обозначен тип вершины дерева, дерево представляется как указатель на корень)

'''Node~~'''~~ '''insert~~'''~~ (T, x) '''int''' r = '''random'''(0..size(T)) '''if''' (r == n)

T = insert_at_root(T, x)

'''if''' (x < root.key)

T = insert(T.left, x)

'''else'''

'''return''' T

Заметим, что если дерево пусто, то ''<tex>\mathrm{insert'' }</tex> с вероятностью 1 делает <tex>x</tex> корнем.

~~// вставляет ключ x в дерево T~~ '''Node~~'''~~ '''insert_at_root~~'''~~ (T, x) // вставляем в дерево T ключ x L = RBST() // создать пустые L и R ~~L = RBST()~~

R = RBST()

split(T, x, L, R)

T = RBST() // создать пустое T ~~T = RBST()~~

T.key = x

T.left = L

'''return''' T

split(T, x, L, R) // разделяет дерево T по x // , результат: - деревья L и R ~~'''split''' (T, x, L, R)~~ '''if''' (size(T) == 0) ~~// создать пустые L и R~~

L = RBST()

R = RBST()

'''else~~''' '''~~if''' (x < T.key)

R = T

split (T.left, x, L, R.left)

{{Лемма

|statement= Пусть после операции ''<tex>\mathrm{split'' }</tex> от дерева <tex>T</tex> по ключу <tex>x</tex> были получены деревья <tex>T_{L}</tex> и <tex>T_{R}</tex>. Тогда если <tex>T</tex> было рандомизированным бинарным деревом поиска, содержащим множество ключей <tex>K</tex>, то деревья <tex>T_{L}</tex> и <tex>T_{R}</tex> {{---}} рандомизированные бинарные деревья поиска, содержащие соответственно множества ключей <tex>K_{L} = \{y \in K | y < x\}</tex> и <tex>K_{R} = \{y \in K | y > x\}</tex>.

|proof=

Применим индукцию по <tex>n</tex> {{---}} размеру дерева. Если <tex>n = 0</tex>, то лемма верна (получим два пустых дерева).

Пусть <tex>n > 0</tex>, и лемма верна при всех меньших размерах дерева.. Пусть также <tex>y = T.key, L = T.left, R = T.right</tex>. Если <tex>x > y</tex>, то <tex>y</tex> {{---}} корень <tex>T_{L}</tex>, <tex>L</tex> {{---}} левое поддерево <tex>T_{L}</tex>, а ''<tex>\mathrm{split'' }</tex> рекурсивно вызовется от <tex>R</tex>, разделив его на <tex>R'</tex> {{---}} правое поддерево <tex>T_{L}</tex> {{---}}, и <tex>T_{R}</tex>, которые по предположению индукции будут рандомизированными бинарными деревьями поиска. Но <tex>L</tex> также является RBST, т.к. является поддеревом <tex>T</tex>.

Итак для того, чтобы доказать, что <tex>T_{L}</tex> {{---}} рандомизированное бинарное дерево поиска, осталось показать, что любая его вершина <tex>z</tex> с вероятностью <tex dpi = "150">\frac{1}{m}</tex> окажется в корне, где <tex>m</tex> {{---}} размер <tex>T_{L}</tex>. Действительно:

{{Теорема

|statement= Если <tex>T</tex> {{---}} рандомизированное бинарное дерево поиска, содержащее множество ключей <tex>K</tex>, <tex>x \notin K</tex>, тогда процедура ''<tex>\mathrm{insert(x, T)'' }</tex> вернёт рандомизированное бинарное дерево поиска <tex>T</tex>, содержащее множество ключей <tex>K \cap x</tex>.

|proof=

Применим индукцию по <tex>n</tex> {{---}} размеру дерева. Если <tex>n = 0</tex>, то теорема верна: после операции ''<tex>\mathrm{insert(x, T)'' }</tex> получим дерево с корнем <tex>x</tex> и двумя пустыми поддеревьями.

Пусть <tex>n > 0</tex>, и теорема верна при всех меньших размерах дерева. Возможны два случая: <tex>x</tex> вставляется в корень или рекурсивно в одно из поддеревьев.

===Удаление===

Алгоритм удаления использует операцию ''<tex>\mathrm{merge'' }</tex> {{---}} слияние двух деревьев, удовлетворяющих условию: все ключи в одном из деревьев меньше ключей во втором. Для того, чтобы удалить некоторый ключ <tex>x</tex> из RBST сначала найдём вершину с этим ключом в дереве, используя стандартный алгоритм поиска. Если вершина не найдена, то выходим из алгоритма; в противном случае сливаем правое и левое поддеревья <tex>x</tex> (заметим, что ключи в левом поддереве меньше ключей в правом), удаляем <tex>x</tex>, а корень образовавшегося дерева делаем новым сыном родителя <tex>x</tex>. Псевдокод процедур удаления и слияния приведён ниже.

~~// удаляет ключ x из дерева T~~ '''Node~~'''~~ '''remove~~'''~~(T, x) // удаляет ключ x из дерева T '''if''' (size(T) == 0) ~~// выйти, вернув пустое дерево~~

T = RBST()

'''return''' T // вернуть пустое поддерево '''if''' (x < T.key)

T.left = remove(T.left, x)

'''else~~''' '''~~if''' (x > T.key)

T.right = remove(T.right, x)

'''else'''

~~// создать пустое дерево Q~~

Q = RBST()

Q = merge(T.left, T.right)

'''return''' T

~~// сливает деревья L и R~~ ~~// результат: дерево T~~ '''Node~~'''~~ '''merge~~'''~~(L, R) // сливает деревья L и R, результат - дерево T

'''int''' m = L.size

'''int''' n = R.size

'''int''' total = m + n

'''if''' (total == 0) ~~// вернуть пустое T~~

T = RBST()

'''return''' T // вернуть пустое поддерево '''int''' r = random(1..total) '''if''' (r < m) ~~// с вероятностью m / (m + n)~~ L.right = merge(L.right, R) // с вероятностью m / (m + n)

'''return''' L

'''if''' (r < m) ~~// с вероятностью m / (m + n)~~ R.left = merge(L, R.left) // с вероятностью m / (m + n)

'''return''' R

{{Лемма

|statement= Пусть <tex>L</tex> и <tex>R</tex> {{---}} рандомизированные бинарные деревья поиска, содержащие соответственно множества ключей <tex>K_{L}</tex> и <tex>K_{R}</tex>, причём <tex>K_{L} < K_{R}</tex> (то есть каждый элемент <tex>K_{L}</tex> меньше каждого элемента <tex>K_{R}</tex>). Тогда операция ''<tex>\mathrm{merge(L, R)'' }</tex> вернёт рандомизированное бинарное дерево поиска, содержащее множество ключей <tex>K</tex> = <tex>K_{L} \cap K_{R}</tex>.

|proof=

Пусть <tex>m</tex> и <tex>n</tex> {{---}} размеры <tex>L</tex> и <tex>R</tex> соответственно. Применим индукцию по <tex>m</tex> и <tex>n</tex>. Если <tex>m = 0</tex> или <tex>n = 0</tex>, то лемма верна.

{{Теорема

|statement= Если <tex>T</tex> {{---}} рандомизированное бинарное дерево поиска, содержащее множество ключей <tex>K</tex>, тогда процедура ''<tex>\mathrm{remove(x, T)'' }</tex> вернёт рандомизированное бинарное дерево поиска <tex>T'</tex>, содержащее множество ключей <tex>K \backslash \{x\}</tex>

|proof=

Если удаляемый элемент отсутствует в дереве, то теорема верна.

событие <tex>A</tex> {{---}} <tex>y</tex> является коренем <tex>T'</tex>;

событие <tex>B</tex> {{---}} <tex>x</tex> был корнем <tex>T</tex> (до операции ''<tex>\mathrm{remove''}</tex>);

событие <tex>C</tex> {{---}} <tex>y</tex> стал корнем <tex>T'</tex> после операции ''<tex>\mathrm{merge'' }</tex> (но до этого им не являлся);

событие <tex>D</tex> {{---}} <tex>y</tex> был корнем <tex>T</tex> (до операции ''<tex>\mathrm{remove''}</tex>);

Тогда:

<tex>P[A] = P[A|B] \~~times~~ cdot P[B] + P[A|\neg B] \~~times~~ cdot P[\neg B] = P[C] \~~times~~ cdot 1/n + P[D|\neg B] \~~times~~ cdot (n - 1)/n = </tex><tex dpi = "150">\frac{1}{n - 1} \~~times~~ cdot \frac{1}{n} + \frac{1}{n - 1} \~~times~~ cdot \frac{n - 1}{n} = \frac{1}{n - 1}</tex>.

}}

==Ссылки==

*[http://en.wikipedia.org/wiki/Treap ~~Википедия~~ Wikipedia {{---}} ~~Дерамида и RBST~~Treap]*[http://en.wikipedia.org/wiki/Random_binary_tree ~~Википедия~~ Wikipedia {{---}} ~~случайное бинарное дерево~~Random binary tree]

== Литература ==

Анонимный участник

188.227.78.59

Изменения

Рандомизированное бинарное дерево поиска

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты