Изменения

Перейти к: навигация, поиск

Алгоритм Фараха

4441 байт добавлено, 17:05, 13 мая 2014
шаг 4: построение LCP-дерева
В результате описанных действий получится дерево <tex>M_x</tex>,в котором будут присутствовать поддеревья, которые прошли процедуру сличния, и которые ее избежали (т.е были перенесены в дерево <tex>M_x</tex> без изменений).
== шаг 4: построение LCP == [[Файл:Tree101232merged.png|500px|thumb|right]]Разбираемся с двойными дугами (на этом примере из три). Для этого мы должны выяснить сколько начальных символов таких дуг совпадает. Совпадать может от одного до нескольких символов, или даже все. Проверять их все по очереди нельзя (это даст квадратичное время). Если дуги совпадают полностью, тогда ничего не делаем, удаляем одну из копий и всё. Если начало для двух дуг совпадает только частично, тогда нужно делать для них общее начало, а ветки которые на концах снова развести по разным деревъям (для этого можно во время снияния запомнить их начальный цвет или просто сохранить ссылки на исходные ветки).     Для примера как это сделать возмём строку 10010010101000: [[Файл:Treestep5_1.jpg|550px|thumb|left|]] Для того чтобы узнать общее начало двойной дуги, мы должны взять одну чётную и одну нечётную на дереве, для которых родителем является конец нашей двойной дуги. Например на рисунке выше двойная дуга (1), конец помечен зелёным -является общим родителем для вершин 3 и 6. Чтобы узнать на каком расстоянии будет расслаиваться двойная дуга, надо увеличить номера вершин на еденицу и найти их родителя, он будет находится на еденицу ближе к корню (и путь у вершин будет одинаковой строкой, не считая размера). Родителя вершин 4, 7 я пометил жёлтым, он находится на расстоянии 1 от корня, следовательно дуга (1) должна расслаиваться в двух символах от корня, т.е. обе дуги совпадают и их просто надо слить. Разберём дуги по порядку: * (1) расслоение находится на расстоянии два от корня, т.е. дуга не расслаивается.* (2) конец является родителем вершин 2, 7. Родитель 3, 8 после слияния дуги (1), находится на глубине 2 символа. Значит дуга (2) расслаивается на глубине 3 символа, т.е. так же не расслаивается. Дугу (2) нужно вычислять после обработки дуги (1), потому что конец дуги (1) после обработки может оказаться на разной высоте, в зависимости от того на каком символе она расслоилась.* (3) конец является родителем 2, 9. Родитель 3, 10 находится на расстоянии 3, а наше расслоение на на расстоянии 4, т.е. сливается первый символ двойной дуги. Дугу (3) надо вычислять после дуги (2). Потому что если на дуге (2) появится разветвление, то компоненты дуги (3) придётся растащить по разным веткам дерева ==и сравнивать их будет не нужно.* (4) конец является родителем 1, 4. Расслаивается на втором символе.* (5) конец является родителем 0, 3. Дугу (5) можно обрабатывать только после дуги (4), так как от неё будет зависеть глубина расслояния.  Дерево после обработки: [[Файл:Treestep5_2.jpg|650px|thumb|left|]] 
== шаг 5: построение суффиксного дерева по LCP и слитому ==
497
правок

Навигация