Сжатое суффиксное дерево
Версия от 05:55, 22 марта 2011; AndrewD (обсуждение | вклад)
Определение: |
Пусть дана строка | , . Суффиксное дерево для строки - ориентированное дерево с корнем, имеющее ровно листьев, занумерованных от до . Каждая внутренняя вершина, отличная от корня, имеет не меньше двух детей, а каждая дуга помечена непустой подстрокой строки . Никакие две дуги не могут иметь пометок, начинающихся с одного и того же символа.
Главная особенность суффиксного дерева заключается в том, что для каждого листа
конкатенация меток дуг на пути от корня к листу в точности составляет суффикс строки , который начинается в позиции , то есть .Существование сжатого суффиксного дерева
Определение суффиксного дерева не гарантирует, что такое дерево существует для любой строки
. Если один суффикс совпадает с префиксом другого суффикса, то построить суффиксное дерево, удовлетворяющее данному выше определению, невозможно, поскольку путь для первого суффикса не сможет закончиться в листе. Например, для строки суффикс является префиксом суффикса . Во избежание этого в конце строки добавляется символ, не входящий в исходный алфавит. Такой символ называется защитным. Как правило в качестве защитного символа используется .Связь с суффиксным бором
Пусть суффиксный бор строки . Тогда сжатое суффиксное дерево может быть получено из слиянием каждого пути из неветвящихся вершин в одну дугу.
-