Участник:Kabanov

Материал из Викиконспекты
Перейти к: навигация, поиск

Также как и алгоритм Eppstein, K* выполняет поиск пути на графе [math]G[/math] и использует граф путей [math]P(G)[/math]. Граф путей ищется с помощью алгоритма Дейкстры для того, чтобы пути [math]s-t[/math] в виде последовательности запасных путей. Общий принцип работы алгоритма K* следующий: 1) K* применяет A* на графе [math]G[/math] вместо обратного алгоритма Дейкстры, который использует алгоритм Eppstein. 2) Мы запускаем A* на [math]G[/math] и Дейкстру на [math]P(G)[/math] поочередно порядке, который позволяет Дейкстре доставить пути решение до заверешения поиска на [math]G[/math] алгоритма A*.

Поиск A* на G.

K* применяет A* к входному графу [math]G[/math] для того, чтобы определить дерево поиска [math]T[/math]. В отличие от алгоритма Eppstein в K* A* применяется к графу [math]G[/math] в прямом порядке из-за чего коренем дерева [math]T [/math] является вершина [math]s[/math]. Это необходимо для того, чтобы была возможность работать c неявным описанием графа [math]G[/math] через функцию successor. На протяжении статьи будем считать граф [math]G[/math] конечным, если не будет сказано иначе. Заметим, что А* корректен на конечных графах. Будем следовать литературному соглашению, предполагая, что стоимость бесконечного пути неограниченна.

Стоимость объезда

Для ребра [math](u, v)[/math] стоимость объезда [math]\delta(u, v)[/math] является стоимостью ущерба из-за взятия ребра объезда [math](u,v)[/math] в сравнении с кратчайшим путем [math]s-t[/math] через [math]v[/math]. Ни длина кратчайшего пути s-t через v, ни длина пути s-t, включающего запапасные ребра [math](u, v)[/math] не известны, когда A* обнаруживает [math](u, v)[/math]. Обе длины могут быть оценены с помощью функции оценки [math]f[/math], которая использует эвристическую функцию [math]h[/math]. Путь [math]f(v)[/math] будет [math]f[/math]-значением с соответствии с деревом поиска [math]T[/math] и [math]f_u(v)[/math] будет [math]f[/math]-значанием в соответствии с родителем u, т.е. [math]f_u(v) = g(u) + c(u, v) + h(v)[/math]. [math]\delta(u, v)[/math] может быть определена так:

[math]\delta(u, v) = f_u(v) - f(v) = g(u) + c(u, v) + h(v) - g(v) - h(v) = g(u) + c(u, v) - g(v)[/math]

Заметим, что [math]\delta(u, v)[/math] дает точную объездную метрику, поскольку функция оценки [math]h[/math]-значения не появляется в определении функции [math]\delta(u, v)[/math].

Структура графе путей

Структура графа путей [math]P(G)[/math] довольно сложная. В принципе, [math]P(G)[/math] будет ориентированным графом, вершины которого соответствуют ребрам в исходном графе G. Он будет организован как коллекция взаимосвязанных куч (англ. heap). 2 бинарные минимальные кучи присвоены к каждой вершине v в графе G, которые называются входящей кучей [math]H_{in}(v)[/math] и деревянной кучей [math]H_{T}(v)[/math]. Эти кучи являются базисом [math]P(G)[/math]. Как мы покажем далее, испльзование этих куч также играет главную роль в поддержании асимптотической сложности K*, также как в EA и LVEA.

Входящая куча [math]H_{in}(v)[/math] содержит узлы для каждого запасного ребра к вершине v, которые до сих пор были обнаружены A*. Узлы [math]H_{in}(v)[/math] будут упорядочены в соответствии с [math]\delta[/math]-значением соответствующих переходов. Узел владеющий ребром с минимальной стоимостью ущерба будет расположен на вершине кучи. Мы ограничим структуру кучи [math]H_{in}(v)[/math] таким образом, что её корень в отличие от остальных узлов, имеет не более 1 ребенка. Мы обозначим его [math]root_{in}(v)[/math].

Деревянная куча [math]H_{T}(v)[/math] для произвольной вершины [math]v[/math] строится следующим образом. Если [math]v[/math] - стартовая вершина, т.е. [math]v = s[/math], то [math]H_{T}(v)[/math] будет изначально пустой кучей. Затем узел в неё будет добавлен [math]root_{in}(s)[/math], если [math]H_{in}(s)[/math] не пустая. Если [math]v[/math] не стартовая вершина, то пусть вершина [math]u[/math] будет родителем вершины [math]v[/math] в дереве поиска [math]T[/math]. Мы можем представить, что [math]H_{T}(v)[/math] конструируется как копия [math]H_{T}(u)[/math], в которую добавлен [math]root_{in}(v)[/math]. Если [math]H_{in}(v)[/math] пустая, то [math]H_{T}(v)[/math] идентична [math]H_{T}(u)[/math]. Однако, для экономии памяти мы создаем только дешевую копию [math]H_{T}(u)[/math]. Это осуществляется через создание копий только узлов кучи, которые лежат на обновленном пути [math]H_{T}(u)[/math]. Оставшаяся часть [math]H_{T}(u)[/math] не копируется. Другими словами, [math]root_{in}(v)[/math] вставляется в [math]H_{T}(u)[/math] неразрушающим путем так, что структура [math]H_{T}(u)[/math] сохраняется. В куче [math]H_{T}(v)[/math] 1 или 2 ребенка могут быть присоединены к [math]root_{in}(v)[/math]. К тому же, root_{in}(v) хранит только 1 собственного ребенка из [math]H_{in}(v)[/math]. Мы обозначим корень [math]H_{T}(v)[/math] как [math]R(v)[/math].

Обратимся к ребрам, которые берут начало из входящих или деревянных куч, как к кучным ребрам. Сформулируем следующую лемму. Лемма 1. Все узлы, которые достижимы из [math]R(v)[/math] через кучные ребра для каждой вершины [math]v[/math], формируют тернарную кучу, упорядоченную в соответствии с [math]\delta[/math]-значением. Мы назовем такую кучу графовой кучей вершины [math]v[/math] и обозначим его как [math]H_{G}(v)[/math].

...

Финальная структура [math]P(G)[/math] получется из входящих и деревянных куч следующим образом. К каждому узлу [math]n[/math] из [math]P(G)[/math], несущему ребро [math](u,v)[/math], мы присоединим указатель, ссылающийся на [math]R(u)[/math], который является корневым узлом [math]H_{T}(u)[/math]. Мы назовем такие указатели кросс-ребрами, в то время как указатели, возникающие из куч названы кучными ребрами, как упоминалось раньше. Более того, мы добавим специальный узел [math]R[/math] в [math]P(G)[/math] с одним выходящим кросс-ребром к [math]R(t)[/math].

Более того, мы определим весовую функцию [math]\Delta[/math] на ребрах из [math]P(G)[/math]. Пусть [math](n,n')[/math] обозначает ребро в [math]P(G)[/math], и пусть [math]e[/math] и [math]e'[/math] обозначают ребра из [math]G[/math] соответствующие узлам [math]n[/math] и [math]n'[/math]. Тогда определим [math]\Delta(n,n')[/math] следующим образом:

\Delta(n,n')=\delta(e') - \delta(e) если (n,n') кучное ребро \Delta(n,n')=\delta(e') если (n,n') кросс-ребро.

Лемма 1 подразумевает, что куча упорядоченная в соответствии с \delta-значанием поддерживается по любому кучному ребру из [math]P(G)[/math]. Эта упорядочивание кучи подразумевает, что \Delta(n,n') неотрицательна для любого кучного ребра (n,n'). Следовательно, \Delta также неотрицательна, т.е. \Delta(n,n') >= 0 для любого ребра (n,n') в [math]P(G)[/math]. Стоимость пути \sigma, т.е. C_{P(G)}(\sigma) равна \sum_{e \in \sigma}\Delta(e).

...

Лемма 2. Пусть [math]n[/math] будет узлов графовой кучи [math]H_{G}(w)[/math] для какой-нибудь вершины [math]w[/math]. Пусть [math](u,v)[/math] будет ребром связанным с [math]n[/math]. Тогда существует путь в дереве поиска [math]T[/math] из [math]v[/math] в [math]w[/math].

...

Алгоритмическая структура K*

Алгоритмический принцип K* следующий. Будем запускать алгоритмы Дейкстры и A* на G с чередованием. Сначала, мы запустим A* на G пока вершина t не будет выбрана из очереди для рассмотрения. Затем, вы запустим алгоритмы Дейкстры на доступной части [math]P(G)[/math]. Каждый узел рассмотрел Дейкстрой представляет путь решения. Если точнее, то путь [math]\sigma[/math] в [math]P(G)[/math], по которому Дейкстра достигла этого узла является решением. Путь s-t может быть построен из \sigma за линейное время путем вычисления последовательности запасных ребер seq(\sigma) и затем s-t пути из неё. Если Дейкстра находит k кратчайших путей, то K* завершается успешно. Иначе, A* возобновляется для исследования большей части G. Это приводит к росту [math]P(G)[/math], на котором алгоритм Дейкстры затем будет возобновлен. Мы будем повторять этот процесс до тех пор, пока алгоритм Дейкстры не найдет k кратчайших путей.

Алгоритм 1 содержит псевдокод K*. Код с 8 по 25 строчку образует главный цикл K*. Цикл завершается, когда очереди обоих алгоритмов А* и Дейкстры пусты. До 8 строчки выполняет некоторые подготовительные вещи. После инициализации, А* запускает на 5 строчке пока вершина t не будет выбрана им для рассмотрения, в этом случае кратчайший путь s-t будет найден. Если t не достигнута, то алгоритм завершается без решения. Отметим, что он не завершится на бесконечных графах. Иначе, алгоритм добавляет специальную вершину R, которая назначена корнем [math]P(G)[/math], в поисковую очередь алгоритма Дейкстры. Затем, K* входит в главный цикл. K* поддерживает механизм планирования для контролирования, когда A* или Дейкстра будет возобновлены. Если очередь из A* не пуста, что означает, что А* ещё не завершил исследования всего графа G, то Дейкстра возобновляется тогда и только тогда, когда g(t) + d <= f(u). Значение d является максимальным d-значением среди всех successor-ов головы поисковой очереди n алгоритма Дейкстры. Вершина u является головой поисковой очереди A*. Напомним, что d - функция расстояния, используемая в алгоритме Дейкстры. Если очередь поиска Дейкстры пуста или g(t) + d > f(u), то А* возобновляется для того, чтобы исследовать более большую часть графа G (строка 14). То, как долго мы ему позволим работать, является компромиссом. Если мы запустим его только на маленьком количестве шагов, то мы дадим Дейкстре шанс найти необходимое количество путей скорее, чем они будут доступны в [math]P(G)[/math]. С другой стороны, мы вызываем накладные расходы путем переключения A* и Дейкстры и поэтому должны ограничить количество переключений. Эти накладные расходы вызваны тем фактом, что после возобновления A* (строка 14), структура графа [math]P(G)[/math] может измениться. Следовательно нам необходимо обновить [math]P(G)[/math] (строка 15), как мы будет широко обсуждать в разделе 4.5. Это требует последующую проверку статуса Дейкстры. Мы должны быть уверены, что Дейкстра поддерживает согласованное состояние после изменений в [math]P(G)[/math]. K* предусматривает условие, которые управляет решением, когда остановить A*, которое мы назовем условие расширения. Для того, чтобы поддерживать аналогичную асимптотическую сложность как у EA и LVEA, мы должны определить условие расширения так, чтобы A* выполнялся пока количество рассмотренных вершин и количество внутренних ребер удваивается или G полностью исследован. Мы обсудим эту проблему несколько подробнее позже. В качестве полезного свойства, K* позволяет другое определения этого условия, которое может быть более эффективным на практике. В наших экспериментах в разделе 6, мы определили условие расширения так, что количество рассмотренных вершин или количество рассмотренных ребер ребер возрастает на 20% при каждом запуске A*. Этот механизм планирования включен до тех пор, пока A* не закончит исследовать весь граф G. Как только A* исследует весь граф G (строка 9), механизм планирования отключается и в дальнейшем работает только алгоритм Дейкстры.

Строки 18-22 представляют обычный шаг рассмотрения узла алгоритмом Дейкстры. Отметим, что когда successor-узел n' сгенерирован, K* не проверяет был ли n' уже посещен до этого. Другими словами, каждый раз, когда узел генерируется, он рассматривает как новый. Эта стратегия обоснована на наблюдении, что путь s-t может содержать одно и то же ребро несколько раз. Строка 24 добавляет следующий путь s-t в результирующее множество R. Это делается путем конструирования последовательности запасных ребер seq(\sigma) из пути \sigma, через которые Дейкстра достигла узла n, который был только что рассмотрен. Алгоритм завершается, когда в результирующее множество добавлено k последовательностей запасных ребер (строка 25).

Взаимосвязь алгоритмов Дейкстры и A*

Тот факт, что оба алгоритма A* и Дейкстры делят между собой граф путей [math]P(G)[/math], вызывает обеспокоенность в отношении правильности работы Дейкстры на [math]P(G)[/math]. Возобновление A* приводит к изменениям в структуре [math]P(G)[/math]. Таким образом, после возобновления A*, мы обновляем [math]P(G)[/math] и проверяет статус поиска Дейкстры (строка 15). В основном, A* может добавить новые узлы, менять \delta-значения существующих узлов или даже удалять узлы. A* может также существенно изменять дерево поиска T, которое будет в худшем случае разрушать структуру все деревянных куч H_{T}. Эти изменения могут приводить к глобальной реструктуризации или даже перестроению [math]P(G)[/math] с нуля. В худшем случае это может сделать предыдущие поиски Дейкстры на [math]P(G)[/math] бесполезными таким образом, что нам придется перезапускать алгоритм Дейкстры с нуля.

Если использованная эвристическая оценка допустимая, то наше положение лучше. Нам по-прежнему может понадобится перестроение [math]P(G)[/math], но мы покажем, что это перестроение не мешает корректности поиска Дейкстры на [math]P(G)[/math]. Другими словами, мы не теряем результаты, до сих пор полученные поиском Дейкстры. В случае монотонной эвристической оценки мы даже не нуждаемся в перестроении [math]P(G)[/math]. Если h монотонная, то дерево поиска A* является деревом кратчайшего пути для всех раскрытых вершин. Следовательно, g-значения раскрытых вершин не изменится. Это означает, что \delta-значения для внутренних ребер никогда не изменятся. Ребра дерева раскрытых вершин не изменятся также. Следовательно, обновление \delta-значений, heaping-up, heaping-down (операции в кучах) или удаление узлов не влекут за собой каких-либо изменений в [math]P(G)[/math]. Только добавление новых узлов приводит к изменениям в [math]P(G)[/math]. Следовательно, перестроение или глобальная реструктуризация не требуется в данном случае.

В оставшейся части этого раздела, мы сначала покажем, что корректность поиска Дейкстры на [math]P(G)[/math] поддерживается в случае допустимой эвристической оценки. После этого мы покажем, что изменения в [math]P(G)[/math] могут помешать завершенности поиска Дейкстры независимо от того, является ли эвристика допустимой или даже монотонной. Следовательно, мы предложим механизм для её поддержания.

Мы фокусируемся дальше на корректности поиска Дейкстры на [math]P(G)[/math] в случае допустимой эвристической оценки. Сначала, мы заявляем, что если h допустимая, то узлы исследованной части [math]P(G)[/math] не поменяют свои \delta-значения.

Лемма 6. Пусть n будет произвольным узлов в [math]P(G)[/math] и пусть (u,v) будет ребром, связанным с n. Если h допустимая функция, то значение \delta(u,v) никогда не изменится после того, как n будет рассмотрен алгоритмом Дейкстры.

...

Из леммы 6 мы может вывести следующее следствие.

Следствие 2. Пусть n будет произвольным узлов в [math]P(G)[/math]. Если h допустимая функция, то n никогда не будет удален из [math]P(G)[/math] после того, как n был рассмотрен алгоритмом Дейкстры.

...

Более того, мы докажем, что структура исследованной части [math]P(G)[/math] не изменится.

Лемма 7. Пусть n будет произвольным узлов в [math]P(G)[/math]. Если h допустимая функция, то n никогда не изменит свою позицию после того, как он был рассмотрен алгоритмом Дейкстры.

...

Леммы 6 и 7 обеспечивают, что изменения в [math]P(G)[/math], которые индуцируются A*, не влияют на часть [math]P(G)[/math], которую алгоритм Дейкстры уже исследовал. Это гарантирует корректность поиска Дейкстры на [math]P(G)[/math], если используемая эвристика допустимая. Таким образом, каждый путь, который предоставляет алгоритм Дейкстры корректен и его длина действительна. Однако, это не обеспечивает завершенность поиска Дейкстры на [math]P(G)[/math].

Возможно, что узел n' присоединяется к другом узлу n как ребенок, после раскрытия узла n. В этом случае братья n' будут рассотрены до того, как n' станет ребенком n. Поэтому мы должны рассмотреть то, что было упущено во время поиска в связи с отсутствием n'. Мы добиваемся этого путем применения строк 20-22 к n' для каждого раскрытого направленного predecessor-а узла n'. Если n' ещё не выполняет условие планирования, A* будет неоднократно возобновляться пока механизм планирования не допустит алгоритму Дейкстры положить n' в поисковую очередь. Заметим, что таким образом не требуется каких-либо дополнительных усилий во время типичного поиска Дейкстры.

Мы может быть уверены, что нерассмотренные узлы не будут принудительно опущены после применения операции heaping-up к n'. Иначе, мы могли бы иметь узел n, который являлся бы ребенком n и впоследствии был бы заменен узлом n'. Заметим, что n должен быть рассмотрен, поскольку n' был раскрыт. Однако, это противоречение к лемме 7, которая гарантирует, что этого не произойдет.

Более того, следующее следствие гарантирует, что наилучшее d(n') не лучше, чем d-значение любой рассмотренной вершины, в частности, раскрытой вершины. Это означает, что мы не упустим возможность раскрыть n'.

Следствие 3. Пусть n будет узлом в [math]P(G)[/math], который был раскрыт Дейкстрой. Кроме того, пусть m будет узлом, который заново добавляется в [math]P(G)[/math] или его позиция изменена, после того как n был раскрыт. Если h допустимая, тогда выполяется следующее: C_{P(G)}(R,m) >= d(n)

...

Пример

Мы проиллюстрируем работу алгоритма K* следующим примером. Мы будем рассматривать ориентированный взвешанный граф G на рисунке 7. Стартовой вершиной будет называться s_0 и конечной вершиной - s_6. Нас интересен поиск 9 лучших путей из s_0 в s_6. Для достижения этой цели мы применим алгоритм K* к G. Предположим, что эвристическая оценка существует. Значения эвристики даны в пометках c h(s_0) по h(s_6) на рисунке 7. Легко заметить, что эвристическая функция допустима.

Первый раз A* делает итерации на графе G до тех пор, пока не будет найдена вершина s_6. Часть графа G, которая уже была рассмотрена иллиюстрируется на рисунке 8. Ребра, изображенные сплошными линиями, обозначают ребра дерева, в то время, как все остальные - запасные ребра. Они будет храниться в кучах H_{in}, показанных на рисунке 9. Номера, присвоенные узлах кучи, соответствуют \delta-значениям. На этом этапе поиска A* приостановлен и [math]P(G)[/math] построен. Первоначально, только назначенный корень R явно доступен в [math]P(G)[/math]. Инициализируется алгоритм Дейкстры. Это означает, что узел R добавляется в поискую очередь Дейкстры. Планировщику требуется доступ к successors К для того, чтобы решить следует ли возобновлять Дейкстру или A*. На данном этапе должна быть построена деревянная куча H_{T}(s_6). Куча H_{T}(s_4) требуется для построения H_{T}(s_6). Следовательно, строются деревянные кучи H_{T}(s_6), H_{T}(s_4), H_{T}(s_2) и H_{T}(s_0). Результат показан на рисунке 10, где сплошные линии представляют кучные ребра и пунктирные линии показывают кросс-ребра. Во избежание путаницы на рисунке некоторые из ребер не полностью изображены. Мы указываем каждое из них, используя короткую стрелку с конретной целью.

После построения, как показано 10, планировщик проверяет только ребенка (s_4, s_2) узла R на предмет того, что g(s_6)+d(s_4,s_2) <= f(s_1). Отметим, что s_1 является головой поисковой очереди A*. Значение d(s_4,s_2) равно 2, т.е. g(s_6)+d(s_4,s_2) = 7 + 2 = 9 = f(s1). Следовательно, планировщик позволяет Дейкстре раскрыть R и вставить (s_4,s_2) в поисковую очередь. При раскрытии R находится первый путь из ответа. Он строится из пути [math]P(G)[/math], содержащего единственный узел R. Этот путь приводит к пустой последовательности запасных ребер. Напомним, что пустая последовательность запасных ребер соответствует пути из s_0 в s_6 в дереве поиска, а именно s_0s_2s_4s_6 длиной 7. Затем поиск Дейкстры приостанавливается, потому что для successor-ов узла (s_4,s_2) не выполняется условие g(s_6)+d(n)<=f(s_1). Следовательно, возобновляется A*.

Мы предполагаем, что условие раскрытия определено как раскрытие одной вершины для того, чтобы пример был простым и иллюстративным. Поэтому A* раскрывает s_1 и останавливается. Исследованная часть G на текущем этапе показана на рисунке 11. Результат раскрытия приведет к обнаружению 2 новых запасных ребер (s_1,s_2) и (s_1,s_6), которые будут добавлены в H_{in}(s_2) и H_{in}(s_6) соответственно. Обновленные кучи H_{in}(s_2) и H_{in}(s_6) представлены на рисунке 12. Другие кучи остаются неизменными, как на рисунке 9. Граф путей [math]P(G)[/math] перестаивается, как показано на рисунке 13. Затем алгоритм Дейкстры возобновляется. Заметим, что поисковая очередь Дейкстры содержит только (s_4,s_2) с d=2 на этом моменте. Используя ручное выполнение мы можем легко увидеть, что Дейкстра будет выдавать в ответ пути, перечисленные в таблице 1.