Эвристики для поиска кратчайших путей — различия между версиями
Xottab (обсуждение | вклад) м (→ALT) |
Xottab (обсуждение | вклад) (→ALT) |
||
| Строка 154: | Строка 154: | ||
Препроцессинг: | Препроцессинг: | ||
| − | * взять небольшое количество вершин(например, 16), обозначив их как <b>ориентиры</b> | + | * взять небольшое количество вершин (например, 16), обозначив их как <b>ориентиры (landmarks)</b> |
* для каждого из ориентиров посчитать кратчайшие пути до <b>всех</b> вершин | * для каждого из ориентиров посчитать кратчайшие пути до <b>всех</b> вершин | ||
* сохранить эти пути | * сохранить эти пути | ||
| + | |||
| + | Запрос: | ||
| + | * используем A* | ||
| + | * если некоторое ребро находится на кратчайшем пути между исходной точкой и ориентиром - по нему идём в первую очередь | ||
| + | |||
| + | [[Файл:ALT.jpg|right]] | ||
| + | Будем использовать неравенство треугольника для нижних оценок пути: | ||
| + | *<tex>dist(v,w)\ge dist(A,w)-dist(A,v)</tex> | ||
| + | *<tex>dist(v,w)\ge dist(v,A)-dist(w,A)</tex> | ||
| + | *<tex>dist(v,w)\ge max\{dist(A,w)-dist(A,v),dist(v,A)-dist(w,A)\}</tex> | ||
| + | |||
| + | Эта эвристика хорошо работает, на дорожных графах, для которых верно следующее: как правило, кратчайший путь затрагивает небольшое количество локальных дорог, потом крупную автомагистраль и снова некоторое количество локальных дорог. | ||
| + | |||
| + | ===Выбор ориентиров=== | ||
Версия 10:21, 10 декабря 2013
Данная статья - перевод выступления Renato F. Werneck в Microsoft Data Structures and Algorithms School в 2010 году.
Содержание
Проблема поиска кратчайшего пути
Дано:
- ориентированный граф
- отправная точка - вершина , пункт назначения - вершина
Цель: найти кратчайший путь
Мы будем рассматривать сеть автомобильных дорог:
- - множество перекрёстков
- - множество дорог
- - среднее время, которое занимает проезд по дороге
Алгоритм Дейкстры
основная статья: Алгоритм Дейкстры
- на каждом шаге выбирает из множества непросмотренных вершин вершину с наименьшим расстоянием до старта и релаксирует рёбра, исходящие из неё
- завершает свою работу, когда цель достигнута (или просмотрены все вершины)
Скорость работы алгоритма Дейкстры сильно зависит от скорости операций с приоритетной очередью.
Поскольку мы рассматриваем сеть автомобильных дорог, то (граф планарен почти везде).
Для фибоначчиевых куч время работы алгоритма составляет , для двоичных куч:
Но на практике чаще используются 2-, 4- и 8-ичные кучи: они более простые, оценка времени работы содержит меньшее количество скрытых констант.
Улучшения алгоритма Дейкстры
Многоуровневые корзины(multi-level buckets, MLB)
| Структура данных | Время работы (сек) |
|---|---|
| Двоичная куча | 12,38 |
| 4-куча | 11,53 |
| 8-куча | 11,52 |
| MLB | 9,36 |
| MLB + калибровка | 8,04 |
Подходит только графов с целочисленными рёбрами.
- Будем складывать вершины в "корзины"
- Наша структура данных будет поддерживать индекс
- На каждом шаге алгоритма, если пусто, то увеличим , а иначе достанем одну вершину из
- При релаксации будем убирать вершину из исходной корзины и класть в корзину, соответствующую новому значению
Можно заметить, что при такой реализации, все операции с приоритетной очередью будут выполняться за . Тогда, для одного уровня корзин время работы алгоритма Дейкстры можно оценить как , где - максимальная длина ребра в графе.
При двухуровневой реализации будем поддерживать два уровня корзин: первый уровень будет соответствовать одноуровневой реализации, а корзины второго уровня будут содержать диапазон значений корзин первого уровня, которые в них входят.
Соответственно, нам нужно поддерживать два индекса и для каждого из уровней соответственно.
При такой реализации, время работы алгоритма Дейкстры можно оценить как
Калибровка(caliber)
Введём величину калибр вершины - вес минимального ребра, входящего в , или , если в вершину не входит ни одно ребро. Будем говорить, что текущее значение точно, если оно равно длине пути .
| Лемма (1): |
Предположим, что длины рёбер неотрицательны. Пусть - минимальное из текущих значений . Тогда, если существует такая вершина , что , то текущее значение точно. |
Эта лемма позволяет нам смягчить правило выбора текущей вершины в алгоритме Дейкстры, при этом сохраняя инвариант(почти все вершины обрабатываются единожды). Калибровка использует Лемму 1 чтобы находить и обрабатывать вершины с точными текущими значениями расстояния до них.
Модифицируем нашу MLB - структуру: будем хранить помеченные вершины в двух группах: сет и приоритетная очередь , реализованная на MLB. Алгоритм, приведённый ниже, называется алгоритмом умной очереди.
Вершины в будут иметь точные метки. Если непусто, мы удалим оттуда вершину и прорелаксируем всех её соседей. Если же пусто, мы достанем из вершину с минимальной меткой и прорелаксируем всех её соседей.
Рассмотрим механизм релаксации: пусть мы уменьшаем . Заметим, что в этом случае не могло лежать в (иначе было не точно). Если - применим к . Эта операция либо переместила внутри , либо определила, что метка точна и переместила в . Если же , мы применим операцию , и запишется в или , в зависимости от того, выполняется ли условие леммы.
Двунаправленный поиск
Мы можем уменьшить количество посещённых вершин в алгоритме Дейкстры, просто запустив его и из начальной и из конечной вершины. Такая эвристика не испортит скорость работы в худшем случае.
Создадим две приоритетных очереди и запустим на одной из них алгоритм Дейкстры, ищущий из , а на другой - ищущий из . Алгоритм завершит свою работу, когда какая-нибудь вершина будет удалена из обоих очередей.
Тонкость этого алгоритма заключается в том, что кратчайший путь не обязательно пройдёт через вершину . Поэтому после остановки двунаправленного поиска, нам необходимо перебрать все рёбра из вершин, имеющих в вершины с и найти ребро с минимальным . Если эта величина меньше, чем длина первоначально найденного пути - то это и есть результат работы алгоритма.
На практике, такой двунаправленный поиск быстрее обычного алгоритма Дейкстры примерно в два раза.
Алгоритм A*
основная статья: Алгоритм A*
Приведём немного изменённую версию этого алгоритма.
Возьмём функцию - потенциал вершины. Тогда, с её помощью можно определить редуцированную стоимость каждого ребра как
Заметим, что замена на не изменит кратчайших путей: возьмём любой путь . Тогда . Тогда .
Таким образом длины все путей изменятся на одну и ту же величину
В нашем случае, алгоритм A* будет эквивалентен алгоритму Дейкстры, на графе , у которого стоимости рёбер заменили на их редуцированные стоимости. На каждом шаге необходимо будет выбирать из очереди вершину с минимальным значением . Очевидно, будет одинаковым для любой вершины .
Назовём функцию правдоподобной, если . Известно, что, если и правдоподобна, то для любого , - нижняя граница
Главное отличие от алгоритма Дейкстры в том, что A* является целенаправленным алгоритмом - он обрабатывает в первую очередь те вершины, которые находятся ближе к результату.
Скорость работы алгоритма A*:
- в худшем случае - - вырождается в алгоритм Дейкстры
- в лучшем случае -
- , если ребро лежит на кратчайшем пути, иначе редуцированная стоимость положительна
- все посещённые вершины будут лежать на кратчайшем пути
Двунаправленный A*
Для двунаправленной версии алгоритма нам нужны две потенциальные функции:
- , оценивающая
- , оценивающая
В этом случае появляется дополнительная проблема: различные редуцированные стоимости у рёбер для различных обходов:
- - если ребро обрабатывается в обходе, начатом в
- - если ребро обрабатывается в обходе, начатом в
Чтобы избежать этой проблемы, необходимо, чтобы . Кроме того, функции должны бить монотонными.
Решение - использовать усреднённые потенциальные функции:
При таком выборе потенциальных функций, выполняется и тогда двунаправленный A* становится аналогичен двунаправленному алгоритму Дейкстры
Двухэтапные алгоритмы
К сожалению, двунаправленный алгоритм Дейкстры всего в два раза быстрее обычного, а это слишком медленно. Рассмотрим алгоритм поиска кратчайшего пути, состоящий из двух этапов:
- Препроцессинг
- запускается единожды для графа
- может занимать много времени
- рассчитывает некую вспомогательную информацию
- Запрос
- может использовать данные, полученные во время препроцессинга
- запускается по требованию для пары
- должен выполняться очень быстро (в реальном времени)
Можно рассмотреть в этом ключе два примера:
- Алгоритм Дейкстры: препроцессинг - ничего не делать, запрос - выполнение алгоритма Дейкстры;
- Полный перебор: препроцессинг - посчитать таблицу расстояний размером (займёт порядка 5 лет времени и 1 петабайта памяти для карты Европы), запрос - обратиться к элементу таблицы.
Оба эти примера - крайние случаи. Нам нужно нечто более гибкое: препроцессинг за часы/минуты, рост количества предпосчитанных данных линейно от размера графа и запросы в реальном времени.
ALT
Аббревиатура ALT расшифровывается как A* +Landmarks + Triangle inequality : A* + ориентиры + неравенство треугольника.
Препроцессинг:
- взять небольшое количество вершин (например, 16), обозначив их как ориентиры (landmarks)
- для каждого из ориентиров посчитать кратчайшие пути до всех вершин
- сохранить эти пути
Запрос:
- используем A*
- если некоторое ребро находится на кратчайшем пути между исходной точкой и ориентиром - по нему идём в первую очередь
Будем использовать неравенство треугольника для нижних оценок пути:
Эта эвристика хорошо работает, на дорожных графах, для которых верно следующее: как правило, кратчайший путь затрагивает небольшое количество локальных дорог, потом крупную автомагистраль и снова некоторое количество локальных дорог.

