Статические выпуклые оболочки: Джарвис, Грэхем, Эндрю, Чен, QuickHull — различия между версиями

Материал из Викиконспекты
Перейти к: навигация, поиск
м (Сложность)
Строка 174: Строка 174:
 
== Сложность ==
 
== Сложность ==
  
На втором шаге алгоритма в каждой группе оболочка ищется за <tex>O(m \log m)</tex>, общее время - <tex>O(r m \log m) = O(n \log m)</tex>. На третьем шаге поиск каждой следующей точки в каждой группе занимает <tex>O(\log m)</tex>, так как точки уже отсортированы, и мы можем найти нужную бинпоиском. Тогда поиск по всем группам займет <tex>O(r \log m) = O(n / m \log m)</tex>. Всего таких шагов будет <tex>k</tex>, значит общее время - <tex>O(k n / m \log m)</tex>.
+
На втором шаге алгоритма в каждой группе оболочка ищется за <tex>O(m \log m)</tex>, общее время - <tex>O(r m \log m) = O(n \log m)</tex>. На третьем шаге поиск каждой следующей точки в каждой группе занимает <tex>O(\log m)</tex>, так как точки уже отсортированы, и мы можем найти нужную бинпоиском. Тогда поиск по всем группам займет <tex dpi="130">O(r \log m) = O(\frac{n}{m} \log m)</tex>. Всего таких шагов будет <tex>k</tex>, значит общее время - <tex dpi="130">O(\frac{kn}{m} \log m)</tex>.
Итоговое время - <tex>O(n (1 + k / m) \log m)</tex>. Несложно видеть, что минимум достигается при <tex>m = k</tex>. В таком случае сложность равна <tex>O(n \log k)</tex>.
+
Итоговое время - <tex>O(n (1 + \frac{k}{m}) \log m)</tex>. Несложно видеть, что минимум достигается при <tex>m = k</tex>. В таком случае сложность равна <tex>O(n \log k)</tex>.
  
 
== Поиск <tex>m</tex> ==
 
== Поиск <tex>m</tex> ==

Версия 16:18, 22 января 2014

Конспект готов к прочтению.
Определение:
Выпуклой оболочкой множества точек называется пересечение всех выпуклых множеств, содержащих все заданные точки.


Еще одно определение:

Определение:
Выпуклой оболочкой множества точек называется линейная комбинация минимального набора точек, дающая все остальные точки.


Ниже приводятся основные алгоритмы построения выпуклых оболочек статического множества. Используются обозначения: [math]n[/math] - размер входных данных, [math]k[/math] - размер оболочки.

Алгоритм Джарвиса

По-другому "Gift wrapping algorithm" (Заворачивание подарка). Он заключается в том, что мы ищем выпуклую оболочку последовательно, против часовой стрелки, начиная с определенной точки.

Описание Алгоритма

Промежуточный шаг алгоритма. Для точки [math]p_i[/math] ищем следующую перебором.


1) Возьмем самую правую нижнюю точку [math]p_0[/math] нашего множества. Добавляем ее в ответ.

2) На каждом следующем шаге для последнего добавленного [math]p_i[/math] ищем [math]p_{i + 1}[/math] среди всех недобавленных точек и [math]p_0[/math] с максимальным полярным углом относительно [math]p_i[/math] (Если углы равны, надо сравнивать по расстоянию). Добавляем [math]p_{i + 1}[/math] в ответ. Если [math]p_{i + 1} == p_0[/math] , заканчиваем алгоритм.






Корректность

Точка [math]p_0[/math], очевидно, принадлежит оболочке. На каждом последующем шаге алгоритма мы получаем прямую [math]p_{i-1}p_i[/math], по построению которой все точки множества лежат слева от нее. Значит, выпуклая оболочка состоит из [math]p_{i}[/math]-ых и только из них.

Псевдокод

Inplace-реализация алгоритма. [math]S[1..n][/math] - исходное множество, [math]n \gt 2[/math]

 Jarvis(S)
   find i such that S[i] has the lowest y-coordinate and highest x-coordinate
   p0 = S[i]
   pi = p0
   k = 0
   do 
     k++
     for i = k..n 
       if S[i] has lower angle and higher distance than S[k] in relation to pi
         swap(S[i], S[k])
     pi = S[k]
   while pi != p0
   return k

Сложность

Добавление каждой точки в ответ занимает [math]O(n)[/math] времени, всего точек будет [math]k[/math], поэтому итоговая сложность [math]O(nk)[/math].

Ссылки

Алгоритм Грэхема

Алгоритм заключается в том, что мы ищем точки оболочки последовательно, используя стек.

Описание Алгоритма

Промежуточный шаг алгоритма. Зелеными линиями обозначена текущая выпуклая оболочка, синими - промежуточные соединения точек, красными - те отрезки, которые раньше входили в оболочку, а сейчас нет. На текущем шаге при добавлении точки [math]p[/math] последовательно убираем из оболочки точки с [math]i+3[/math]-ей до [math]i+1[/math]-ой

1)Находим самую правую нижнюю точку множества [math]p_0[/math], добавляем в ответ.

2)Сортируем все остальные точки по полярному углу относительно [math]p_0[/math].

3)Добавляем в ответ [math]p_1[/math] - самую первую из отсортированных точек.

4)Берем следующую по счету точку [math]t[/math]. Пока [math]t[/math] и две последних точки в текущей оболочке [math]p_i[/math] и [math]p_{i-1}[/math] образуют неправый поворот (вектора [math]p_i t[/math] и [math]p_{i-1} p_i[/math]), удаляем из оболочки [math]p_i[/math].

5)Добавляем в оболочку [math]t[/math].

6)Делаем п.5, пока не закончатся точки.

Корректность

Докажем, что на каждом шаге множество [math]p_i[/math]-тых является выпуклой оболочкой всех уже рассмотренных точек. Доказательство проведем по индукции.

1)База. Для трех первых точек утверждение, очевидно, выполняется.

2)Переход. Пусть для [math]i-1[/math] точек оболочки совпадают. Докажем, что и для [math]i[/math] точек они совпадут.

Рассмотрим истинную оболочку [math]ch(S \cup {i}) = ch(S) \cup i \setminus P[/math], где [math]P[/math] - множество всех точек из [math]ch(S)[/math], видимых из [math]i[/math]. Так как мы добавляли точки в нашу оболочку против часовой стрелки и так как [math]i[/math]-тая точка лежит в [math]ch(S \cup i)[/math], то [math]P[/math] состоит из нескольких подряд идущих последних добавленных в оболочку точек, и именно их мы удаляем на текущем шаге. Поэтому наша оболочка и истинная для [math]i[/math] точек совпадают.

Тогда по индукции оболочки совпадают и для [math]i = n[/math].

Псевдокод

Inplace-реализация алгоритма. [math]S[1..n][/math] - исходное множество, [math]n \gt 2[/math]

Graham(S)
  find i such that S[i] has the lowest y-coordinate and highest x-coordinate
  swap(S[i], S[1])
  sort S[2..n] by angle in relation to S[1]
  k = 2
  for p = 3..n
    while S[k - 1], S[k], S[p] has non-right orientation
      k--
    swap(S[p], S[k + 1])   
  return k + 1

Сложность

Сортировка точек занимает [math]O(n \log n)[/math] времени. При обходе каждая точка добавляется в ответ не более одного раза, поэтому сложность этой части - [math]O(n)[/math]. Суммарное время - [math]O(n \log n)[/math].

Ссылки

Алгоритм Эндрю

Алгоритм, очень похожий на алгоритм Грехема. Он заключается в том, что мы находим самую левую и самую правую точки, ищем для точек над и под этой прямой выпуклую оболочку Грехемом - для них начальные точки будут лежать на [math]\pm inf[/math], а сортировка по углу относительно далекой точки аналогична сортировке по координате; после этого объединяем две оболочки в одну.

Описание Алгоритма

Промежуточный шаг алгоритма. Зелеными линиями обозначена текущая выпуклая оболочка, синими - промежуточные соединения точек, красными - те отрезки, которые раньше входили в оболочку, а сейчас нет. На текущем шаге при добавлении точки [math]p[/math] последовательно убираем из оболочки точки с [math]i+3[/math]-ей до [math]i+1[/math]-ой

1)Находим самую левую и самую правую точки множества - [math]p_0[/math] и [math]p_1[/math].

2)Делим множество на две части: точки над и под прямой.

3)Для каждой половины ищем выпуклую оболочку Грехемом с условием, что сортируем не по полярному углу, а по координате.

4)Сливаем получившиеся оболочки.


Корректность


См. доказательство алгоритма Грехема.

Псевдокод

Inplace-реализация алгоритма. [math]S[1..n][/math] - исходное множество, [math]n \gt 2[/math]

Andrew(S)
  sort S[1..n] by x-coordinate backward(than by y backward)
  k = 2
  for p = 3..n
   while S[k - 1], S[k], S[p] has non-right orientation
     k--
   swap(S[p], S[k + 1])
  k++   
  sort S[k + 1..n] by x-coordinate (than by y)
  for p = k + 1..n
    while S[k - 1], S[k], S[p] has non-right orientation
      k--
    swap(S[p], S[k + 1])
  return k + 1

Сложность

Сортировка точек занимает [math]O(n \log n)[/math] времени. При обходе каждая точка добавляется в ответ не более одного раза, поэтому сложность двух обходов - [math] 2 \cdot O(n)[/math]. Суммарное время - [math]O(n \log n)[/math].

Ссылки

Алгоритм Чена

Является комбинацией двух алгоритмов - Джарвиса и Грехема. Недостатком Грэхема является необходимость сортировки всех точек по полярному углу, что занимает достаточно много времени [math]O(n \log n)[/math]. Джарвис требует перебора всех точек для каждой из [math]k[/math] точек оболочки, что в худшем случае занимает [math]O(n^2)[/math].

Описание Алгоритма

1)Разобьем все множество на произвольные группы по [math]m[/math] штук в каждой. Будем считать, что [math]m[/math] нам известно. Тогда всего групп окажется [math]r = n / m[/math].

2)Для каждой группы запускаем Грехема.

3)Начиная с самой нижней точки ищем саму выпуклую оболочку Джарвисом, но перебираем не все точки, а по одной из каждой группы.

Сложность

На втором шаге алгоритма в каждой группе оболочка ищется за [math]O(m \log m)[/math], общее время - [math]O(r m \log m) = O(n \log m)[/math]. На третьем шаге поиск каждой следующей точки в каждой группе занимает [math]O(\log m)[/math], так как точки уже отсортированы, и мы можем найти нужную бинпоиском. Тогда поиск по всем группам займет [math]O(r \log m) = O(\frac{n}{m} \log m)[/math]. Всего таких шагов будет [math]k[/math], значит общее время - [math]O(\frac{kn}{m} \log m)[/math]. Итоговое время - [math]O(n (1 + \frac{k}{m}) \log m)[/math]. Несложно видеть, что минимум достигается при [math]m = k[/math]. В таком случае сложность равна [math]O(n \log k)[/math].

Поиск [math]m[/math]

Как заранее узнать [math]k[/math]? Воспользуемся следующим методом. Положим [math]m = 2^{2^t}[/math]. Начиная с маленьких [math]m[/math] будем запускать наш алгоритм, причем если на третьем шаге Джарвис уже сделал [math]m[/math] шагов, то мы выбрали наше [math]m[/math] слишком маленьким, будем увеличивать, пока не станет [math]m \ge k[/math]. Тогда общее время алгоритма - [math] \sum_{t=0}^{O(\log\log k)} O\left(n \log(2^{2^t})\right) = O(n) \sum_{t=0}^{O(\log\log k)} O(2^t) = O\left(n \cdot 2^{1+O(\log\log k)}\right) = O(n \log k).[/math]

Ссылки

Алгоритм QuickHull

Описание Алгоритма

Промежуточный шаг алгоритма. Для прямой [math]p_i p_1[/math] нашли точку [math]p[/math]. Над прямыми [math]p_i p[/math] и [math]p p_1[/math] точек нет, поэтому переходим к следующей прямой [math]p_0 p_i[/math].

1)Найдем самую левую нижнюю точку [math]p_0[/math] и самую правую нижнюю точку [math]p_1[/math].

2)Возьмем все точки выше прямой [math]p_0 p_1[/math].

3)Найдем среди этого множества точку [math]p_i[/math], наиболее отдаленную от прямой (если таких несколько, взять самую правую).

4)Рекурсивно повторить шаги 2-3 для прямых [math]p_0 p_i[/math] и [math]p_i p_1[/math], пока есть точки.

5)Добавить в ответ точки [math]p_0 .. p_i .. p_1[/math], полученные в п. 3.

6)Повторить пункты 2-5 для [math]p_1 p_0[/math] (то есть для "нижней" половины).

7)Ответ - объединение списков из п. 5 для верхней и нижней половины.



Корректность

Hull1.png

Очевидно, что выпуклая оболочка всего множества является объединением выпуклых оболочек для верхнего и нижнего множества. Докажем, что алгоритм верно строит оболочку для верхнего множества, для правого рассуждения аналогичны. Точки [math]p_0[/math] и [math]p_1[/math] принадлежат оболочке.

  • Пусть какая-то точка входит в нашу оболочку, но не должна.

Назовем эту точку [math]t[/math]. По алгоритму эта точка появилась как самая удаленная от некой прямой [math]t_1 t_2[/math]. Так как [math]t[/math] не входит в оболочку, то существует прямая [math]t_3 t_4[/math] из настоящей выпуклой оболочки, что [math]t[/math] лежит снизу от прямой. Тогда какая-то из [math]t_3[/math] и [math]t_4[/math] удалена от прямой дальше [math]t[/math], что противоречит алгоритму.

  • Наоборот, пусть какой-то точки [math]t[/math] в нашей оболочке нет, а должна быть.

Пойдем вниз рекурсии в те ветки, где есть [math]t[/math]. В какой-то момент [math]t[/math] окажется внутри некоторого треугольника. Но тогда возникает противоречие с тем, что [math]t[/math] принадлежит выпуклой оболочке - противоречие.

Таким образом, наша оболочка совпадает с истинной, а значит алгоритм корректен.

Реализация

Заметим, что длина высоты, опущенная из точки [math]t[/math] на отрезок [math]ab[/math], пропорциональна векторному произведению [math][bt \cdot ba][/math], поэтому для сравнения можно использовать именно это.

Псевдокод

Inplace-реализация алгоритма. [math]S[1..n][/math] - исходное множество. [math]quick\_hull()[/math] - рекурсивная функция, находящая оболочку подмножества [math]S[/math]. В реализации в конце каждого подмножества находятся эл-ты, точно не принадлежащие оболочке.

QuickHull(S)
  find i such that S[i] has the highest x-coordinate and lowest y-coordinate 
  swap(S[1], S[i])
  find i such that S[i] has the lowest x-coordinate and lowest y-coordinate
  swap(S[n], S[i])
  k = partition1(S) // разбиваем на те эл-ты, которые лежат над прямой и на остальные
  a = quick_hull(S, 1, k)
  b = quick_hull(S, k + 1, n);
  swap(S[a..k], S[k + 1, b])
  return start + (a - 1) + (b - k - 1) 
quick_hull(S, start, end) find i such that S[i], S[start], S[end] has maximum value (a, b) = partition2(S, start, end, S[i]) //свапаем эл-ты S так, чтобы сначала были все эл-ты над прямой S[start]S[i], потом S[i]S[end], потом все остальное c = quick_hull(S, start, a) d = quick_hull(S, a + 1, b) swap(S[c..a], S[a + 1..d]) return start + (a - c) + (d - b)

Сложность

Пусть время, необходимое для нахождения оболочки над некой прямой и множеством точек [math]S[/math] есть [math]T(S)[/math] Тогда [math]T(S) = O(\|S\|) + T(A \in S) + T(B \in S)[/math], где [math]A, B[/math] - множества над полученными прямыми. Отсюда видно, что в худшем случае, алгоритм тратит [math]O(n^2)[/math]. На рандомных же данных это число равно [math]O(n \log n)[/math]

Ссылки