Сортировка Шелла — различия между версиями
Kris (обсуждение | вклад) м (→Анализ метода Шелла) |
|||
Строка 3: | Строка 3: | ||
==Алгоритм== | ==Алгоритм== | ||
Каждый проход в алгоритме характеризуется смещением <tex>h</tex>, таким, что сортируются элементы отстающие друг от друга на <tex>h</tex> позиций. | Каждый проход в алгоритме характеризуется смещением <tex>h</tex>, таким, что сортируются элементы отстающие друг от друга на <tex>h</tex> позиций. | ||
− | Шелл предлагал использовать <tex>h_t = N/2</tex>, <tex>h_{t-1} = h_t/2</tex>, ..., <tex>h_0 = 1</tex>. Возможны и другие смещения, но <tex>h_0 = 1</tex> всегда. | + | Шелл предлагал использовать <tex>h_t = N/2</tex>, <tex>h_{t-1} = h_t/2</tex>, ..., <tex>h_0 = 1</tex>, здесь <tex>t = \left \lfloor log_2 {N} \right \rfloor - 1</tex>. Возможны и другие смещения, но <tex>h_0 = 1</tex> всегда. |
* Начало. | * Начало. | ||
Строка 85: | Строка 85: | ||
<tex> f(n,h) = \dfrac{2^{2q-1}q!q!}{(2q+1)!}(\binom{h}{2}q(q+1) + \binom{r}{2}(q+1)-1/2\binom{h-r}{2}q) </tex>, где <tex>q = \frac{n}{h} </tex> и <tex> r = n\,\bmod\,h </tex> | <tex> f(n,h) = \dfrac{2^{2q-1}q!q!}{(2q+1)!}(\binom{h}{2}q(q+1) + \binom{r}{2}(q+1)-1/2\binom{h-r}{2}q) </tex>, где <tex>q = \frac{n}{h} </tex> и <tex> r = n\,\bmod\,h </tex> | ||
}} | }} | ||
− | + | Следующая лемма является следствием теоремы выше. | |
{{Лемма | {{Лемма | ||
|id=sledstvie1 | |id=sledstvie1 | ||
|about= | |about= | ||
|statement= | |statement= | ||
− | |||
− | |||
Если последовательность смещений <tex>h_{t-1}, ..., h_1, h_0</tex>, удовлетворяют условию <tex> h_{s+1}\,\bmod\,h_s = 0</tex> при <tex>t-1>s\geqslant0</tex>, то среднее число операций равно | Если последовательность смещений <tex>h_{t-1}, ..., h_1, h_0</tex>, удовлетворяют условию <tex> h_{s+1}\,\bmod\,h_s = 0</tex> при <tex>t-1>s\geqslant0</tex>, то среднее число операций равно | ||
<tex>D = \sum_{t-1>s\geqslant0}^{} (r_sf(q_s+1,h_{s+1}/h_s) + (h_s - r_s)f(q_s,h_{s+1}/h_s))</tex>, где <tex>r_s=N\,\bmod\,h_s</tex>, <tex>q_s = \frac{N}{h_s}</tex>, <tex> h_t = Nh_{t-1}</tex>, а функция <tex>f</tex> определяется формулой из теоремы. | <tex>D = \sum_{t-1>s\geqslant0}^{} (r_sf(q_s+1,h_{s+1}/h_s) + (h_s - r_s)f(q_s,h_{s+1}/h_s))</tex>, где <tex>r_s=N\,\bmod\,h_s</tex>, <tex>q_s = \frac{N}{h_s}</tex>, <tex> h_t = Nh_{t-1}</tex>, а функция <tex>f</tex> определяется формулой из теоремы. | ||
}} | }} | ||
− | + | Доказательство данной теоремы и леммы можно найти в книге Д. Кнут Искусство программирования, том 3. Сортировка и поиск. (5.2.1) | |
В первом приближении функция <tex>f(n,h)</tex> равна <tex> (\sqrt{\pi}/8)n^{3/2}h^{1/2}</tex>. Следовательно <tex>D</tex> для двух проходов будет примерно пропорционально <tex>2N^2/h+\sqrt{\pi N^3h}</tex>. По этому наилучшее значение <tex>h</tex> равно приблизительно <tex>\sqrt[3]{16N/ {\pi}} \approx 1.72\sqrt[3]{N}</tex>, при таком выборе <tex>h</tex> среднее время сортировка пропорционально <tex>N^{5/3}</tex>. | В первом приближении функция <tex>f(n,h)</tex> равна <tex> (\sqrt{\pi}/8)n^{3/2}h^{1/2}</tex>. Следовательно <tex>D</tex> для двух проходов будет примерно пропорционально <tex>2N^2/h+\sqrt{\pi N^3h}</tex>. По этому наилучшее значение <tex>h</tex> равно приблизительно <tex>\sqrt[3]{16N/ {\pi}} \approx 1.72\sqrt[3]{N}</tex>, при таком выборе <tex>h</tex> среднее время сортировка пропорционально <tex>N^{5/3}</tex>. |
Версия 21:21, 22 мая 2013
Сортировка Шелла (англ. Shellsort) - алгоритм сортировки, являющийся усовершенствованным вариантом сортировки вставками.
Алгоритм
Каждый проход в алгоритме характеризуется смещением
, таким, что сортируются элементы отстающие друг от друга на позиций. Шелл предлагал использовать , , ..., , здесь . Возможны и другие смещения, но всегда.- Начало.
- Шаг 0. .
- Шаг 1. Разобьем массив на списки элементов отстающих друг от друга на , таких списков будет .
- Шаг 2. Отсортируем элементы каждого списка сортировкой вставками.
- Шаг 3. Объединим списки обратно в массив. Уменьшим , если неотрицательно вернемся к шагу 1.
- Конец.
Пример
Возьмем массив
56, 43, 12, 78, 42, 93, 16, 55 . И смещения предложенные Шеллом.До | После | Описание шага |
---|---|---|
Шаг 1 | ||
56, 43, 12, 78, 42, 93, 16, 55 | 56, 42 43, 93 12, 16 78, 55 | Разбили массив на 4 списка. |
Шаг 2 | ||
56, 42 43, 93 12, 16 78, 55 | 42, 56 43, 93 12, 16 55, 78 | Отсортировали элементы списков сортировкой вставками, количество обменов 2. |
Шаг 3 | ||
42, 56 43, 93 12, 16 55, 78 | 42, 43, 12, 55, 56, 93, 16, 78 | Объединили списки в массив. Уменьшаем | на 1, . Перейдем к шагу 1.
Шаг 1 | ||
42, 43, 12, 55, 56, 93, 16, 78 | 42, 12, 56, 16 43, 55, 93, 78 | Разбили массив на 2 списка. |
Шаг 2 | ||
42, 12, 56, 16 43, 55, 93, 78 | 12, 16, 42, 56 43, 55, 78, 93 | Отсортировали элементы списков сортировкой вставками, количество обменов 4. |
Шаг 3 | ||
12, 16, 42, 56 43, 55, 78, 93 | 12, 43, 16, 55, 42, 78, 56, 93 | Объединили списки в массив. Уменьшаем | на 1, . Перейдем к шагу 1.
Шаг 1 | ||
42, 43, 12, 55, 56, 93, 16, 78 | 42, 43, 12, 55, 56, 93, 16, 78 | Разбили массив на 1 список. |
Шаг 2 | ||
42, 43, 12, 55, 56, 93, 16, 78 | 12, 16, 42, 43, 55, 56, 78, 93 | Отсортировали элементы списков сортировкой вставками, количество обменов 7. |
Шаг 3 | ||
12, 16, 42, 43, 55, 56, 78, 93 | 12, 16, 42, 43, 55, 56, 78, 93 | Объединили списки в массив. Уменьшаем | на 1, .
Анализ метода Шелла
Понятно, что сложность алгоритма зависит от оптимальности выбора набора
. Массив где для ∀ верно , назовем упорядоченным.Теорема (Д.Х. Ханту): |
Среднее число инверсий в упорядоченной перестановке множества 1, 2, ..., равно
, где и |
Следующая лемма является следствием теоремы выше.
Лемма: |
Если последовательность смещений , удовлетворяют условию при , то среднее число операций равно
, где , , , а функция определяется формулой из теоремы. |
Доказательство данной теоремы и леммы можно найти в книге Д. Кнут Искусство программирования, том 3. Сортировка и поиск. (5.2.1)
В первом приближении функция
равна . Следовательно для двух проходов будет примерно пропорционально . По этому наилучшее значение равно приблизительно , при таком выборе среднее время сортировка пропорционально .Таким образом, применяя метод Шелла и используя всего 2 прохода, можно сократить время по сравнению с методом простых вставок с
до .Используя приведенные выше формулы порог
преодолеть невозможно, но если убрать ограничение его можно преодолеть.Теорема (А.А. Папернов, Г.В. Стасевич): |
Если при , то время сортировки есть . |
Доказательство: |
Достаточно найти оценку числа перезаписей | на проходе, такую, что бы . Для первых проходов при можно воспользоваться оценкой , а для последующих проходов , следовательно .
Важно, что эта теорема дает оценку времени выполнения алгоритма в худшем случае.
Дальнейшее улучшение было получено Волганом Праттом. Если все смещения при сортировке выбираются из множества чисел вида
, меньших , то время выполнения алгоритма будет порядка .Смотри также
Литература
- Дональд Кнут Искусство программирования, том 3. Сортировка и поиск = The Art of Computer Programming, vol.3. Sorting and Searching. — 2-е изд. — М.: «Вильямс», 2007. — 824 с. — ISBN 5-8459-0082-4