Сортировка Шелла — различия между версиями
Строка 2: | Строка 2: | ||
==Алгоритм== | ==Алгоритм== | ||
− | Каждый проход в алгоритме характеризуется смещением <tex> | + | Каждый проход в алгоритме характеризуется смещением <tex>h_i</tex>, таким, что сортируются элементы отстающие друг от друга на <tex>h_i</tex> позиций. |
− | Шелл предлагал использовать <tex>h_t = N/2</tex>, <tex>h_{t-1} = h_t/2</tex>, ..., <tex>h_0 = 1</tex>, здесь <tex>t | + | Шелл предлагал использовать <tex>h_t = N/2</tex>, <tex>h_{t-1} = h_t/2</tex>, ..., <tex>h_0 = 1</tex>, здесь <tex>t</tex> количество проходов минус один. Возможны и другие смещения, но <tex>h_0 = 1</tex> всегда. |
* Начало. | * Начало. | ||
* '''Шаг 0.''' <tex>i = t</tex>. | * '''Шаг 0.''' <tex>i = t</tex>. | ||
− | * '''Шаг 1.''' Разобьем массив на списки элементов отстающих друг от друга на <tex>h_i</tex> | + | * '''Шаг 1.''' Разобьем массив на списки элементов, отстающих друг от друга на <tex>h_i</tex>. Таких списков будет <tex>h_i</tex>. |
* '''Шаг 2.''' Отсортируем элементы каждого списка [[Сортировка вставками|сортировкой вставками]]. | * '''Шаг 2.''' Отсортируем элементы каждого списка [[Сортировка вставками|сортировкой вставками]]. | ||
* '''Шаг 3.''' Объединим списки обратно в массив. Уменьшим <tex>i</tex>, если <tex>i</tex> неотрицательно вернемся к шагу 1. | * '''Шаг 3.''' Объединим списки обратно в массив. Уменьшим <tex>i</tex>, если <tex>i</tex> неотрицательно вернемся к шагу 1. | ||
Строка 13: | Строка 13: | ||
==Пример== | ==Пример== | ||
− | Возьмем массив <tex>A= \{</tex> ''56, 43, 12, 78, 42, 93, 16, 55'' <tex>\} </tex> | + | Возьмем массив <tex>A= \{</tex> ''56, 43, 12, 78, 42, 93, 16, 55'' <tex>\} </tex> и смещения предложенные Шеллом. |
{| style="background-color:#CCC;margin:0.5px" | {| style="background-color:#CCC;margin:0.5px" | ||
!style="background-color:#EEE"| До | !style="background-color:#EEE"| До | ||
Строка 29: | Строка 29: | ||
|style="background-color:#FFF;padding:2px 10px"| <tex>\{</tex> ''56, 42'' <tex>\} </tex> <tex>\{</tex> ''43, 93'' <tex>\} </tex> <tex>\{</tex> ''12, 16'' <tex>\} </tex> <tex>\{</tex> ''78, 55'' <tex>\} </tex> | |style="background-color:#FFF;padding:2px 10px"| <tex>\{</tex> ''56, 42'' <tex>\} </tex> <tex>\{</tex> ''43, 93'' <tex>\} </tex> <tex>\{</tex> ''12, 16'' <tex>\} </tex> <tex>\{</tex> ''78, 55'' <tex>\} </tex> | ||
|style="background-color:#FFF;padding:2px 10px"| <tex>\{</tex> ''42, 56'' <tex>\} </tex> <tex>\{</tex> ''43, 93'' <tex>\} </tex> <tex>\{</tex> ''12, 16'' <tex>\} </tex> <tex>\{</tex> ''55, 78'' <tex>\} </tex> | |style="background-color:#FFF;padding:2px 10px"| <tex>\{</tex> ''42, 56'' <tex>\} </tex> <tex>\{</tex> ''43, 93'' <tex>\} </tex> <tex>\{</tex> ''12, 16'' <tex>\} </tex> <tex>\{</tex> ''55, 78'' <tex>\} </tex> | ||
− | |style="background-color:#FFF;padding:2px 10px"| Отсортировали элементы списков сортировкой вставками | + | |style="background-color:#FFF;padding:2px 10px"| Отсортировали элементы списков сортировкой вставками. Количество обменов 2. |
|- | |- | ||
| ''Шаг 3'' | | ''Шаг 3'' | ||
Строка 47: | Строка 47: | ||
|style="background-color:#FFF;padding:2px 10px"| <tex>\{</tex> ''42, 12, 56, 16'' <tex>\} </tex> <tex>\{</tex> ''43, 55, 93, 78'' <tex>\} </tex> | |style="background-color:#FFF;padding:2px 10px"| <tex>\{</tex> ''42, 12, 56, 16'' <tex>\} </tex> <tex>\{</tex> ''43, 55, 93, 78'' <tex>\} </tex> | ||
|style="background-color:#FFF;padding:2px 10px"| <tex>\{</tex> ''12, 16, 42, 56'' <tex>\} </tex> <tex>\{</tex> ''43, 55, 78, 93'' <tex>\} </tex> | |style="background-color:#FFF;padding:2px 10px"| <tex>\{</tex> ''12, 16, 42, 56'' <tex>\} </tex> <tex>\{</tex> ''43, 55, 78, 93'' <tex>\} </tex> | ||
− | |style="background-color:#FFF;padding:2px 10px"| Отсортировали элементы списков сортировкой вставками | + | |style="background-color:#FFF;padding:2px 10px"| Отсортировали элементы списков сортировкой вставками. Количество обменов 4. |
|- | |- | ||
| ''Шаг 3'' | | ''Шаг 3'' | ||
Строка 65: | Строка 65: | ||
|style="background-color:#FFF;padding:2px 10px"| <tex>\{</tex> ''42, 43, 12, 55, 56, 93, 16, 78'' <tex>\} </tex> | |style="background-color:#FFF;padding:2px 10px"| <tex>\{</tex> ''42, 43, 12, 55, 56, 93, 16, 78'' <tex>\} </tex> | ||
|style="background-color:#FFF;padding:2px 10px"| <tex>\{</tex> ''12, 16, 42, 43, 55, 56, 78, 93'' <tex>\} </tex> | |style="background-color:#FFF;padding:2px 10px"| <tex>\{</tex> ''12, 16, 42, 43, 55, 56, 78, 93'' <tex>\} </tex> | ||
− | |style="background-color:#FFF;padding:2px 10px"| Отсортировали элементы списков сортировкой вставками | + | |style="background-color:#FFF;padding:2px 10px"| Отсортировали элементы списков сортировкой вставками. Количество обменов 7. |
|- | |- | ||
| ''Шаг 3'' | | ''Шаг 3'' | ||
Строка 75: | Строка 75: | ||
==Анализ метода Шелла== | ==Анализ метода Шелла== | ||
Понятно, что сложность алгоритма зависит от оптимальности выбора набора <tex>h_i</tex>. | Понятно, что сложность алгоритма зависит от оптимальности выбора набора <tex>h_i</tex>. | ||
− | Массив где для | + | Массив где для любого <tex>i</tex> верно <tex> a_i \leqslant a_{i+h}</tex>, назовем <tex>h</tex> упорядоченным. |
+ | |||
{{Теорема | {{Теорема | ||
Строка 85: | Строка 86: | ||
<tex> f(n,h) = \dfrac{2^{2q-1}q!q!}{(2q+1)!}(\binom{h}{2}q(q+1) + \binom{r}{2}(q+1)-1/2\binom{h-r}{2}q) </tex>, где <tex>q = \frac{n}{h} </tex> и <tex> r = n\,\bmod\,h </tex> | <tex> f(n,h) = \dfrac{2^{2q-1}q!q!}{(2q+1)!}(\binom{h}{2}q(q+1) + \binom{r}{2}(q+1)-1/2\binom{h-r}{2}q) </tex>, где <tex>q = \frac{n}{h} </tex> и <tex> r = n\,\bmod\,h </tex> | ||
}} | }} | ||
+ | |||
Следующая лемма является следствием теоремы выше. | Следующая лемма является следствием теоремы выше. | ||
+ | |||
{{Лемма | {{Лемма | ||
|id=sledstvie1 | |id=sledstvie1 | ||
Строка 94: | Строка 97: | ||
<tex>D = \sum_{t-1>s\geqslant0}^{} (r_sf(q_s+1,h_{s+1}/h_s) + (h_s - r_s)f(q_s,h_{s+1}/h_s))</tex>, где <tex>r_s=N\,\bmod\,h_s</tex>, <tex>q_s = \frac{N}{h_s}</tex>, <tex> h_t = Nh_{t-1}</tex>, а функция <tex>f</tex> определяется формулой из теоремы. | <tex>D = \sum_{t-1>s\geqslant0}^{} (r_sf(q_s+1,h_{s+1}/h_s) + (h_s - r_s)f(q_s,h_{s+1}/h_s))</tex>, где <tex>r_s=N\,\bmod\,h_s</tex>, <tex>q_s = \frac{N}{h_s}</tex>, <tex> h_t = Nh_{t-1}</tex>, а функция <tex>f</tex> определяется формулой из теоремы. | ||
}} | }} | ||
− | |||
− | В первом приближении функция <tex>f(n,h)</tex> равна <tex> (\sqrt{\pi}/8)n^{3/2}h^{1/2}</tex>. Следовательно <tex>D</tex> для двух проходов будет примерно пропорционально <tex>2N^2/h+\sqrt{\pi N^3h}</tex>. | + | |
+ | Доказательство данных теоремы и леммы изложено в первой книге предложенных к прочтению. | ||
+ | |||
+ | В первом приближении функция <tex>f(n,h)</tex> равна <tex> (\sqrt{\pi}/8)n^{3/2}h^{1/2}</tex>. Следовательно <tex>D</tex> для двух проходов будет примерно пропорционально <tex>2N^2/h+\sqrt{\pi N^3h}</tex>. Поэтому наилучшее значение <tex>h</tex> равно приблизительно <tex>\sqrt[3]{16N/ {\pi}} \approx 1.72\sqrt[3]{N}</tex>, при таком выборе <tex>h</tex> среднее время сортировка пропорционально <tex>N^{5/3}</tex>. | ||
Таким образом, применяя метод Шелла и используя всего 2 прохода, можно сократить время по сравнению с методом простых вставок с <tex>O(N^2)</tex> до <tex>O(N^{1.(6)})</tex>. | Таким образом, применяя метод Шелла и используя всего 2 прохода, можно сократить время по сравнению с методом простых вставок с <tex>O(N^2)</tex> до <tex>O(N^{1.(6)})</tex>. | ||
− | Используя приведенные выше формулы порог <tex>N^{1.5}</tex> преодолеть невозможно, но если убрать ограничение <tex> h_{s+1}\,\bmod\,h_s = 0</tex> его можно преодолеть. | + | Используя приведенные выше формулы, порог <tex>N^{1.5}</tex> преодолеть невозможно, но если убрать ограничение <tex> h_{s+1}\,\bmod\,h_s = 0</tex> его можно преодолеть. |
+ | |||
{{Теорема | {{Теорема | ||
Строка 112: | Строка 118: | ||
Важно, что эта теорема дает оценку времени выполнения алгоритма в худшем случае. | Важно, что эта теорема дает оценку времени выполнения алгоритма в худшем случае. | ||
− | Дальнейшее улучшение было получено Волганом Праттом. Если все смещения при сортировке выбираются из множества чисел вида <tex>2^p3^q</tex>, меньших <tex>N</tex>, то время выполнения алгоритма будет порядка <tex> | + | Дальнейшее улучшение было получено Волганом Праттом. Если все смещения при сортировке выбираются из множества чисел вида <tex>2^p3^q</tex>, меньших <tex>N</tex>, то время выполнения алгоритма будет порядка <tex>Nlog^2{N}</tex>. |
== Смотри также == | == Смотри также == | ||
* [[Сортировка выбором]] | * [[Сортировка выбором]] | ||
+ | * [[Сортировка вставками]] | ||
* [[Быстрая сортировка]] | * [[Быстрая сортировка]] | ||
Строка 126: | Строка 133: | ||
[[Категория: Дискретная математика и алгоритмы]] | [[Категория: Дискретная математика и алгоритмы]] | ||
− | [[Категория: Сортировка ]] | + | [[Категория: Сортировка]] |
Версия 23:42, 22 мая 2013
Сортировка Шелла (англ. Shellsort) - алгоритм сортировки, являющийся усовершенствованным вариантом сортировки вставками.
Алгоритм
Каждый проход в алгоритме характеризуется смещением
, таким, что сортируются элементы отстающие друг от друга на позиций. Шелл предлагал использовать , , ..., , здесь количество проходов минус один. Возможны и другие смещения, но всегда.- Начало.
- Шаг 0. .
- Шаг 1. Разобьем массив на списки элементов, отстающих друг от друга на . Таких списков будет .
- Шаг 2. Отсортируем элементы каждого списка сортировкой вставками.
- Шаг 3. Объединим списки обратно в массив. Уменьшим , если неотрицательно вернемся к шагу 1.
- Конец.
Пример
Возьмем массив
56, 43, 12, 78, 42, 93, 16, 55 и смещения предложенные Шеллом.До | После | Описание шага |
---|---|---|
Шаг 1 | ||
56, 43, 12, 78, 42, 93, 16, 55 | 56, 42 43, 93 12, 16 78, 55 | Разбили массив на 4 списка. |
Шаг 2 | ||
56, 42 43, 93 12, 16 78, 55 | 42, 56 43, 93 12, 16 55, 78 | Отсортировали элементы списков сортировкой вставками. Количество обменов 2. |
Шаг 3 | ||
42, 56 43, 93 12, 16 55, 78 | 42, 43, 12, 55, 56, 93, 16, 78 | Объединили списки в массив. Уменьшаем | на 1, . Перейдем к шагу 1.
Шаг 1 | ||
42, 43, 12, 55, 56, 93, 16, 78 | 42, 12, 56, 16 43, 55, 93, 78 | Разбили массив на 2 списка. |
Шаг 2 | ||
42, 12, 56, 16 43, 55, 93, 78 | 12, 16, 42, 56 43, 55, 78, 93 | Отсортировали элементы списков сортировкой вставками. Количество обменов 4. |
Шаг 3 | ||
12, 16, 42, 56 43, 55, 78, 93 | 12, 43, 16, 55, 42, 78, 56, 93 | Объединили списки в массив. Уменьшаем | на 1, . Перейдем к шагу 1.
Шаг 1 | ||
42, 43, 12, 55, 56, 93, 16, 78 | 42, 43, 12, 55, 56, 93, 16, 78 | Разбили массив на 1 список. |
Шаг 2 | ||
42, 43, 12, 55, 56, 93, 16, 78 | 12, 16, 42, 43, 55, 56, 78, 93 | Отсортировали элементы списков сортировкой вставками. Количество обменов 7. |
Шаг 3 | ||
12, 16, 42, 43, 55, 56, 78, 93 | 12, 16, 42, 43, 55, 56, 78, 93 | Объединили списки в массив. Уменьшаем | на 1, .
Анализ метода Шелла
Понятно, что сложность алгоритма зависит от оптимальности выбора набора
. Массив где для любого верно , назовем упорядоченным.
Теорема (Д.Х. Ханту): |
Среднее число инверсий в упорядоченной перестановке множества 1, 2, ..., равно
, где и |
Следующая лемма является следствием теоремы выше.
Лемма: |
Если последовательность смещений , удовлетворяют условию при , то среднее число операций равно
, где , , , а функция определяется формулой из теоремы. |
Доказательство данных теоремы и леммы изложено в первой книге предложенных к прочтению.
В первом приближении функция
равна . Следовательно для двух проходов будет примерно пропорционально . Поэтому наилучшее значение равно приблизительно , при таком выборе среднее время сортировка пропорционально .Таким образом, применяя метод Шелла и используя всего 2 прохода, можно сократить время по сравнению с методом простых вставок с
до .Используя приведенные выше формулы, порог
преодолеть невозможно, но если убрать ограничение его можно преодолеть.
Теорема (А.А. Папернов, Г.В. Стасевич): |
Если при , то время сортировки есть . |
Доказательство: |
Достаточно найти оценку числа перезаписей | на проходе, такую, что бы . Для первых проходов при можно воспользоваться оценкой , а для последующих проходов , следовательно .
Важно, что эта теорема дает оценку времени выполнения алгоритма в худшем случае.
Дальнейшее улучшение было получено Волганом Праттом. Если все смещения при сортировке выбираются из множества чисел вида
, меньших , то время выполнения алгоритма будет порядка .Смотри также
Литература
- Дональд Кнут Искусство программирования, том 3. Сортировка и поиск = The Art of Computer Programming, vol.3. Sorting and Searching. — 2-е изд. — М.: «Вильямс», 2007. — 824 с. — ISBN 5-8459-0082-4