Сортировка Шелла — различия между версиями
Строка 35: | Строка 35: | ||
|style="background-color:#FFF;padding:2px 10px"| <tex>\{</tex> ''42, 56'' <tex>\} </tex> <tex>\{</tex> ''43, 93'' <tex>\} </tex> <tex>\{</tex> ''12, 16'' <tex>\} </tex> <tex>\{</tex> ''55, 78'' <tex>\} </tex> | |style="background-color:#FFF;padding:2px 10px"| <tex>\{</tex> ''42, 56'' <tex>\} </tex> <tex>\{</tex> ''43, 93'' <tex>\} </tex> <tex>\{</tex> ''12, 16'' <tex>\} </tex> <tex>\{</tex> ''55, 78'' <tex>\} </tex> | ||
|style="background-color:#FFF;padding:2px 10px"| ''42, 43, 12, 55, 56, 93, 16, 78'' | |style="background-color:#FFF;padding:2px 10px"| ''42, 43, 12, 55, 56, 93, 16, 78'' | ||
− | |style="background-color:#FFF;padding:2px 10px"| Объединили списки в массив. Уменьшаем <tex>i</tex> на 1 | + | |style="background-color:#FFF;padding:2px 10px"| Объединили списки в массив. Уменьшаем <tex>i</tex> на 1. <tex>i \geqslant 0</tex>, перейдем к шагу 1. |
|- | |- | ||
| ''Шаг 1'' <tex>i = 1</tex> | | ''Шаг 1'' <tex>i = 1</tex> | ||
Строка 53: | Строка 53: | ||
|style="background-color:#FFF;padding:2px 10px"| <tex>\{</tex> ''12, 16, 42, 56'' <tex>\} </tex> <tex>\{</tex> ''43, 55, 78, 93'' <tex>\} </tex> | |style="background-color:#FFF;padding:2px 10px"| <tex>\{</tex> ''12, 16, 42, 56'' <tex>\} </tex> <tex>\{</tex> ''43, 55, 78, 93'' <tex>\} </tex> | ||
|style="background-color:#FFF;padding:2px 10px"| ''12, 43, 16, 55, 42, 78, 56, 93'' | |style="background-color:#FFF;padding:2px 10px"| ''12, 43, 16, 55, 42, 78, 56, 93'' | ||
− | |style="background-color:#FFF;padding:2px 10px"| Объединили списки в массив. Уменьшаем <tex>i</tex> на 1 | + | |style="background-color:#FFF;padding:2px 10px"| Объединили списки в массив. Уменьшаем <tex>i</tex> на 1. <tex>i \geqslant 0</tex>, перейдем к шагу 1. |
|- | |- | ||
| ''Шаг 1'' <tex>i = 0</tex> | | ''Шаг 1'' <tex>i = 0</tex> | ||
Строка 71: | Строка 71: | ||
|style="background-color:#FFF;padding:2px 10px"| <tex>\{</tex> ''12, 16, 42, 43, 55, 56, 78, 93'' <tex>\} </tex> | |style="background-color:#FFF;padding:2px 10px"| <tex>\{</tex> ''12, 16, 42, 43, 55, 56, 78, 93'' <tex>\} </tex> | ||
|style="background-color:#FFF;padding:2px 10px"| ''12, 16, 42, 43, 55, 56, 78, 93'' | |style="background-color:#FFF;padding:2px 10px"| ''12, 16, 42, 43, 55, 56, 78, 93'' | ||
− | |style="background-color:#FFF;padding:2px 10px"| Объединили списки в массив. Уменьшаем <tex>i</tex> на 1 | + | |style="background-color:#FFF;padding:2px 10px"| Объединили списки в массив. Уменьшаем <tex>i</tex> на 1. <tex>i<0</tex>. |
|} | |} | ||
==Анализ метода Шелла== | ==Анализ метода Шелла== | ||
Понятно, что сложность алгоритма зависит от оптимальности выбора набора <tex>h_i</tex>. | Понятно, что сложность алгоритма зависит от оптимальности выбора набора <tex>h_i</tex>. | ||
− | Массив где для любого <tex>i</tex> верно <tex> a_i \leqslant a_{i+h}</tex>, назовем <tex>h</tex> упорядоченным. | + | Массив, где для любого <tex>i</tex> верно <tex> a_i \leqslant a_{i+h}</tex>, назовем <tex>h</tex> упорядоченным. |
Строка 99: | Строка 99: | ||
− | Доказательство данных теоремы и леммы изложено в | + | Доказательство данных теоремы и леммы изложено в книге, предложенной к прочтению. |
В первом приближении функция <tex>f(n,h)</tex> равна <tex> (\sqrt{\pi}/8)n^{3/2}h^{1/2}</tex>. Следовательно <tex>D</tex> для двух проходов будет примерно пропорционально <tex>2N^2/h+\sqrt{\pi N^3h}</tex>. Поэтому наилучшее значение <tex>h</tex> равно приблизительно <tex>\sqrt[3]{16N/ {\pi}} \approx 1.72\sqrt[3]{N}</tex>, при таком выборе <tex>h</tex> среднее время сортировки пропорционально <tex>N^{5/3}</tex>. | В первом приближении функция <tex>f(n,h)</tex> равна <tex> (\sqrt{\pi}/8)n^{3/2}h^{1/2}</tex>. Следовательно <tex>D</tex> для двух проходов будет примерно пропорционально <tex>2N^2/h+\sqrt{\pi N^3h}</tex>. Поэтому наилучшее значение <tex>h</tex> равно приблизительно <tex>\sqrt[3]{16N/ {\pi}} \approx 1.72\sqrt[3]{N}</tex>, при таком выборе <tex>h</tex> среднее время сортировки пропорционально <tex>N^{5/3}</tex>. | ||
Строка 118: | Строка 118: | ||
Важно, что эта теорема дает оценку времени выполнения алгоритма в худшем случае. | Важно, что эта теорема дает оценку времени выполнения алгоритма в худшем случае. | ||
− | Дальнейшее улучшение было получено Волганом Праттом. Если все смещения при сортировке выбираются из множества чисел вида <tex>2^p3^q</tex>, меньших <tex>N</tex>, то время выполнения алгоритма будет порядка <tex>Nlog^2{N}</tex>. | + | Дальнейшее улучшение было получено Волганом Праттом. Если все смещения при сортировке выбираются из множества чисел вида <tex>2^p3^q</tex>, меньших <tex>N</tex>, то время выполнения алгоритма будет порядка <tex>О(Nlog^2{N})</tex>. |
== Смотри также == | == Смотри также == |
Версия 23:33, 23 мая 2013
Сортировка Шелла (англ. Shellsort) - алгоритм сортировки, являющийся усовершенствованным вариантом сортировки вставками.
Алгоритм
Каждый проход в алгоритме характеризуется смещением
, таким, что сортируются элементы отстающие друг от друга на позиций. Шелл предлагал использовать , , ..., , здесь количество проходов минус один. Возможны и другие смещения, но всегда.- Начало.
- Шаг 0. .
- Шаг 1. Разобьем массив на списки элементов, отстающих друг от друга на . Таких списков будет .
- Шаг 2. Отсортируем элементы каждого списка сортировкой вставками.
- Шаг 3. Объединим списки обратно в массив. Уменьшим . Если неотрицательно - вернемся к шагу 1
- Конец.
Пример
Возьмем массив
56, 43, 12, 78, 42, 93, 16, 55 и смещения предложенные Шеллом.До | После | Описание шага |
---|---|---|
Шаг 1 | ||
56, 43, 12, 78, 42, 93, 16, 55 | 56, 42 43, 93 12, 16 78, 55 | Разбили массив на 4 списка. |
Шаг 2 | ||
56, 42 43, 93 12, 16 78, 55 | 42, 56 43, 93 12, 16 55, 78 | Отсортировали элементы списков сортировкой вставками. Количество обменов 2. |
Шаг 3 | ||
42, 56 43, 93 12, 16 55, 78 | 42, 43, 12, 55, 56, 93, 16, 78 | Объединили списки в массив. Уменьшаем | на 1. , перейдем к шагу 1.
Шаг 1 | ||
42, 43, 12, 55, 56, 93, 16, 78 | 42, 12, 56, 16 43, 55, 93, 78 | Разбили массив на 2 списка. |
Шаг 2 | ||
42, 12, 56, 16 43, 55, 93, 78 | 12, 16, 42, 56 43, 55, 78, 93 | Отсортировали элементы списков сортировкой вставками. Количество обменов 4. |
Шаг 3 | ||
12, 16, 42, 56 43, 55, 78, 93 | 12, 43, 16, 55, 42, 78, 56, 93 | Объединили списки в массив. Уменьшаем | на 1. , перейдем к шагу 1.
Шаг 1 | ||
42, 43, 12, 55, 56, 93, 16, 78 | 42, 43, 12, 55, 56, 93, 16, 78 | Разбили массив на 1 список. |
Шаг 2 | ||
42, 43, 12, 55, 56, 93, 16, 78 | 12, 16, 42, 43, 55, 56, 78, 93 | Отсортировали элементы списков сортировкой вставками. Количество обменов 7. |
Шаг 3 | ||
12, 16, 42, 43, 55, 56, 78, 93 | 12, 16, 42, 43, 55, 56, 78, 93 | Объединили списки в массив. Уменьшаем | на 1. .
Анализ метода Шелла
Понятно, что сложность алгоритма зависит от оптимальности выбора набора
. Массив, где для любого верно , назовем упорядоченным.
Теорема (Д.Х. Ханту): |
Среднее число инверсий в упорядоченной перестановке множества 1, 2, ..., равно
, где и |
Следующая лемма является следствием теоремы выше.
Лемма: |
Если последовательность смещений , удовлетворяют условию при , то среднее число операций равно
, где , , , а функция определяется формулой из теоремы. |
Доказательство данных теоремы и леммы изложено в книге, предложенной к прочтению.
В первом приближении функция
равна . Следовательно для двух проходов будет примерно пропорционально . Поэтому наилучшее значение равно приблизительно , при таком выборе среднее время сортировки пропорционально .Таким образом, применяя метод Шелла и используя всего 2 прохода, можно сократить время по сравнению с методом простых вставок с
до .Используя приведенные выше формулы, порог
преодолеть невозможно, но если убрать ограничение его можно преодолеть.
Теорема (А.А. Папернов, Г.В. Стасевич): |
Если при , то время сортировки есть . |
Доказательство: |
Достаточно найти оценку числа перезаписей | на проходе, такую, что бы . Для первых проходов при можно воспользоваться оценкой , а для последующих проходов , следовательно .
Важно, что эта теорема дает оценку времени выполнения алгоритма в худшем случае.
Дальнейшее улучшение было получено Волганом Праттом. Если все смещения при сортировке выбираются из множества чисел вида
, меньших , то время выполнения алгоритма будет порядка .Смотри также
Литература
- Дональд Кнут Искусство программирования, том 3. Сортировка и поиск = The Art of Computer Programming, vol.3. Sorting and Searching. — 2-е изд. — М.: «Вильямс», 2007. — 824 с. — ISBN 5-8459-0082-4