Сортировка пузырьком — различия между версиями
Warrior (обсуждение | вклад) м (→Сложность) |
м (rollbackEdits.php mass rollback) |
||
(не показаны 133 промежуточные версии 7 участников) | |||
Строка 4: | Строка 4: | ||
Алгоритм состоит в повторяющихся проходах по сортируемому массиву. На каждой итерации последовательно сравниваются соседние элементы, и, если порядок в паре неверный, то элементы меняют местами. За каждый проход по массиву как минимум один элемент встает на свое место, поэтому необходимо совершить не более <tex> n - 1 </tex> проходов, где <tex> n </tex> размер массива, чтобы отсортировать массив. | Алгоритм состоит в повторяющихся проходах по сортируемому массиву. На каждой итерации последовательно сравниваются соседние элементы, и, если порядок в паре неверный, то элементы меняют местами. За каждый проход по массиву как минимум один элемент встает на свое место, поэтому необходимо совершить не более <tex> n - 1 </tex> проходов, где <tex> n </tex> размер массива, чтобы отсортировать массив. | ||
− | + | Ниже приведен псевдокод сортировки пузырьком, на вход которой подается массив <tex> a[0..n - 1] </tex>. | |
− | Ниже приведен псевдокод сортировки пузырьком, на вход которой подается массив <tex> | + | '''function''' bubbleSort(a): |
− | + | '''for''' i = 0 '''to''' n - 2 | |
− | + | '''for''' j = 0 '''to''' n - 2 | |
− | + | '''if''' a[j] > a[j + 1] | |
− | + | swap(a[j], a[j + 1]) | |
− | |||
== Оптимизация == | == Оптимизация == | ||
Строка 16: | Строка 15: | ||
* Также заметим, что если после выполнения внутреннего цикла не произошло ни одного обмена, то массив уже отсортирован, и продолжать что-то делать бессмысленно. Поэтому внутренний цикл можно выполнять не <tex> n - 1 </tex> раз, а до тех пор, пока во внутреннем цикле происходят обмены. | * Также заметим, что если после выполнения внутреннего цикла не произошло ни одного обмена, то массив уже отсортирован, и продолжать что-то делать бессмысленно. Поэтому внутренний цикл можно выполнять не <tex> n - 1 </tex> раз, а до тех пор, пока во внутреннем цикле происходят обмены. | ||
− | + | При использовании первой оптимизации сортировка принимает следующий вид: | |
− | + | '''function''' bubbleSort(a): | |
− | + | '''for''' i = 0 '''to''' n - 2 | |
− | + | '''for''' j = 0 '''to''' n - i - 2 | |
− | + | '''if''' a[j] > a[j + 1] | |
− | + | swap(a[j], a[j + 1]) | |
− | + | ||
− | + | При использовании же обеих оптимизаций сортировка пузырьком выглядит так: | |
− | + | '''function''' bubbleSort(a): | |
− | + | i = 0 | |
− | + | t = ''true'' | |
+ | '''while''' t | ||
+ | t = ''false'' | ||
+ | '''for''' j = 0 '''to''' n - i - 2 | ||
+ | '''if''' a[j] > a[j + 1] | ||
+ | swap(a[j], a[j + 1]) | ||
+ | t = ''true'' | ||
+ | i = i + 1 | ||
== Сложность == | == Сложность == | ||
В данной сортировке выполняются всего два различных вида операции: сравнение элементов и их обмен. Поэтому время всего алгоритма <tex> T = T_1 + T_2 </tex>, где <tex> T_1 </tex> {{---}} время, затрачиваемое на сравнение элементов, а <tex> T_2 </tex> {{---}} время, за которое мы производим все необходимые обмены элементов. | В данной сортировке выполняются всего два различных вида операции: сравнение элементов и их обмен. Поэтому время всего алгоритма <tex> T = T_1 + T_2 </tex>, где <tex> T_1 </tex> {{---}} время, затрачиваемое на сравнение элементов, а <tex> T_2 </tex> {{---}} время, за которое мы производим все необходимые обмены элементов. | ||
− | Так как в алгоритме меняться местами могут только соседние элементы, то каждый обмен уменьшает количество [[Таблица инверсий|инверсий]] на единицу. Следовательно, количество обменов равно количеству инверсий в исходном массиве вне зависимости от реализации сортировки. Максимальное количество инверсий содержится в массиве, элементы которого отсортированы по | + | Так как в алгоритме меняться местами могут только соседние элементы, то каждый обмен уменьшает количество [[Таблица инверсий|инверсий]] на единицу. Следовательно, количество обменов равно количеству инверсий в исходном массиве вне зависимости от реализации сортировки. Максимальное количество инверсий содержится в массиве, элементы которого отсортированы по убыванию. Несложно посчитать, что количество инверсий в таком массиве <tex dpi=150> \frac {n (n - 1)} {2} </tex>. Получаем, что <tex> T_2 = O(n^2) </tex>. |
В неоптимизированной реализации на каждой итерации внутреннего цикла производятся <tex> n - 1 </tex> сравнений, а так как внутренний цикл запускается также <tex> n - 1 </tex> раз, то за весь алгоритм сортировки производятся <tex> (n - 1)^2 </tex> сравнений. | В неоптимизированной реализации на каждой итерации внутреннего цикла производятся <tex> n - 1 </tex> сравнений, а так как внутренний цикл запускается также <tex> n - 1 </tex> раз, то за весь алгоритм сортировки производятся <tex> (n - 1)^2 </tex> сравнений. | ||
− | В оптимизированной версии точное количество сравнений зависит от исходного массива. | + | В оптимизированной версии точное количество сравнений зависит от исходного массива. Известно, что худший случай равен <tex dpi=150> \frac {n (n - 1)} {2} </tex>, а лучший {{---}} <tex> n-1 </tex>. Следовательно, <tex> T_1 = O(n^2) </tex>. |
В итоге получаем <tex> T = T_1 + T_2 = O(n^2) + O(n^2) = O(n^2) </tex>. | В итоге получаем <tex> T = T_1 + T_2 = O(n^2) + O(n^2) = O(n^2) </tex>. | ||
Строка 41: | Строка 47: | ||
== Пример работы алгоритма == | == Пример работы алгоритма == | ||
− | Возьмём массив | + | Возьмём массив <tex> [5, 1, 4, 2, 8] </tex> и отсортируем значения по возрастанию, используя сортировку пузырьком. Выделены те элементы, которые сравниваются на данном этапе. |
Строка 92: | Строка 98: | ||
|} | |} | ||
− | Теперь массив полностью отсортирован, но неоптимизированный алгоритм проведет еще два прохода, на которых ничего не изменится, в | + | Теперь массив полностью отсортирован, но неоптимизированный алгоритм проведет еще два прохода, на которых ничего не изменится, в отличие от алгоритма, использующего вторую оптимизацию, который сделает один проход и прекратит свою работу, так как не сделает за этот проход ни одного обмена. |
+ | |||
+ | == Модификации == | ||
+ | |||
+ | === Сортировка чет-нечет === | ||
+ | '''Сортировка чет-нечет''' (англ. ''odd-even sort'') {{---}} модификация пузырьковой сортировки, основанная на сравнении элементов стоящих на четных и нечетных позициях независимо друг от друга. Сложность {{---}} <tex> O(n^2) </tex>. | ||
+ | Псевдокод указан ниже: | ||
+ | '''function''' oddEvenSort(a): | ||
+ | '''for''' i = 0 '''to''' n - 1 | ||
+ | '''if''' i '''mod''' 2 == 0 | ||
+ | '''for''' j = 2 '''to''' n - 1 '''step''' 2 | ||
+ | '''if''' a[j] < a[j - 1] | ||
+ | swap(a[j - 1], a[j]) | ||
+ | '''else''' | ||
+ | '''for''' j = 1 '''to''' n - 1 '''step''' 2 | ||
+ | '''if''' a[j] < a[j - 1] | ||
+ | swap(a[j - 1], a[j]) | ||
+ | |||
+ | Преимущество этой сортировки {{---}} на нескольких процессорах она выполняется быстрее, так как четные и нечетные индексы сортируются параллельно. | ||
+ | |||
+ | === Сортировка расческой === | ||
+ | '''Сортировка расческой''' (англ. ''comb sort'') {{---}} модификация пузырьковой сортировки, основанной на сравнении элементов на расстоянии. Сложность {{---}} <tex> O(n^2) </tex>, но стремится к <tex> O(n \log n) </tex>. Является самой быстрой квадратичной сортировкой. Недостаток {{---}} она неустойчива. Псевдокод указан ниже: | ||
+ | |||
+ | '''function''' combSort(a): | ||
+ | k = 1.3 | ||
+ | jump = n | ||
+ | '''bool''' swapped = ''true'' | ||
+ | '''while''' jump > 1 '''and''' swapped | ||
+ | '''if''' jump > 1 | ||
+ | jump /= k | ||
+ | swapped = ''false'' | ||
+ | '''for''' i = 0 '''to''' size - jump - 1 | ||
+ | '''if''' a[i + jump] < a[i] | ||
+ | swap(a[i], a[i + jump]) | ||
+ | swapped = ''true'' | ||
+ | Пояснения: Изначально расстояние между сравниваемыми элементами равно <tex dpi=150> \frac{n}{k} </tex>, где <tex> k = 1{.}3 </tex> {{---}} оптимальное число для этого алгоритма. Сортируем массив по этому расстоянию, потом уменьшаем его по этому же правилу. Когда расстояние между сравниваемыми элементами достигает единицы, массив досортировывается обычным пузырьком. | ||
+ | |||
+ | === Сортировка перемешиванием === | ||
+ | '''Сортировка перемешиванием''' (англ. ''cocktail sort''), также известная как '''Шейкерная сортировка''' {{---}} разновидность пузырьковой сортировки, сортирующая массив в двух направлениях на каждой итерации. В среднем, сортировка перемешиванием работает в два раза быстрее пузырька. Сложность {{---}} <tex> O(n^2) </tex>, но стремится она к <tex> O(k \cdot n) </tex>, где <tex> k </tex> {{---}} максимальное расстояние элемента в неотсортированном массиве от его позиции в отсортированном массиве. Псевдокод указан ниже: | ||
+ | |||
+ | '''function''' shakerSort(a): | ||
+ | begin = -1 | ||
+ | end = n - 2 | ||
+ | '''while''' swapped | ||
+ | swapped = ''false'' | ||
+ | begin++ | ||
+ | '''for''' i = begin '''to''' end | ||
+ | '''if''' a[i] > a[i + 1] | ||
+ | swap(a[i], a[i + 1]) | ||
+ | swapped = ''true'' | ||
+ | '''if''' !swapped | ||
+ | '''break''' | ||
+ | swapped = ''false'' | ||
+ | end-- | ||
+ | '''for''' i = end '''downto''' begin | ||
+ | '''if''' a[i] > a[i + 1] | ||
+ | swap(a[i], a[i + 1]) | ||
+ | swapped = ''true'' | ||
== См. также == | == См. также == | ||
Строка 102: | Строка 165: | ||
* [[Сортировка подсчетом]] | * [[Сортировка подсчетом]] | ||
− | == | + | == Источники информации == |
− | * [http:// | + | * [http://en.wikipedia.org/wiki/Bubble_sort Сортировка пузырьком {{---}} Википедия] |
* [http://rain.ifmo.ru/cat/view.php/vis/sorts/quadratic-2010 Визуализатор] | * [http://rain.ifmo.ru/cat/view.php/vis/sorts/quadratic-2010 Визуализатор] | ||
+ | * [http://en.wikipedia.org/wiki/Odd%E2%80%93even_sort Сортировка чет-нечет {{---}} Википедия] | ||
+ | * [http://en.wikipedia.org/wiki/Comb_sort Сортировка расческой {{---}} Википедия] | ||
+ | * [http://en.wikipedia.org/wiki/Cocktail_sort Сортировка перемешиванием {{---}} Википедия] | ||
[[Категория: Дискретная математика и алгоритмы]] | [[Категория: Дискретная математика и алгоритмы]] | ||
− | [[Категория: | + | [[Категория: Сортировка]] |
+ | [[Категория: Квадратичные сортировки]] |
Текущая версия на 19:41, 4 сентября 2022
Сортировка простыми обменами, сортировка пузырьком (англ. bubble sort) — один из квадратичных алгоритмов сортировки.
Содержание
Алгоритм
Алгоритм состоит в повторяющихся проходах по сортируемому массиву. На каждой итерации последовательно сравниваются соседние элементы, и, если порядок в паре неверный, то элементы меняют местами. За каждый проход по массиву как минимум один элемент встает на свое место, поэтому необходимо совершить не более
проходов, где размер массива, чтобы отсортировать массив.Ниже приведен псевдокод сортировки пузырьком, на вход которой подается массив
.function bubbleSort(a): for i = 0 to n - 2 for j = 0 to n - 2 if a[j] > a[j + 1] swap(a[j], a[j + 1])
Оптимизация
- Можно заметить, что после -ой итерации внешнего цикла последних элементов уже находятся на своих местах в отсортированном порядке, поэтому нет необходимости производить их сравнения друг с другом. Следовательно, внутренний цикл можно выполнять не до , а до .
- Также заметим, что если после выполнения внутреннего цикла не произошло ни одного обмена, то массив уже отсортирован, и продолжать что-то делать бессмысленно. Поэтому внутренний цикл можно выполнять не раз, а до тех пор, пока во внутреннем цикле происходят обмены.
При использовании первой оптимизации сортировка принимает следующий вид:
function bubbleSort(a): for i = 0 to n - 2 for j = 0 to n - i - 2 if a[j] > a[j + 1] swap(a[j], a[j + 1])
При использовании же обеих оптимизаций сортировка пузырьком выглядит так:
function bubbleSort(a): i = 0 t = true while t t = false for j = 0 to n - i - 2 if a[j] > a[j + 1] swap(a[j], a[j + 1]) t = true i = i + 1
Сложность
В данной сортировке выполняются всего два различных вида операции: сравнение элементов и их обмен. Поэтому время всего алгоритма
, где — время, затрачиваемое на сравнение элементов, а — время, за которое мы производим все необходимые обмены элементов.Так как в алгоритме меняться местами могут только соседние элементы, то каждый обмен уменьшает количество инверсий на единицу. Следовательно, количество обменов равно количеству инверсий в исходном массиве вне зависимости от реализации сортировки. Максимальное количество инверсий содержится в массиве, элементы которого отсортированы по убыванию. Несложно посчитать, что количество инверсий в таком массиве . Получаем, что .
В неоптимизированной реализации на каждой итерации внутреннего цикла производятся
сравнений, а так как внутренний цикл запускается также раз, то за весь алгоритм сортировки производятся сравнений.В оптимизированной версии точное количество сравнений зависит от исходного массива. Известно, что худший случай равен
, а лучший — . Следовательно, .В итоге получаем
.Пример работы алгоритма
Возьмём массив
и отсортируем значения по возрастанию, используя сортировку пузырьком. Выделены те элементы, которые сравниваются на данном этапе.
Первый проход:
До | После | Описание шага |
---|---|---|
5 1 4 2 8 | 1 5 4 2 8 | Здесь алгоритм сравнивает два первых элемента и меняет их местами. |
1 5 4 2 8 | 1 4 5 2 8 | Меняет местами, так как 5 > 4 |
1 4 5 2 8 | 1 4 2 5 8 | Меняет местами, так как 5 > 2 |
1 4 2 5 8 | 1 4 2 5 8 | Теперь, ввиду того, что элементы стоят на своих местах (8 > 5), алгоритм не меняет их местами. |
Второй проход:
До | После | Описание шага |
---|---|---|
1 4 2 5 8 | 1 4 2 5 8 | |
1 4 2 5 8 | 1 2 4 5 8 | Меняет местами, так как 4 > 2 |
1 2 4 5 8 | 1 2 4 5 8 | |
1 2 4 5 8 | 1 2 4 5 8 |
Теперь массив полностью отсортирован, но неоптимизированный алгоритм проведет еще два прохода, на которых ничего не изменится, в отличие от алгоритма, использующего вторую оптимизацию, который сделает один проход и прекратит свою работу, так как не сделает за этот проход ни одного обмена.
Модификации
Сортировка чет-нечет
Сортировка чет-нечет (англ. odd-even sort) — модификация пузырьковой сортировки, основанная на сравнении элементов стоящих на четных и нечетных позициях независимо друг от друга. Сложность —
. Псевдокод указан ниже:function oddEvenSort(a): for i = 0 to n - 1 if i mod 2 == 0 for j = 2 to n - 1 step 2 if a[j] < a[j - 1] swap(a[j - 1], a[j]) else for j = 1 to n - 1 step 2 if a[j] < a[j - 1] swap(a[j - 1], a[j])
Преимущество этой сортировки — на нескольких процессорах она выполняется быстрее, так как четные и нечетные индексы сортируются параллельно.
Сортировка расческой
Сортировка расческой (англ. comb sort) — модификация пузырьковой сортировки, основанной на сравнении элементов на расстоянии. Сложность —
, но стремится к . Является самой быстрой квадратичной сортировкой. Недостаток — она неустойчива. Псевдокод указан ниже:function combSort(a): k = 1.3 jump = n bool swapped = true while jump > 1 and swapped if jump > 1 jump /= k swapped = false for i = 0 to size - jump - 1 if a[i + jump] < a[i] swap(a[i], a[i + jump]) swapped = true
Пояснения: Изначально расстояние между сравниваемыми элементами равно
, где — оптимальное число для этого алгоритма. Сортируем массив по этому расстоянию, потом уменьшаем его по этому же правилу. Когда расстояние между сравниваемыми элементами достигает единицы, массив досортировывается обычным пузырьком.Сортировка перемешиванием
Сортировка перемешиванием (англ. cocktail sort), также известная как Шейкерная сортировка — разновидность пузырьковой сортировки, сортирующая массив в двух направлениях на каждой итерации. В среднем, сортировка перемешиванием работает в два раза быстрее пузырька. Сложность —
, но стремится она к , где — максимальное расстояние элемента в неотсортированном массиве от его позиции в отсортированном массиве. Псевдокод указан ниже:function shakerSort(a): begin = -1 end = n - 2 while swapped swapped = false begin++ for i = begin to end if a[i] > a[i + 1] swap(a[i], a[i + 1]) swapped = true if !swapped break swapped = false end-- for i = end downto begin if a[i] > a[i + 1] swap(a[i], a[i + 1]) swapped = true
См. также
- Сортировка выбором
- Сортировка вставками
- Сортировка кучей
- Сортировка слиянием
- Быстрая сортировка
- Сортировка подсчетом