Сортировка пузырьком — различия между версиями

Материал из Викиконспекты
Перейти к: навигация, поиск
(Модификации)
м (rollbackEdits.php mass rollback)
 
(не показано 109 промежуточных версий 5 участников)
Строка 4: Строка 4:
 
Алгоритм состоит в повторяющихся проходах по сортируемому массиву. На каждой итерации последовательно сравниваются соседние элементы, и, если порядок в паре неверный, то элементы меняют местами. За каждый проход по массиву как минимум один элемент встает на свое место, поэтому необходимо совершить не более <tex> n - 1 </tex> проходов, где <tex> n </tex> размер массива, чтобы отсортировать массив.
 
Алгоритм состоит в повторяющихся проходах по сортируемому массиву. На каждой итерации последовательно сравниваются соседние элементы, и, если порядок в паре неверный, то элементы меняют местами. За каждый проход по массиву как минимум один элемент встает на свое место, поэтому необходимо совершить не более <tex> n - 1 </tex> проходов, где <tex> n </tex> размер массива, чтобы отсортировать массив.
  
== Псевдокод ==
+
Ниже приведен псевдокод сортировки пузырьком, на вход которой подается массив <tex> a[0..n - 1] </tex>.
Ниже приведен псевдокод сортировки пузырьком, на вход которой подается массив <tex> A[0..n - 1] </tex>.
+
'''function''' bubbleSort(a):
  BubbleSort(A)
+
  '''for''' i = 0 '''to''' n - 2
    '''for''' i = 0 '''to''' n - 2:
+
    '''for''' j = 0 '''to''' n - 2
      '''for''' j = 0 '''to''' n - 2:
+
      '''if''' a[j] > a[j + 1]
        '''if''' A[j] > A[j + 1]:
+
        swap(a[j], a[j + 1])
          swap(A[j], A[j + 1]);
 
  
 
== Оптимизация ==
 
== Оптимизация ==
Строка 17: Строка 16:
  
 
При использовании первой оптимизации сортировка принимает следующий вид:
 
При использовании первой оптимизации сортировка принимает следующий вид:
  BubbleSort(A)
+
'''function''' bubbleSort(a):
    '''for''' i = 0 '''to''' n - 2:
+
  '''for''' i = 0 '''to''' n - 2
      '''for''' j = 0 '''to''' n - i - 2:
+
    '''for''' j = 0 '''to''' n - i - 2
        '''if''' A[j] > A[j + 1]:
+
      '''if''' a[j] > a[j + 1]
          swap(A[j], A[j + 1]);
+
        swap(a[j], a[j + 1])
  
 
При использовании же обеих оптимизаций сортировка пузырьком выглядит так:
 
При использовании же обеих оптимизаций сортировка пузырьком выглядит так:
  BubbleSort(A)
+
'''function''' bubbleSort(a):
    i = 0;
+
  i = 0
    t = ''true'';
+
  t = ''true''
    '''while''' t:
+
  '''while''' t
      t = ''false'';
+
    t = ''false''
      '''for''' j = 0 '''to''' n - i - 2:
+
    '''for''' j = 0 '''to''' n - i - 2
        '''if''' A[j] > A[j + 1]:
+
      '''if''' a[j] > a[j + 1]
          swap(A[j], A[j + 1]);
+
        swap(a[j], a[j + 1])
          t = ''true;''
+
        t = ''true''
      i = i + 1;
+
    i = i + 1
  
 
== Сложность ==
 
== Сложность ==
 
В данной сортировке выполняются всего два различных вида операции: сравнение элементов и их обмен. Поэтому время всего алгоритма <tex> T = T_1 + T_2 </tex>, где <tex> T_1 </tex> {{---}} время, затрачиваемое на сравнение элементов, а <tex> T_2 </tex> {{---}} время, за которое мы производим все необходимые обмены элементов.
 
В данной сортировке выполняются всего два различных вида операции: сравнение элементов и их обмен. Поэтому время всего алгоритма <tex> T = T_1 + T_2 </tex>, где <tex> T_1 </tex> {{---}} время, затрачиваемое на сравнение элементов, а <tex> T_2 </tex> {{---}} время, за которое мы производим все необходимые обмены элементов.
  
Так как в алгоритме меняться местами могут только соседние элементы, то каждый обмен уменьшает количество [[Таблица инверсий|инверсий]] на единицу. Следовательно, количество обменов равно количеству инверсий в исходном массиве вне зависимости от реализации сортировки. Максимальное количество инверсий содержится в массиве, элементы которого отсортированы по убыванию. Несложно посчитать, что количество инверсий в таком массиве <tex> \frac {n (n - 1)} {2} </tex>. Получаем, что <tex> T_2 = O(n^2) </tex>.
+
Так как в алгоритме меняться местами могут только соседние элементы, то каждый обмен уменьшает количество [[Таблица инверсий|инверсий]] на единицу. Следовательно, количество обменов равно количеству инверсий в исходном массиве вне зависимости от реализации сортировки. Максимальное количество инверсий содержится в массиве, элементы которого отсортированы по убыванию. Несложно посчитать, что количество инверсий в таком массиве <tex dpi=150> \frac {n (n - 1)} {2} </tex>. Получаем, что <tex> T_2 = O(n^2) </tex>.
  
 
В неоптимизированной реализации на каждой итерации внутреннего цикла производятся <tex> n - 1 </tex> сравнений, а так как внутренний цикл запускается также <tex> n - 1 </tex> раз, то за весь алгоритм сортировки производятся <tex> (n - 1)^2 </tex> сравнений.
 
В неоптимизированной реализации на каждой итерации внутреннего цикла производятся <tex> n - 1 </tex> сравнений, а так как внутренний цикл запускается также <tex> n - 1 </tex> раз, то за весь алгоритм сортировки производятся <tex> (n - 1)^2 </tex> сравнений.
  
В оптимизированной версии точное количество сравнений зависит от исходного массива. Но точно известно, что их количество не меньше, чем количество обменов, и не больше, чем <tex> (n - 1)^2 </tex> {{---}} максимальное количество сравнений для данной сортировки. Следовательно, <tex> T_1 = O(n^2) </tex>.
+
В оптимизированной версии точное количество сравнений зависит от исходного массива. Известно, что худший случай равен <tex dpi=150> \frac {n (n - 1)} {2} </tex>, а лучший {{---}} <tex> n-1 </tex>. Следовательно, <tex> T_1 = O(n^2) </tex>.
  
 
В итоге получаем <tex> T = T_1 + T_2 = O(n^2) + O(n^2) = O(n^2) </tex>.
 
В итоге получаем <tex> T = T_1 + T_2 = O(n^2) + O(n^2) = O(n^2) </tex>.
Строка 48: Строка 47:
 
== Пример работы алгоритма ==
 
== Пример работы алгоритма ==
  
Возьмём массив с числами «5 1 4 2 и отсортируем значения по возрастанию, используя сортировку пузырьком. Выделены те элементы, которые сравниваются на данном этапе.
+
Возьмём массив <tex> [5, 1, 4, 2, 8] </tex> и отсортируем значения по возрастанию, используя сортировку пузырьком. Выделены те элементы, которые сравниваются на данном этапе.
  
  
Строка 99: Строка 98:
 
|}
 
|}
  
Теперь массив полностью отсортирован, но неоптимизированный алгоритм проведет еще два прохода, на которых ничего не изменится, в отличии от алгоритма, использующего вторую оптимизацию, который сделает один проход и прекратит свою работу, так как не сделает за этот проход ни одного обмена.
+
Теперь массив полностью отсортирован, но неоптимизированный алгоритм проведет еще два прохода, на которых ничего не изменится, в отличие от алгоритма, использующего вторую оптимизацию, который сделает один проход и прекратит свою работу, так как не сделает за этот проход ни одного обмена.
  
 
== Модификации ==
 
== Модификации ==
Сортировка чет-нечет(англ. Odd-even sort) - модификация пузырьковой сортировки, основанной на сравнении элементов стоящих на четных и нечетных позициях независимо друг от друга. Сложность - <tex> O(n^2) </tex>.
 
  
Сортировка расческой(англ. Comb sort) - модификация пузырьковой сортировки, основанной на сравнении элементов на расстоянии. По мере упорядочивания массива это расстояние уменьшается и как только оно достигает 1, массив "досортировывается" обычным пузырьком. Сложность - <tex> O(nlog(n)) </tex>.
+
=== Сортировка чет-нечет ===
 +
'''Сортировка чет-нечет''' (англ. ''odd-even sort'') {{---}} модификация пузырьковой сортировки, основанная на сравнении элементов стоящих на четных и нечетных позициях независимо друг от друга. Сложность {{---}} <tex> O(n^2) </tex>.
 +
Псевдокод указан ниже:
 +
'''function''' oddEvenSort(a):
 +
  '''for''' i = 0 '''to''' n - 1
 +
    '''if''' i '''mod''' 2 == 0
 +
      '''for''' j = 2 '''to''' n - 1 '''step''' 2
 +
        '''if''' a[j] < a[j - 1]
 +
          swap(a[j - 1], a[j]) 
 +
    '''else'''     
 +
      '''for''' j = 1 '''to''' n - 1 '''step''' 2
 +
        '''if''' a[j] < a[j - 1]
 +
          swap(a[j - 1], a[j])
  
Сортировка перемешиванием(англ. Cocktail sort), также известная как Шейкерная сортировка - разновидность пузырьковой сортировки, сортирующая массив в 2 направлениях на каждой итерации. В среднем, сортировка перемешиванием работает в 2 раза быстрее пузырька. Сложность - <tex> O(N^2) </tex>.
+
Преимущество этой сортировки {{---}} на нескольких процессорах она выполняется быстрее, так как четные и нечетные индексы сортируются параллельно.
 +
 
 +
=== Сортировка расческой ===
 +
'''Сортировка расческой''' (англ. ''comb sort'')  {{---}} модификация пузырьковой сортировки, основанной на сравнении элементов на расстоянии.  Сложность  {{---}} <tex> O(n^2) </tex>, но стремится к <tex>        O(n \log n) </tex>.  Является самой быстрой квадратичной сортировкой. Недостаток {{---}} она неустойчива. Псевдокод указан ниже:
 +
 
 +
'''function''' combSort(a):
 +
  k = 1.3
 +
  jump = n
 +
  '''bool''' swapped = ''true''
 +
  '''while''' jump > 1 '''and''' swapped
 +
    '''if''' jump > 1
 +
      jump /= k
 +
    swapped = ''false''
 +
    '''for''' i = 0 '''to''' size - jump - 1
 +
      '''if''' a[i + jump] < a[i]
 +
        swap(a[i], a[i + jump])
 +
        swapped = ''true''
 +
Пояснения: Изначально расстояние между сравниваемыми элементами равно <tex dpi=150> \frac{n}{k} </tex>, где <tex> k = 1{.}3 </tex> {{---}} оптимальное число для этого алгоритма. Сортируем массив по этому расстоянию, потом уменьшаем его по этому же правилу. Когда  расстояние между сравниваемыми элементами достигает единицы, массив досортировывается обычным пузырьком.
 +
 
 +
=== Сортировка перемешиванием ===
 +
'''Сортировка перемешиванием''' (англ. ''cocktail sort''), также известная как '''Шейкерная сортировка'''  {{---}} разновидность пузырьковой сортировки, сортирующая массив в двух направлениях на каждой итерации. В среднем, сортировка перемешиванием работает в два раза быстрее пузырька. Сложность {{---}} <tex> O(n^2) </tex>, но стремится она к <tex> O(k \cdot n) </tex>, где <tex> k </tex> {{---}} максимальное расстояние элемента в неотсортированном массиве от его позиции в отсортированном массиве. Псевдокод указан ниже:
 +
 
 +
'''function''' shakerSort(a):
 +
  begin = -1
 +
  end = n - 2
 +
  '''while''' swapped
 +
    swapped = ''false'' 
 +
    begin++
 +
    '''for''' i = begin '''to''' end
 +
      '''if''' a[i] > a[i + 1]
 +
        swap(a[i], a[i + 1])
 +
        swapped = ''true''   
 +
    '''if''' !swapped
 +
      '''break'''   
 +
    swapped = ''false''
 +
    end--
 +
    '''for''' i = end '''downto''' begin
 +
      '''if''' a[i] > a[i + 1]
 +
        swap(a[i], a[i + 1])
 +
        swapped = ''true''
  
 
== См. также ==
 
== См. также ==
Строка 116: Строка 165:
 
* [[Сортировка подсчетом]]
 
* [[Сортировка подсчетом]]
  
== Ссылки ==
+
== Источники информации ==
* [http://en.wikipedia.org/wiki/Bubble_sort Сортировка пузырьком Википедия]
+
* [http://en.wikipedia.org/wiki/Bubble_sort Сортировка пузырьком {{---}} Википедия]
 
* [http://rain.ifmo.ru/cat/view.php/vis/sorts/quadratic-2010 Визуализатор]
 
* [http://rain.ifmo.ru/cat/view.php/vis/sorts/quadratic-2010 Визуализатор]
* [http://en.wikipedia.org/wiki/Odd%E2%80%93even_sort  Сортировка чет-нечет - Википедия]
+
* [http://en.wikipedia.org/wiki/Odd%E2%80%93even_sort  Сортировка чет-нечет {{---}} Википедия]
* [http://en.wikipedia.org/wiki/Comb_sort Сортировка расческой - Википедия]
+
* [http://en.wikipedia.org/wiki/Comb_sort Сортировка расческой {{---}} Википедия]
* [http://en.wikipedia.org/wiki/Cocktail_sort Сортировка перемешиванием- Википедия]
+
* [http://en.wikipedia.org/wiki/Cocktail_sort Сортировка перемешиванием {{---}} Википедия]
  
 
[[Категория: Дискретная математика и алгоритмы]]
 
[[Категория: Дискретная математика и алгоритмы]]
[[Категория: Сортировки]]
+
[[Категория: Сортировка]]
 +
[[Категория: Квадратичные сортировки]]

Текущая версия на 19:41, 4 сентября 2022

Сортировка простыми обменами, сортировка пузырьком (англ. bubble sort) — один из квадратичных алгоритмов сортировки.

Алгоритм

Алгоритм состоит в повторяющихся проходах по сортируемому массиву. На каждой итерации последовательно сравниваются соседние элементы, и, если порядок в паре неверный, то элементы меняют местами. За каждый проход по массиву как минимум один элемент встает на свое место, поэтому необходимо совершить не более [math] n - 1 [/math] проходов, где [math] n [/math] размер массива, чтобы отсортировать массив.

Ниже приведен псевдокод сортировки пузырьком, на вход которой подается массив [math] a[0..n - 1] [/math].

function bubbleSort(a):
  for i = 0 to n - 2
    for j = 0 to n - 2
      if a[j] > a[j + 1]
        swap(a[j], a[j + 1])

Оптимизация

  • Можно заметить, что после [math] i [/math]-ой итерации внешнего цикла [math] i [/math] последних элементов уже находятся на своих местах в отсортированном порядке, поэтому нет необходимости производить их сравнения друг с другом. Следовательно, внутренний цикл можно выполнять не до [math] n - 2 [/math], а до [math] n - i - 2 [/math].
  • Также заметим, что если после выполнения внутреннего цикла не произошло ни одного обмена, то массив уже отсортирован, и продолжать что-то делать бессмысленно. Поэтому внутренний цикл можно выполнять не [math] n - 1 [/math] раз, а до тех пор, пока во внутреннем цикле происходят обмены.

При использовании первой оптимизации сортировка принимает следующий вид:

function bubbleSort(a):
  for i = 0 to n - 2
    for j = 0 to n - i - 2
      if a[j] > a[j + 1]
        swap(a[j], a[j + 1])

При использовании же обеих оптимизаций сортировка пузырьком выглядит так:

function bubbleSort(a):
  i = 0
  t = true
  while t
    t = false
    for j = 0 to n - i - 2
      if a[j] > a[j + 1]
        swap(a[j], a[j + 1])
        t = true
    i = i + 1

Сложность

В данной сортировке выполняются всего два различных вида операции: сравнение элементов и их обмен. Поэтому время всего алгоритма [math] T = T_1 + T_2 [/math], где [math] T_1 [/math] — время, затрачиваемое на сравнение элементов, а [math] T_2 [/math] — время, за которое мы производим все необходимые обмены элементов.

Так как в алгоритме меняться местами могут только соседние элементы, то каждый обмен уменьшает количество инверсий на единицу. Следовательно, количество обменов равно количеству инверсий в исходном массиве вне зависимости от реализации сортировки. Максимальное количество инверсий содержится в массиве, элементы которого отсортированы по убыванию. Несложно посчитать, что количество инверсий в таком массиве [math] \frac {n (n - 1)} {2} [/math]. Получаем, что [math] T_2 = O(n^2) [/math].

В неоптимизированной реализации на каждой итерации внутреннего цикла производятся [math] n - 1 [/math] сравнений, а так как внутренний цикл запускается также [math] n - 1 [/math] раз, то за весь алгоритм сортировки производятся [math] (n - 1)^2 [/math] сравнений.

В оптимизированной версии точное количество сравнений зависит от исходного массива. Известно, что худший случай равен [math] \frac {n (n - 1)} {2} [/math], а лучший — [math] n-1 [/math]. Следовательно, [math] T_1 = O(n^2) [/math].

В итоге получаем [math] T = T_1 + T_2 = O(n^2) + O(n^2) = O(n^2) [/math].

Пример работы алгоритма

Возьмём массив [math] [5, 1, 4, 2, 8] [/math] и отсортируем значения по возрастанию, используя сортировку пузырьком. Выделены те элементы, которые сравниваются на данном этапе.


Первый проход:

До После Описание шага
5 1 4 2 8 1 5 4 2 8 Здесь алгоритм сравнивает два первых элемента и меняет их местами.
1 5 4 2 8 1 4 5 2 8 Меняет местами, так как 5 > 4
1 4 5 2 8 1 4 2 5 8 Меняет местами, так как 5 > 2
1 4 2 5 8 1 4 2 5 8 Теперь, ввиду того, что элементы стоят на своих местах (8 > 5), алгоритм не меняет их местами.

Второй проход:

До После Описание шага
1 4 2 5 8 1 4 2 5 8
1 4 2 5 8 1 2 4 5 8 Меняет местами, так как 4 > 2
1 2 4 5 8 1 2 4 5 8
1 2 4 5 8 1 2 4 5 8

Теперь массив полностью отсортирован, но неоптимизированный алгоритм проведет еще два прохода, на которых ничего не изменится, в отличие от алгоритма, использующего вторую оптимизацию, который сделает один проход и прекратит свою работу, так как не сделает за этот проход ни одного обмена.

Модификации

Сортировка чет-нечет

Сортировка чет-нечет (англ. odd-even sort) — модификация пузырьковой сортировки, основанная на сравнении элементов стоящих на четных и нечетных позициях независимо друг от друга. Сложность — [math] O(n^2) [/math]. Псевдокод указан ниже:

function oddEvenSort(a):
  for i = 0 to n - 1 
    if i mod 2 == 0
      for j = 2 to n - 1 step 2
        if a[j] < a[j - 1]
          swap(a[j - 1], a[j])  
    else      
      for j = 1 to n - 1 step 2
        if a[j] < a[j - 1]
          swap(a[j - 1], a[j])

Преимущество этой сортировки — на нескольких процессорах она выполняется быстрее, так как четные и нечетные индексы сортируются параллельно.

Сортировка расческой

Сортировка расческой (англ. comb sort) — модификация пузырьковой сортировки, основанной на сравнении элементов на расстоянии. Сложность — [math] O(n^2) [/math], но стремится к [math] O(n \log n) [/math]. Является самой быстрой квадратичной сортировкой. Недостаток — она неустойчива. Псевдокод указан ниже:

function combSort(a):
  k = 1.3
  jump = n
  bool swapped = true
  while jump > 1 and swapped
    if jump > 1
      jump /= k
    swapped = false
    for i = 0 to size - jump - 1
      if a[i + jump] < a[i]
        swap(a[i], a[i + jump])
        swapped = true

Пояснения: Изначально расстояние между сравниваемыми элементами равно [math] \frac{n}{k} [/math], где [math] k = 1{.}3 [/math] — оптимальное число для этого алгоритма. Сортируем массив по этому расстоянию, потом уменьшаем его по этому же правилу. Когда расстояние между сравниваемыми элементами достигает единицы, массив досортировывается обычным пузырьком.

Сортировка перемешиванием

Сортировка перемешиванием (англ. cocktail sort), также известная как Шейкерная сортировка — разновидность пузырьковой сортировки, сортирующая массив в двух направлениях на каждой итерации. В среднем, сортировка перемешиванием работает в два раза быстрее пузырька. Сложность — [math] O(n^2) [/math], но стремится она к [math] O(k \cdot n) [/math], где [math] k [/math] — максимальное расстояние элемента в неотсортированном массиве от его позиции в отсортированном массиве. Псевдокод указан ниже:

function shakerSort(a):
  begin = -1
  end = n - 2
  while swapped
    swapped = false   
    begin++
    for i = begin to end 
      if a[i] > a[i + 1] 
        swap(a[i], a[i + 1])
        swapped = true    
    if !swapped
      break    
    swapped = false 
    end--
    for i = end downto begin
      if a[i] > a[i + 1] 
        swap(a[i], a[i + 1])
        swapped = true

См. также

Источники информации