Карманная сортировка — различия между версиями

Материал из Викиконспекты
Перейти к: навигация, поиск
(Нерекурсивная реализация)
м (rollbackEdits.php mass rollback)
 
(не показано 18 промежуточных версий 7 участников)
Строка 1: Строка 1:
 
+
[[Файл:Bucket-sort-example1.jpg|right|400px|thumb|Пример работы рекурсивного Bucketsort.]]
'''Карманная сортировка''' (Bucket sort)  {{---}} алгоритм сортировки, основанный на предположении о равномерном распределении входных данных.
+
'''Карманная сортировка''' (англ. ''Bucket sort'')  {{---}} алгоритм [[Сортировки|сортировки]], основанный на предположении о равномерном распределении входных данных.
 
== Алгоритм сортировки ==
 
== Алгоритм сортировки ==
 
=== Принцип работы ===
 
=== Принцип работы ===
[[Файл:Bucket-sort-example1.jpg|right|300px|thumb|Пример работы рекурсивного Bucketsort.]]
+
Для карманной сортировки нужно разбить элементы массива входных данных на <tex>k</tex> блоков (карманов, корзин). Далее каждый из таких блоков сортируется либо другой сортировкой, либо рекурсивно тем же методом разбиения. После сортировок внутри каждых блоков данные записываются в массив в порядке разбиения на блоки. При этом нужно учитывать, что данная сортировка работает только в том случае, если разбиение на блоки производится таким образом, чтобы элементы каждого следующего блока были больше предыдущего.
* элементы массива входных данных разбиваются на <tex>k</tex> блоков (карманов, корзин).
+
 
* каждый из блоков сортируется либо другой сортировкой, либо рекурсивно тем же методом разбиения.
+
Карманная сортировка сильно деградирует при большом количестве мало отличных элементов (большинство элементов попадёт в одну корзину). Поэтому такой тип сортировки использовать, когда велика вероятность того, что числа редко повторяются (например, последовательность случайных чисел).
*  из каждого отсортированного блока данные записываются в массив в порядке разбиения на блоки.
+
 
Важно отметить, что разбиение на блоки производится таким образом, чтобы элементы каждого следующего блока были бы больше предыдущего.
 
 
=== Реализация ===
 
=== Реализация ===
 
Существует несколько разных реализаций карманной сортировки.
 
Существует несколько разных реализаций карманной сортировки.
 +
 +
Рассмотрим рекурсивную и нерекурсивную реализации.
 
==== Рекурсивный bucket sort ====
 
==== Рекурсивный bucket sort ====
Рассмотрим код работы рекурсивной реализации карманной сортировки, на вход которой подаются вещественные числа.
+
Рассмотрим код работы рекурсивной реализации карманной сортировки.
<wikitex>
+
 
  Bucketsort (array,min_element,max_element)  
+
На вход подаются вещественные числа.
     if (array.length < 2 || min_element == max_element )
+
'''double[]''' bucketSort ('''double[]''' array, '''double''' minElement, '''double''' maxElement)  
      return array;
+
     '''if''' array.length < 2 '''or''' minElement == maxElement
    initialize buckets <- new array of n empty lists
+
        '''return''' array;
    initialize buckets_minimum
+
     range = maxElement - minElement
    initialize buckets_maximum
+
     '''for''' i = 0  '''to''' array.length - 1   
     range = max_element - min_element;
+
        index = int(array[i] * numBuckets / range)
     for i = 0  to array.length - 1   
+
        добавим array[i] в конец buckets[index]
      index = int(array[i] * num_buckets / range)
+
        minBucktes[index] = '''minimum'''(buckets[index], array[i])
      insert array[i] at end buckets[index]  
+
        maxBuckets[index] = '''maximum'''(buckets[index], array[i])
      buckets_minimum[i] = minimum ( buckets[index], arra[i])
+
     '''for''' i = 0 '''to''' numBuckets - 1
      buckets_maximum[i] = maximum ( buckets[index], arra[i])
+
        buckets[i] = bucketSort(buckets[i], minBucktes[i], maxBuckets[i])
     for i = 0 to num_buckets - 1
+
     '''for''' i = 0 '''to''' numBuckets - 1
      buckets[i] = quicksort (buckets[i],min_bucktes[i],max_buckets[i])
+
        '''for''' k = 0 '''to''' buckets[i].length - 1
     intialize answer
+
            добавим buckets[i][k] в конец answer
    for i = 0 to buckets_num - 1
+
     '''return''' answer
      for k = 0 to buckets[i].length - 1
+
 
        insert  buckets[i][k] аt end answer
 
     return answer  
 
</wikitex>
 
 
==== Нерекурсивная реализация ====
 
==== Нерекурсивная реализация ====
<wikitex>
+
'''double[]''' bucketSort('''double[]''' array)  
  Bucketsort(array)  
+
     minElement = Infinum
     initialize buckets <- new array of n empty lists
+
    maxElement = -Infinum
     range = max_element - min_element;
+
    '''for''' i = 0 '''to''' array.length - 1
     for i = 0  to array.length - 1   
+
        minElement = '''minimum'''(minElement, array[i])
      index = int(array[i] * num_buckets / range)
+
        maxElement = '''maximum'''(maxElement, array[i])
      insert array[i] at end buckets[index]  
+
     range = maxElement - minElement
     for i = 0 to num_buckets - 1
+
     '''for''' i = 0  '''to''' array.length - 1   
      buckets[i] = quickSort(buckets[i])
+
        index = int(array[i] * numBuckets / range)
     intialize answer
+
        добавим array[i] в конец buckets[index]
    for i = 0 to buckets_num - 1
+
     '''for''' i = 0 '''to''' numBuckets - 1
      for k = 0 to buckets[i].length - 1
+
        buckets[i] = sort(buckets[i])
        insert  buckets[i][k] аt end answer
+
     '''for''' i = 0 '''to''' numBuckets - 1
     return answer  
+
        '''for''' k = 0 '''to''' buckets[i].length - 1
</wikitex>
+
            добавим buckets[i][k] в конец answer
 +
     '''return''' answer
  
 
==Асимптотика==
 
==Асимптотика==
Строка 55: Строка 54:
 
<tex> n_i </tex> {{---}} случайная величина, обозначающая количество элементов попавших в <tex> i </tex>-ый карман.
 
<tex> n_i </tex> {{---}} случайная величина, обозначающая количество элементов попавших в <tex> i </tex>-ый карман.
  
<tex> T(n) </tex> {{---}} время работы алгоритма карманной сортировки
+
<tex> T(n) = \Theta(n) + \sum\limits_{i = 1}^k O(n_i</tex> <tex> \log n_i) + \Theta(k)</tex>, где <tex> T(n) </tex> время работы алгоритма карманной сортировки.
 
 
<tex> T(n) = \theta(n) + \sum\limits_{i = 1}^k O(n_i</tex> <tex> \log n_i) + \theta(k)</tex>
 
 
 
<tex> M(n_i) = n / k </tex>
 
 
 
Тоесть, если <tex> n \sim k </tex>  
 
  
<tex> M(T(n)) = \theta(n) </tex>
+
<tex> E[n_i] = \dfrac {n}{k} </tex>
  
Если, <tex> n = o(k) </tex>
+
То есть, если <tex> n \sim k \Rightarrow  E[T(n)] = \Theta(n) </tex>  
  
<tex> M(T(n)) = \theta(k) </tex>
+
Если, <tex> n = o(k) \Rightarrow E[T(n)] = \Theta(k)</tex>
  
 
Из приведенных выше формул, видно, что в среднем "карманная сортировка" работает за линейное время.
 
Из приведенных выше формул, видно, что в среднем "карманная сортировка" работает за линейное время.
  
==Ссылки==
+
==Источники информации==
* http://en.wikipedia.org/wiki/Bucket_sort
+
* [http://en.wikipedia.org/wiki/Bucket_sort Wikipedia — Bucket sort]
 +
* [http://ru.wikipedia.org/wiki/%D0%91%D0%BB%D0%BE%D1%87%D0%BD%D0%B0%D1%8F_%D1%81%D0%BE%D1%80%D1%82%D0%B8%D1%80%D0%BE%D0%B2%D0%BA%D0%B0 Википедия — Блочная сортировка]
 
   
 
   
* [http://www.google.ru/url?sa=t&rct=j&q=&esrc=s&source=web&cd=10&ved=0CI0BEBYwCQ&url=http%3A%2F%2Fcs.iupui.edu%2F~xkzou%2Fteaching%2FCS580%2FSortinginlineartime.ppt&ei=d7fUT8WWIs3S4QSkkPT-Ag&usg=AFQjCNEUbmlVNhSgrJKV9-QjPBwU6U0obQ&sig2=3yaysrpuwVjmyhjBCpyBeQ Презентация о линейных сортировках].
+
* [http://www.google.ru/url?sa=t&rct=j&q=&esrc=s&source=web&cd=10&ved=0CI0BEBYwCQ&url=http%3A%2F%2Fcs.iupui.edu%2F~xkzou%2Fteaching%2FCS580%2FSortinginlineartime.ppt&ei=d7fUT8WWIs3S4QSkkPT-Ag&usg=AFQjCNEUbmlVNhSgrJKV9-QjPBwU6U0obQ&sig2=3yaysrpuwVjmyhjBCpyBeQ Презентация о линейных сортировках]
* [https://www-927.ibm.com/ibm/cas/hspc/student/algorithms/BucketSort.html Приведен код на Jave рекурсивной реализации "карманной" сортировки]
+
* [https://www-927.ibm.com/ibm/cas/hspc/student/algorithms/BucketSort.html Описание алгоритма с реализацией рекурсивной версии на языке Java]
 
[[Категория: Дискретная математика и алгоритмы]]
 
[[Категория: Дискретная математика и алгоритмы]]
 
[[Категория: Сортировки]]
 
[[Категория: Сортировки]]
 +
[[Категория: Другие сортировки]]

Текущая версия на 19:15, 4 сентября 2022

Пример работы рекурсивного Bucketsort.

Карманная сортировка (англ. Bucket sort) — алгоритм сортировки, основанный на предположении о равномерном распределении входных данных.

Алгоритм сортировки

Принцип работы

Для карманной сортировки нужно разбить элементы массива входных данных на [math]k[/math] блоков (карманов, корзин). Далее каждый из таких блоков сортируется либо другой сортировкой, либо рекурсивно тем же методом разбиения. После сортировок внутри каждых блоков данные записываются в массив в порядке разбиения на блоки. При этом нужно учитывать, что данная сортировка работает только в том случае, если разбиение на блоки производится таким образом, чтобы элементы каждого следующего блока были больше предыдущего.

Карманная сортировка сильно деградирует при большом количестве мало отличных элементов (большинство элементов попадёт в одну корзину). Поэтому такой тип сортировки использовать, когда велика вероятность того, что числа редко повторяются (например, последовательность случайных чисел).

Реализация

Существует несколько разных реализаций карманной сортировки.

Рассмотрим рекурсивную и нерекурсивную реализации.

Рекурсивный bucket sort

Рассмотрим код работы рекурсивной реализации карманной сортировки.

На вход подаются вещественные числа.

double[] bucketSort (double[] array, double minElement, double maxElement) 
   if array.length < 2 or minElement == maxElement
       return array;
   range = maxElement - minElement
   for i = 0  to array.length - 1  
       index = int(array[i] * numBuckets / range)
       добавим array[i] в конец buckets[index]
       minBucktes[index] = minimum(buckets[index], array[i])
       maxBuckets[index] = maximum(buckets[index], array[i])
   for i = 0 to numBuckets - 1
       buckets[i] = bucketSort(buckets[i], minBucktes[i], maxBuckets[i])
   for i = 0 to numBuckets - 1
       for k = 0 to buckets[i].length - 1
           добавим buckets[i][k] в конец answer
   return answer

Нерекурсивная реализация

double[] bucketSort(double[] array) 
   minElement = Infinum
   maxElement = -Infinum
   for i = 0 to array.length - 1
       minElement = minimum(minElement, array[i])
       maxElement = maximum(maxElement, array[i]) 
   range = maxElement - minElement
   for i = 0  to array.length - 1  
       index = int(array[i] * numBuckets / range)
       добавим array[i] в конец buckets[index]
   for i = 0 to numBuckets - 1
       buckets[i] = sort(buckets[i])
   for i = 0 to numBuckets - 1
       for k = 0 to buckets[i].length - 1
           добавим buckets[i][k] в конец answer
   return answer

Асимптотика

Пусть [math]n[/math] — количество элементов в массиве, [math]k[/math] — количество блоков для разбиения.

[math] n_i [/math] — случайная величина, обозначающая количество элементов попавших в [math] i [/math]-ый карман.

[math] T(n) = \Theta(n) + \sum\limits_{i = 1}^k O(n_i[/math] [math] \log n_i) + \Theta(k)[/math], где [math] T(n) [/math] время работы алгоритма карманной сортировки.

[math] E[n_i] = \dfrac {n}{k} [/math]

То есть, если [math] n \sim k \Rightarrow E[T(n)] = \Theta(n) [/math]

Если, [math] n = o(k) \Rightarrow E[T(n)] = \Theta(k)[/math]

Из приведенных выше формул, видно, что в среднем "карманная сортировка" работает за линейное время.

Источники информации