Сортировка подсчетом сложных объектов — различия между версиями
Murtaught (обсуждение | вклад) (Добавлены иллюстрации-примеры) |
Murtaught (обсуждение | вклад) (Новое разбиение на разделы, псевдокод, анализ) |
||
Строка 1: | Строка 1: | ||
{{В разработке}} | {{В разработке}} | ||
+ | == Постановка задачи == | ||
Иногда бывает очень желательно применить быстрый алгоритм [[Сортировка подсчетом|сортировки подсчетом]] для упорядочивания набора каких-либо "сложных" данных. Под "сложными объектами" здесь подразумеваются структуры, содержащие в себе несколько полей. Одно из них мы выделим и назовем ключом, сортировка будет идти именно по нему (предполагается, что значения, принимаемые ключом - целые числа в диапазоне от <tex>0</tex> до <tex>k-1</tex>). | Иногда бывает очень желательно применить быстрый алгоритм [[Сортировка подсчетом|сортировки подсчетом]] для упорядочивания набора каких-либо "сложных" данных. Под "сложными объектами" здесь подразумеваются структуры, содержащие в себе несколько полей. Одно из них мы выделим и назовем ключом, сортировка будет идти именно по нему (предполагается, что значения, принимаемые ключом - целые числа в диапазоне от <tex>0</tex> до <tex>k-1</tex>). | ||
Строка 16: | Строка 17: | ||
== Подсчет числа различных ключей == | == Подсчет числа различных ключей == | ||
+ | === Описание === | ||
Здесь исходная последовательность из <tex>n</tex> структур хранится в массиве <tex>A</tex>, а отсортированная - в массиве <tex>B</tex> того же размера. Кроме того используется вспомогательный массив <tex>P</tex> с индексами от <tex>0</tex> до <tex>k-1</tex>. | Здесь исходная последовательность из <tex>n</tex> структур хранится в массиве <tex>A</tex>, а отсортированная - в массиве <tex>B</tex> того же размера. Кроме того используется вспомогательный массив <tex>P</tex> с индексами от <tex>0</tex> до <tex>k-1</tex>. | ||
Строка 37: | Строка 39: | ||
Стоит также отметить, что эта сортировка является устойчивой, так как два элемента с одинаковыми ключами будут добавлены в том же порядке, в каком просматривались в исходном массиве <tex>A</tex>. | Стоит также отметить, что эта сортировка является устойчивой, так как два элемента с одинаковыми ключами будут добавлены в том же порядке, в каком просматривались в исходном массиве <tex>A</tex>. | ||
− | ==Источники== | + | === Псевдокод === |
+ | |||
+ | Здесь <tex>A</tex> и <tex>B</tex> {{---}} массивы структур размера <tex>n</tex>, с индексами от <tex>0</tex> до <tex>n-1</tex>. | ||
+ | <tex>P</tex> {{---}} целочисленный массив размера <tex>k</tex> (<tex>k</tex> - количество различных ключей), с индексами от <tex>0</tex> до <tex>k-1</tex>. <tex>i</tex>, <tex>carry</tex>, <tex>temporary</tex> {{---}} целочисленные переменные. | ||
+ | |||
+ | ComplexCountingSort | ||
+ | for i = 0 to k - 1 | ||
+ | P[i] = 0; | ||
+ | |||
+ | for i = 0 to length[A] - 1 | ||
+ | P[A[i].key] = P[A[i].key] + 1; | ||
+ | |||
+ | carry = 0; | ||
+ | for i = 0 to k - 1 | ||
+ | temporary = P[i]; | ||
+ | P[i] = carry; | ||
+ | carry = carry + P[i]; | ||
+ | |||
+ | for i = 0 to length[A] - 1 | ||
+ | B[P[A[i].key]] = A[i]; | ||
+ | P[A[i].key] = P[A[i].key] + 1; | ||
+ | |||
+ | Здесь шаги 3 и 4 из описания объединены в один цикл. | ||
+ | Обратите внимание, что в последнем цикле инструкцией | ||
+ | B[P[A[i].key]] = A[i]; | ||
+ | копируется структура <tex>A[i]</tex> целиком, а не только её ключ. | ||
+ | |||
+ | === Анализ === | ||
+ | Весь алгоритм состоит из двух проходов по массиву <tex>A</tex> размера <tex>n</tex> и одного прохода по массиву <tex>P</tex>, размера <tex>k</tex>. | ||
+ | Его трудоемкость, таким образом, равна <tex> O(n + k)</tex>. На практике сортировку подсчетом имеет смысл применять, если <tex>k</tex> значительно меньше <tex>n</tex>, поэтому можно считать время работы алгоритма равным <tex> O(n)</tex>. | ||
+ | Как и в обычной сортировке подсчетом, алгоритму требуется <tex> O(n + k)</tex> дополнительной памяти. | ||
+ | |||
+ | == Источники == | ||
* [http://ru.wikipedia.org/wiki/Сортировка_подсчётом Википедия {{---}} Сортировка подсчетом] | * [http://ru.wikipedia.org/wiki/Сортировка_подсчётом Википедия {{---}} Сортировка подсчетом] | ||
* [http://en.wikipedia.org/wiki/Counting_sort Wikipedia {{---}} Counting sort] | * [http://en.wikipedia.org/wiki/Counting_sort Wikipedia {{---}} Counting sort] |
Версия 15:08, 17 мая 2012
Содержание
Постановка задачи
Иногда бывает очень желательно применить быстрый алгоритм сортировки подсчетом для упорядочивания набора каких-либо "сложных" данных. Под "сложными объектами" здесь подразумеваются структуры, содержащие в себе несколько полей. Одно из них мы выделим и назовем ключом, сортировка будет идти именно по нему (предполагается, что значения, принимаемые ключом - целые числа в диапазоне от до ).
Мы не сможем использовать здесь в точности тот же алгоритм, что и для сортировки подсчетом обычных целых чисел, потому что в наборе могут быть различные структуры, имеющие одинаковые ключи. Существует два способа справиться с этой проблемой — использовать списки для хранения структур в отсортированном массиве или заранее посчитать количество структур с одинаковыми ключами для каждого значения ключа.
Использование списков
Пусть далее исходная последовательность из
структур хранится в массиве , а отсортированная - в массиве с индексами от до .Сделаем из каждой ячейки массива
список, в который будем добавлять структуры с одинаковыми ключами.Этот вариант плох тем, что надо поддерживать сам список, что не является самым простым решением. Еще придется хранить дополнительную информацию в виде ссылок на следующий элемент в списке. И кроме того, такое представление отсортированного массива неудобно в использовании. Избавиться от этих недостатков можно используя другую модификацию алгоритма сортировки подсчетом.
Подсчет числа различных ключей
Описание
Здесь исходная последовательность из
структур хранится в массиве , а отсортированная - в массиве того же размера. Кроме того используется вспомогательный массив с индексами от до .- Пройдем по исходному массиву и запишем в количество структур, ключ которых равен .
- Мысленно разобьем массив на блоков, длина каждого из которых равна соответственно , , ..., .
- Теперь массив нам больше не нужен. Превратим его в массив, хранящий в сумму элементов от до старого массива .
- Теперь "сдвинем" массив
Это можно сделать за один проход по массиву , причем одновременно с предыдущим шагом.
После этого действия в массиве будут хранится индексы массива . указывает на начало блока в , соответствующего ключу . на элемент вперед: в новом массиве , а для , где - старый массив .
- Произведем саму сортировку. Еще раз пройдем по исходному массиву и для всех будем помещать структуру в массив на место , а затем увеличивать на . Здесь — это ключ структуры, находящейся в массиве на -том месте.
Таким образом после завершения алгоритма в
будет содержаться исходная последовательность в отсортированном виде (так как блоки расположены по возрастанию соответствующих ключей).Стоит также отметить, что эта сортировка является устойчивой, так как два элемента с одинаковыми ключами будут добавлены в том же порядке, в каком просматривались в исходном массиве
.Псевдокод
Здесь
и — массивы структур размера , с индексами от до . — целочисленный массив размера ( - количество различных ключей), с индексами от до . , , — целочисленные переменные.ComplexCountingSort for i = 0 to k - 1 P[i] = 0; for i = 0 to length[A] - 1 P[A[i].key] = P[A[i].key] + 1; carry = 0; for i = 0 to k - 1 temporary = P[i]; P[i] = carry; carry = carry + P[i]; for i = 0 to length[A] - 1 B[P[A[i].key]] = A[i]; P[A[i].key] = P[A[i].key] + 1;
Здесь шаги 3 и 4 из описания объединены в один цикл. Обратите внимание, что в последнем цикле инструкцией
B[P[A[i].key]] = A[i];
копируется структура
целиком, а не только её ключ.Анализ
Весь алгоритм состоит из двух проходов по массиву
размера и одного прохода по массиву , размера . Его трудоемкость, таким образом, равна . На практике сортировку подсчетом имеет смысл применять, если значительно меньше , поэтому можно считать время работы алгоритма равным . Как и в обычной сортировке подсчетом, алгоритму требуется дополнительной памяти.Источники
- Википедия — Сортировка подсчетом
- Wikipedia — Counting sort
- Кормен Т., Лейзерсон Ч., Ривест Р. Алгоритмы: построение и анализ. — 2-е изд. — М.: Издательский дом «Вильямс», 2007. — С. 224-226.