Cортировка слиянием с использованием O(1) дополнительной памяти

Материал из Викиконспекты
Перейти к: навигация, поиск

На вход алгоритм получает массив, который состоит из двух отсортированных частей. Нам необходимо за [math]O(1)[/math] дополнительной памяти и [math]O(n)[/math] времени получить отсортированный массив.

Алгоритм

У нас есть массив, который состоит из двух отсортированных частей:

Merge O(1) 1.png

Разобьем наш массив на [math]cnt[/math] подряд идущих блоков длиной [math]len = \lfloor \sqrt{n} \rfloor [/math]. Остаток трогать не будем.

Merge O(1) 2.png

Найдем блок, содержащий конец первой отсортированной части. Поменяем его с последним блоком. В дальнейшем будем использовать его как буфер обмена.

Merge O(1) 3.png

Отсортируем блоки по возрастанию по первому элементу (если первые элементы равны, тогда по последнему).

Merge O(1) 3.5.png

Для этого подойдет любая квадратичная или более быстрая сортировка, которая требует [math] O (1) [/math] дополнительной памяти. Для линейной асимптотики надо использовать алгоритм, линейный по числу обменов, т.е. подходит сортировка выбором.

Так как блоков [math] \sqrt{n} [/math], то количество операций на этом шаге [math] O(n) [/math].

Merge O(1) 4.png

Следует заметить, что, после сортировки этих блоков, элементы, которые стоят левее заданного и больше его, находились в противоположной части отсортированного массива, также они находятся в пределах одной группы, поэтому количество инверсий для каждого элемента не больше [math]\sqrt{n}[/math].

Пользуясь буфером обмена, последовательно сольем пары соседних блоков (процесс слияния блоков описан ниже) [math]([0, ~ len - 1][/math] и [math][len, ~ 2 ~ len - 1],[/math] потом [math][len, ~ 2 ~ len - 1][/math] и [math][2 ~ len, ~ 3 ~ len - 1],[/math] и т.д.[math])[/math]. Так как после предыдущего шага количество инверсий для каждого элемента не больше [math]\sqrt{n}[/math], то ему надо сдвинуться влево не больше, чем на [math]\sqrt{n}[/math] элементов, поэтому в результате мы получим, что первые [math]len \cdot (cnt - 1)[/math] элементов исходного массива отсортированы.

Количество блоков [math] \sqrt{n} [/math] и каждое слияние работает за [math] О O(\sqrt{n}) [/math] , поэтому количество операций на этом шаге [math] O(n) [/math].

Merge O(1) 5.png

[math]S[/math] — размер остатка вместе с буфером. Используя квадратичную или более быструю сортировку, которая требует [math] O(1) [/math] дополнительной памяти, отсортируем подмассив длиной [math] 2S [/math], который находится в конце.

Так как [math]S \lt 2 \sqrt{n}[/math], то сортировка пройдет за [math]O(n)[/math].

Merge O(1) 6.png

Теперь на последних [math] S [/math] местах будут находиться [math] S [/math] максимальных элементов. Оставшаяся часть представляет собой массив, содержащий две отсортированные части, причем размер второй равен [math] S [/math]. По аналогии с тем что делали раньше, только в обратную сторону, отсортируем оставшуюся часть, разделив ее на блоки длиной [math]S[/math], используя последние [math]S[/math] как буфер обмена. Не забудем после отсортировать буфер обмена.

Merge O(1) 7.png

В результате мы получили отсортированный исходный массив.

Использование буфера обмена

Попытаемся слить первый и второй блок. Поменяем местами первый блок с буфером обмена. И, как в обычном слиянии, пользуясь двумя указателями, сливаем второй блок и только что измененный буфер. Результат начинаем записывать с начала первого блока. Чтобы не потерять данные, вместо записи используем обмен элементов. Так как блоки имеют одинаковую длину и между указателем на второй блок и указателем на запись расстояние равно длине блока, то слияние произойдет корректно.

Merge O(1) buffer.png

Ссылки и литература