Сортировка слиянием — различия между версиями

Материал из Викиконспекты
Перейти к: навигация, поиск
(Принцип работы)
Строка 2: Строка 2:
 
'''Сортировка слиянием''' — алгоритм сортировки. Он был пред­ло­жен Джо­ном фон Ней­ма­ном в 1945 го­ду.
 
'''Сортировка слиянием''' — алгоритм сортировки. Он был пред­ло­жен Джо­ном фон Ней­ма­ном в 1945 го­ду.
  
Это устойчивый ал­го­ритм, использующий <tex>O(n)</tex> дополнительной памяти и <tex>O(n</tex> <tex>\log(n))</tex> времени.
+
Это устойчивый ал­го­ритм, использующий <tex>O(n)</tex> дополнительной памяти и <tex>O(n</tex> <tex>\log n)</tex> времени.
*[http://www.sorting-algorithms.com/merge-sort Анимированная работа алгоритма (англ.)]
 
  
 
==Принцип работы==
 
==Принцип работы==
Строка 16: Строка 15:
 
У нас есть два массива <tex>A</tex> и <tex>B</tex> (фактически это будут две части одного массива, но для удобства будем писать, что у нас просто два массива). Нам надо получить массив <tex>C</tex> размером <tex>|A| + |B|</tex>. Для этого можно применить процедуру слияния. Эта процедура заключается в том, что мы сравниваем элементы массивов (начиная с начала) и меньший из них записываем в финальный. И затем, в массиве у которого оказался меньший элемент, переходим к следующему элементу и сравниваем теперь его. В конце, если один из массивов закончился, мы просто дописываем в финальный другой массив. После мы наш финальный массив записываем заместо двух исходных и получаем отсортированный участок.
 
У нас есть два массива <tex>A</tex> и <tex>B</tex> (фактически это будут две части одного массива, но для удобства будем писать, что у нас просто два массива). Нам надо получить массив <tex>C</tex> размером <tex>|A| + |B|</tex>. Для этого можно применить процедуру слияния. Эта процедура заключается в том, что мы сравниваем элементы массивов (начиная с начала) и меньший из них записываем в финальный. И затем, в массиве у которого оказался меньший элемент, переходим к следующему элементу и сравниваем теперь его. В конце, если один из массивов закончился, мы просто дописываем в финальный другой массив. После мы наш финальный массив записываем заместо двух исходных и получаем отсортированный участок.
  
Ниже приведён псевдокод процедуры слияния, который сливает две части массива A — [left; mid) и [mid; right)
+
Ниже приведён псевдокод процедуры слияния, который сливает две части массива A — <tex>[left; mid)</tex> и <tex>[mid; right)</tex>
  
  Merge(A, left, mid, right):
+
  Merge(A : '''int[1..N]'''; left, mid, right : '''int'''):
  it1 = 0
+
    it1 = 0
  it2 = 0
+
    it2 = 0
  result = new int[right - left]
+
    result : '''int[right - left]'''
 
    
 
    
  while left + it1 < mid and mid + it2 < right:
+
    '''while''' left + it1 < mid '''and''' mid + it2 < right
    if A[left + it1] < A[mid + it2]:
+
        '''if''' A[left + it1] < A[mid + it2]
      result[it1 + it2] = A[left + it1]
+
            result[it1 + it2] = A[left + it1]
      it1 += 1
+
            it1 += 1
    else:
+
        '''else'''
      result[it1 + it2] = A[mid + it2]
+
            result[it1 + it2] = A[mid + it2]
      it2 += 1
+
            it2 += 1
 
    
 
    
  while left + it1 < mid:
+
    '''while''' left + it1 < mid
    result[it1 + it2] = A[left + it1]
+
        result[it1 + it2] = A[left + it1]
    it1 += 1
+
        it1 += 1
 
    
 
    
  while mid + it2 < right:
+
    '''while''' mid + it2 < right
    result[it1 + it2] = A[mid + it2]
+
        result[it1 + it2] = A[mid + it2]
    it2 += 1
+
        it2 += 1
 
    
 
    
  for i = 0 to it1 + it2:
+
    '''for''' i = 0 '''to''' it1 + it2
    A[left + i] = result[i]
+
        A[left + i] = result[i]
  
 
===Рекурсивный алгоритм===
 
===Рекурсивный алгоритм===
Строка 46: Строка 45:
 
Функция сортирует подотрезок массива с индексами в полуинтервале [left; right).
 
Функция сортирует подотрезок массива с индексами в полуинтервале [left; right).
  
  MergeSort(A, left, right):
+
  MergeSort(A : '''int[1..N]'''; left, right : '''int'''):
  if left + 1 >= right:
+
    '''if''' left + 1 >= right
    return
+
        return
  mid = (left + right) / 2
+
    mid = (left + right) / 2
  MergeSort(A, left, mid)
+
    MergeSort(A, left, mid)
  MergeSort(A, mid, right)
+
    MergeSort(A, mid, right)
  Merge(A, left, mid, right)
+
    Merge(A, left, mid, right)
  
 
Пример работы алгоритма показан на рисунке:
 
Пример работы алгоритма показан на рисунке:
Строка 60: Строка 59:
 
(<tex>O(n)</tex> — это время, необходимое на то, чтобы слить два массива). Распишем это соотношение:
 
(<tex>O(n)</tex> — это время, необходимое на то, чтобы слить два массива). Распишем это соотношение:
  
<tex>T(n)</tex> <tex>=</tex> <tex>2T(n/2)</tex> <tex>+</tex> <tex>O(n)</tex> <tex>=</tex> <tex>4T(n/4)</tex> <tex>+</tex> <tex>2O(n)</tex> <tex>=</tex> <tex>...</tex> <tex>=</tex> <tex>2^kT(1)</tex> <tex>+</tex> <tex>kO(n).</tex>
+
<tex>T(n)=2T(n/2)+O(n)=4T(n/4)+2O(n)=\dots=2^kT(1)+kO(n)</tex>.
  
 
Осталось оценить <tex>k</tex>. Мы знаем, что <tex>2^k=n</tex>, а значит <tex>k=\log n</tex>. Уравнение примет вид <tex>T(n)=nT(1)+ \log n</tex> <tex>O(n)</tex>. Так как <tex>T(1)</tex> — константа, то <tex>T(n)=O(n)+\log n </tex> <tex>O(n)=O(n\log n)</tex>.
 
Осталось оценить <tex>k</tex>. Мы знаем, что <tex>2^k=n</tex>, а значит <tex>k=\log n</tex>. Уравнение примет вид <tex>T(n)=nT(1)+ \log n</tex> <tex>O(n)</tex>. Так как <tex>T(1)</tex> — константа, то <tex>T(n)=O(n)+\log n </tex> <tex>O(n)=O(n\log n)</tex>.
 +
 +
==Источники информации==
 +
*[http://ru.wikipedia.org/wiki/Mergesort Википедия {{---}} сортировка слиянием]
  
 
==Ссылки==
 
==Ссылки==
*[http://ru.wikipedia.org/wiki/Mergesort Википедия — сортировка слиянием]
+
*[http://www.sorting-algorithms.com/merge-sort Визуализатор]
*[http://www.sorting-algorithms.com/merge-sort Сортировка слиянием, анимация и свойства (англ.)]
+
*[http://ru.wikibooks.org/wiki/%D0%9F%D1%80%D0%B8%D0%BC%D0%B5%D1%80%D1%8B_%D1%80%D0%B5%D0%B0%D0%BB%D0%B8%D0%B7%D0%B0%D1%86%D0%B8%D0%B8_%D1%81%D0%BE%D1%80%D1%82%D0%B8%D1%80%D0%BE%D0%B2%D0%BA%D0%B8_%D1%81%D0%BB%D0%B8%D1%8F%D0%BD%D0%B8%D0%B5%D0%BC Викиучебник {{---}} Примеры реализации на различных языках программирования]
*[http://ru.wikibooks.org/wiki/%D0%9F%D1%80%D0%B8%D0%BC%D0%B5%D1%80%D1%8B_%D1%80%D0%B5%D0%B0%D0%BB%D0%B8%D0%B7%D0%B0%D1%86%D0%B8%D0%B8_%D1%81%D0%BE%D1%80%D1%82%D0%B8%D1%80%D0%BE%D0%B2%D0%BA%D0%B8_%D1%81%D0%BB%D0%B8%D1%8F%D0%BD%D0%B8%D0%B5%D0%BC Примеры реализации на различных языках (Википедия)]
+
 
*[http://iproc.ru/parallel-programming/lection-6/ Сортировка слиянием в картинках (источник картинок в статье)]
+
==См. также==
*[https://gist.github.com/2919790 Реализация сортировки слиянием на языке Python]
+
* [[Сортировка кучей]]
 +
* [[Быстрая сортировка]]
 +
*[[Cортировка слиянием с использованием O(1) дополнительной памяти]]
  
 
[[Категория: Дискретная математика и алгоритмы]]
 
[[Категория: Дискретная математика и алгоритмы]]
[[Категория: Сортировки]]
+
[[Категория: Сортировка]]
 +
[[Категория: Сортировки на сравнениях]]

Версия 19:00, 3 мая 2015

Описание

Сортировка слиянием — алгоритм сортировки. Он был пред­ло­жен Джо­ном фон Ней­ма­ном в 1945 го­ду.

Это устойчивый ал­го­ритм, использующий [math]O(n)[/math] дополнительной памяти и [math]O(n[/math] [math]\log n)[/math] времени.

Принцип работы

Пример работы процедуры слияния.

Алгоритм использует прицип «разделяй и властвуй»: задача разбивается на подзадачи меньшего размера, которые решаются по отдельности, после чего их решения комбинируются для получения решения исходной задачи. Конкретно процедуру сортировки слиянием можно описать следующим образом:

  1. Если в рассматриваемом массиве один элемент, то он уже отсортирован — алгоритм завершает работу.
  2. Иначе массив разбивается на две части, которые сортируются рекурсивно.
  3. После сортировки двух частей массива к ним применяется процедура слияния, которая по двум отсортированным частям получает исходный отсортированный массив.

Слияние двух массивов

У нас есть два массива [math]A[/math] и [math]B[/math] (фактически это будут две части одного массива, но для удобства будем писать, что у нас просто два массива). Нам надо получить массив [math]C[/math] размером [math]|A| + |B|[/math]. Для этого можно применить процедуру слияния. Эта процедура заключается в том, что мы сравниваем элементы массивов (начиная с начала) и меньший из них записываем в финальный. И затем, в массиве у которого оказался меньший элемент, переходим к следующему элементу и сравниваем теперь его. В конце, если один из массивов закончился, мы просто дописываем в финальный другой массив. После мы наш финальный массив записываем заместо двух исходных и получаем отсортированный участок.

Ниже приведён псевдокод процедуры слияния, который сливает две части массива A — [math][left; mid)[/math] и [math][mid; right)[/math]

Merge(A : int[1..N]; left, mid, right : int):
    it1 = 0
    it2 = 0
    result : int[right - left]
  
    while left + it1 < mid and mid + it2 < right
        if A[left + it1] < A[mid + it2]
            result[it1 + it2] = A[left + it1]
            it1 += 1
        else
            result[it1 + it2] = A[mid + it2]
            it2 += 1
  
    while left + it1 < mid
        result[it1 + it2] = A[left + it1]
        it1 += 1
  
    while mid + it2 < right
        result[it1 + it2] = A[mid + it2]
        it2 += 1
  
    for i = 0 to it1 + it2
        A[left + i] = result[i]

Рекурсивный алгоритм

Пример работы рекурсивного алгоритма сортировки слиянием

Функция сортирует подотрезок массива с индексами в полуинтервале [left; right).

MergeSort(A : int[1..N]; left, right : int):
    if left + 1 >= right
        return
    mid = (left + right) / 2
    MergeSort(A, left, mid)
    MergeSort(A, mid, right)
    Merge(A, left, mid, right)

Пример работы алгоритма показан на рисунке:

Время работы

Чтобы оценить время работы этого алгоритма, составим рекуррентное соотношение. Пускай [math]T(n)[/math] — время сортировки массива длины n, тогда для сортировки слиянием справедливо [math]T(n)=2T(n/2)+O(n)[/math]
([math]O(n)[/math] — это время, необходимое на то, чтобы слить два массива). Распишем это соотношение:

[math]T(n)=2T(n/2)+O(n)=4T(n/4)+2O(n)=\dots=2^kT(1)+kO(n)[/math].

Осталось оценить [math]k[/math]. Мы знаем, что [math]2^k=n[/math], а значит [math]k=\log n[/math]. Уравнение примет вид [math]T(n)=nT(1)+ \log n[/math] [math]O(n)[/math]. Так как [math]T(1)[/math] — константа, то [math]T(n)=O(n)+\log n [/math] [math]O(n)=O(n\log n)[/math].

Источники информации

Ссылки

См. также