Таблица инверсий — различия между версиями

Материал из Викиконспекты
Перейти к: навигация, поиск
(Алгоритм построения)
(Алгоритм восстановления)
Строка 59: Строка 59:
 
= Алгоритм восстановления =
 
= Алгоритм восстановления =
  
Для восстановления таблицы перестановки из таблицы инверсий создаем таблицу, которую будем расширять, по мере добавления в неё чисел. Добавляем в эту таблицу число <tex>i</tex> (где <tex>i</tex> от <tex>n</tex> до 1) на позицию <tex>k+1</tex>, где <tex>k</tex> - число в таблице инверсий на <tex>i</tex>-том месте. Данный алгоритм довольно прост в реализации, но без использования дополнительных структур данных, имеет сложность <tex>O(n^2)</tex>, т. к. для вставки элемента в определённую позицию, требуется порядка <tex>n</tex> перестановок элементов.
+
Для восстановления перестановки по таблицы инверсий <tex>T</tex> воспользуемся следующим соображением: единица стоит на <tex>T_i</tex>-ом месте (индексируем элементы с нуля), так как остальные числа в перестановке больше единицы. Далее, если известны расположения всех чисел <tex>1, \dots, k</tex>, то число <tex>k + 1</tex> стоит на <tex>T_{k + 1}</tex>-ой ещё не занятой позиции: все числа, меньшие <tex>k + 1</tex> уже расставлены. Это рассуждение напрямую переписывается в код следующим образом:
  
Приведём алгоритм восстановления с использованием [[Сортировка слиянием|сортировки слиянием]], имеющий сложность <tex>O(n\log_2n)</tex>.
+
def recover_straight(ls):
 +
  n = len(ls)
 +
  result = array(0, n)
 +
  curr = 1
 +
  for k in ls:
 +
    j = 0
 +
    for (i = 0, i < n, i += 1):
 +
      if result[i] == 0:
 +
        if j == k:
 +
          result[i] = curr
 +
          break
 +
        else:
 +
          j += 1
 +
    curr += 1
 +
  return result
  
Пусть <tex>\alpha</tex> и <tex>\beta</tex> - цепочки упорядоченных пар целых неотрицательных чисел <tex>[m_1, n_1]\dots[m_k, n_k]</tex>. Рассмотрим двоичную операцию <tex>\circ</tex>, рекурсивно определенную на парах таких цепочек следующим образом:
+
* j — счётчик пропущенных свободных позиций
$([m, n]\alpha)\circ([m', n']\beta)=\left\{\begin{aligned}[]
+
* k — количество инверсий слева для элемента curr
[m,n](\alpha \circ ([m'-m, n']\beta)), m \le m',\\
+
* result — массив, в который записывается перестановка. Равенство элемента массива нулю обозначает, что эта позиция свободна.
[m', n'](([m-m'-1, n]\alpha) \circ \beta), m>m'.\\
 
\end{aligned}
 
\right.$
 
  
Сопоставим каждому элементу таблицы инверсий его номер. Получится множество упорядоченных пар чисел <tex>[m_1, n_1]\dots[m_k, n_k]</tex>, где <tex>m_i</tex> {{---}} сам элемент, а <tex>n_i</tex> {{---}} его номер. Разобьём данные элементы на пары и произведём с ними операцию <tex>\circ</tex>. Получим некоторое количество цепочек упорядоченных пар. Также разбиваем их на пары и производим операцию <tex>\circ</tex>. Так действуем, пока не останется одна цепочка. Выписывая вторые элементы данных упорядоченных пар в том порядке, в каком они представлены в цепочке, получим первоначальную перестановку.
+
Этот простой алгоритм имеет сложность <tex>O(n^2)</tex> — внутренний цикл делает до <tex>n</tex> итераций, внешний — ровно <tex>n</tex> итераций.
  
Цепочка наподобие <tex>[4, 4][1,3]</tex> представляет "_ _ _ _ 4 _ 3 _ <tex>\infty</tex>", где "_" означает пропуск. Операция <tex>\alpha \circ \beta</tex> вставляет пропуски и заполнения из <tex>\beta</tex> на место пропусков в <tex>\alpha</tex>.
+
Видно, что для восстановления нужно узнавать <tex>k</tex>-ую свободную позицию. Это можно делать с помощью дерева отрезков следующим образом: построим дерево отрезков для суммы на массиве из единиц. Единица в позиции означает, что данная позиция свободна. Чтобы найти <tex>k</tex>-ую свободную позицию, нужно спускаться (начиная с корня) в левое поддерево если сумма в нём больше, чем <tex>k</tex>, и в правое дерево иначе.
  
== Пример ==
+
Данный алгоритм переписывается в код следующим образом:
  
* <tex>[4, 1, 6, 3, 2, 2, 1, 1, 1, 0]</tex> - таблица инверсий.
+
def recover(inv):
* <tex>[4,1]\circ[1,2], [6,3]\circ[3,4], [2,5]\circ[2,6], [1,7]\circ[1,8], [1,9]\circ[0,10]</tex>
+
  n = len(inv)
* <tex>[1,2][2,1]\circ[3,4][2,3], [2,5][0,6]\circ[1,7][0,8], [0,10][0,9]</tex>
+
  tree = build_segment_tree(array(n, 1))
* <tex>[1,2][2,1][0,4][2,3]\circ[1,7][0,5][0,6][0,8], [0,10][0,9]</tex>
+
  result = array(n)
* <tex>[1,2][0,7][0,5][0,1][0,4][0,6][0,8][0,3]\circ[0,10][0,9]</tex>
+
  curr = 1
* <tex>[0,10][0,2][0,7][0,5][0,1][0,4][0,6][0,8][0,3][0,9]</tex>
+
  for k in inv:
 +
    node = tree.root
 +
    while (!node.is_leaf):
 +
      if (k < node.value):
 +
        node = node.left
 +
      else:
 +
        k -= node.left.value
 +
        node = node.right
 +
    result[node.index] = curr
 +
    node.add(-1)
 +
    curr += 1
 +
  return result
  
Получаем перестановку <tex>[10, 2, 7, 5, 1, 4, 6, 8, 3, 9]</tex>
+
* build_segment_tree — строит дерево отрезков над массивом
 +
* node — вершина дерева
 +
* node.index — индекс соответсвующего элемента в массиве для листа дерева
 +
 
 +
Этот алгоритм имеет сложность <tex>O(n \log n)</tex>: делается <tex>n</tex> итераций цикла, в которой происходит спуск по дереву высоты <tex>O(\log n)</tex> и один запрос на дереве отрезков. Таким образом, время работы алгоритма на каждой итерации есть <tex>O(\log n)</tex>.
  
 
= Источники =
 
= Источники =
  
 
* Д. Кнут - Искусство программирования, том 3.
 
* Д. Кнут - Искусство программирования, том 3.

Версия 00:34, 13 января 2012

Пусть [math] P = (p_1,p_2,\dots,p_n)[/math] является перестановкой чисел [math] 1, 2,\dots, n[/math].


Определение:
Инверсией в перестановке [math]P[/math] называется всякая пара индексов [math]i, j[/math] такая, что [math]1\leqslant i\lt j\leqslant n[/math] и [math]P[i]\gt P[j][/math].


Определение:
Таблицей инверсий перестановки [math] P [/math] называют такую последовательность [math] T = (t_1,t_2,\dots,t_n)[/math], в которой [math]t_i[/math] равно числу элементов перестановки [math] P [/math], стоящих в [math] P [/math] левее числа [math]i[/math] и больших [math]i[/math].


Алгоритм построения

Таблицу инверсий тривиально построить по определению. Для каждого элемента перестановки считаем количество элементов, больших данного и стоящих в перестановке левее него. Алгоритм построения в псевдокоде выглядит так:

T[1..n] = 0
For i = 1..n
  For j = 1..(i - 1)
    if P[j] > P[i]
      T[P[i]] = T[P[i]] + 1

Сложность данного алгоритма — [math]O(n^2)[/math]. Уменьшить время работы можно используя алгоритм, похожий на сортировку слиянием.

Пусть дано разбиение перестановки на два списка, причём для каждого элемента дано число инверсий слева с элементами того же списка и известно, что все числа первого списка стоят левее всех чисел второго списка в исходной перестановке. Будем считать количество инверсий слева элементов обоих списков следующим образом: сливаем списки, аналогично сортировке слиянием.

Если в результат нужно записать элемент первого списка, то все нерассмотренные элементы второго списка больше, следовательно, количество инверсий для этого элемента не меняется. Если в результат нужно записать элемент второго списка, то все нерассмотренные элементы первого списка больше его и стоят левее. Следовательно, количество инверсий для этого элемента следует увеличить на количетво нерассмотренных элементов второго списка.

Описанный алгоритм записывается в псевдокод следующим образом:

def inverses_merge(ls1, ls2):
  result = []
  it1, it2 = 0, 0
  while (it1 < len(ls1)) and (it2 < len(ls2)):
    if ls1[it1].item < ls2[it2].item:
      result.append(ls1[it1])
      it1 += 1
    else:
      result.append(item = ls2[it2].item, inverses = ls2[it2].inverses + len(ls1) - it1)
      it2 += 1
  while (it1 < len(ls1)):
    result.append(ls1[it1])
    it1 += 1
  while (it2 < len(ls2)):
    result.append(ls2[it2])
    it2 += 1
  return result

def inverses_get(ls):
  if len(ls) == 1:
    return [(item = ls[0], inverses = 0)]
  else:
    return inverses_merge(inverses_get(ls.first_half), inverses_get(ls.second_half))
  • inverses_merge — процедура, сливающая два списка пар
  • inverses_get — процедура, рекурсивно получающая таблицу инверсий для перестановки

Сложность представленного алгоритма есть [math]O(n\log_2 n)[/math]. Алгоритм с такой же сложностью можно построить с помощью дерева отрезков.

Алгоритм восстановления

Для восстановления перестановки по таблицы инверсий [math]T[/math] воспользуемся следующим соображением: единица стоит на [math]T_i[/math]-ом месте (индексируем элементы с нуля), так как остальные числа в перестановке больше единицы. Далее, если известны расположения всех чисел [math]1, \dots, k[/math], то число [math]k + 1[/math] стоит на [math]T_{k + 1}[/math]-ой ещё не занятой позиции: все числа, меньшие [math]k + 1[/math] уже расставлены. Это рассуждение напрямую переписывается в код следующим образом:

def recover_straight(ls):
  n = len(ls)
  result = array(0, n)
  curr = 1
  for k in ls:
    j = 0
    for (i = 0, i < n, i += 1):
      if result[i] == 0:
        if j == k:
          result[i] = curr
          break
        else:
          j += 1
    curr += 1
  return result
  • j — счётчик пропущенных свободных позиций
  • k — количество инверсий слева для элемента curr
  • result — массив, в который записывается перестановка. Равенство элемента массива нулю обозначает, что эта позиция свободна.

Этот простой алгоритм имеет сложность [math]O(n^2)[/math] — внутренний цикл делает до [math]n[/math] итераций, внешний — ровно [math]n[/math] итераций.

Видно, что для восстановления нужно узнавать [math]k[/math]-ую свободную позицию. Это можно делать с помощью дерева отрезков следующим образом: построим дерево отрезков для суммы на массиве из единиц. Единица в позиции означает, что данная позиция свободна. Чтобы найти [math]k[/math]-ую свободную позицию, нужно спускаться (начиная с корня) в левое поддерево если сумма в нём больше, чем [math]k[/math], и в правое дерево иначе.

Данный алгоритм переписывается в код следующим образом:

def recover(inv):
  n = len(inv)
  tree = build_segment_tree(array(n, 1))
  result = array(n)
  curr = 1
  for k in inv:
    node = tree.root
    while (!node.is_leaf):
      if (k < node.value):
        node = node.left
      else:
        k -= node.left.value
        node = node.right
    result[node.index] = curr
    node.add(-1)
    curr += 1
  return result
  • build_segment_tree — строит дерево отрезков над массивом
  • node — вершина дерева
  • node.index — индекс соответсвующего элемента в массиве для листа дерева

Этот алгоритм имеет сложность [math]O(n \log n)[/math]: делается [math]n[/math] итераций цикла, в которой происходит спуск по дереву высоты [math]O(\log n)[/math] и один запрос на дереве отрезков. Таким образом, время работы алгоритма на каждой итерации есть [math]O(\log n)[/math].

Источники

  • Д. Кнут - Искусство программирования, том 3.