Сжатое многомерное дерево отрезков — различия между версиями

Материал из Викиконспекты
Перейти к: навигация, поиск
Строка 3: Строка 3:
 
{{Определение
 
{{Определение
 
|definition=
 
|definition=
Пусть дан <tex>p</tex>-мерный массив и множество из <tex>n</tex> его элементов.'''<br>Сжатым <tex>p</tex>-мерным деревом отрезков''' называется модификация <tex>p</tex>-мерного дерева отрезков, позволяющая сократить объем занимаемой им памяти до <tex>O(n\,log^{p-1}\,n)</tex>.
+
Пусть дан <tex>p</tex>-мерный массив и множество <tex>\Omega</tex>, состоящее из <tex>n</tex> его элементов.'''<br>Сжатым <tex>p</tex>-мерным деревом отрезков''' называется модификация <tex>p</tex>-мерного дерева отрезков, позволяющая реализовывать моноидальные операции (нахождение количества элементов, минимального элемента, etc) над элементами множества <tex>\Omega</tex>, находящимися на <tex>p</tex>-мерном прямоугольнике <tex>(x_a,x_b),(y_a,y_b),...,(z_a,z_b)</tex>.
 
}}
 
}}
 +
Например, сжатое дерево отрезков решает следующую задачу: заданы <tex>n</tex> точек на плоскости с координатами <tex>(x_i,y_i)</tex>, посчитать количество точек на прямоугольнике <tex>(x_a,x_b),(y_a,y_b)</tex>.
  
позволяющая для заданного множества из <tex>n</tex> p-мерных точек за время <tex>O(log^p\,n)</tex> отвечать на запрос количества точек, находящихся в p-мерном прямоугольнике <tex>((x_1,x_2),...,(z_1,z_2))</tex>
+
==Структура==
 +
Вообще говоря, с поставленной задачей справится и обычное <tex>p</tex>-мерное дерево отрезков.  Очевидно, запрос операции на <tex>p</tex>-мерном прямоугольнике c помощью такой структуры будет выполняться за <tex>O(log^p\,n)</tex>, а сама структура будет занимать порядка <tex>\Omega(S)</tex> памяти, где <tex>S</tex> — количество элементов в <tex>p</tex>-мерном массиве. Однако, можно провести следующую оптимизацию — каждый раз дерево отрезков внутри вершины будем строить только по тем элементам, которые встречаются в отрезке, за который отвечает эта вершина.  Действительно, другие элементы уже были "исключены" и заведомо лежат вне желаемого <tex>p</tex>-мерного прямоугольника. Алгоритм построения такого "усеченного" дерева отрезков будет выглядеть следующим образом:<br>
 +
* Cоставить массив из всех <tex>n</tex> элементов множества <tex>\Omega</tex>, упорядочить его по первой координате
 +
* Построить на нём дерево отрезков (для удобства будем использовать сохранение всего подмассива в каждой вершине дерева отрезков)
 +
* Все подмассивы в вершинах получившегося дерева отрезков упорядочить по следующей координате, после чего повторить построение дерева для каждого из них
 +
 
 +
Псевдокод:
 +
  build_normal_tree(element[] array)
 +
  {
 +
      //построение одномерного дерева отрезков на массиве array с сохранением подмассива в каждой вершине
 +
  }
 +
 
 +
  get_inside_array(vertex)
 +
  {
 +
      //получение подмассива, сохраненного в вершине vertex
 +
  }
 +
 
 +
  build_compressed_tree(element[] array, int coordinate)  
 +
  {
 +
      //собственно, построение сжатого дерева отрезков
 +
      if (coordinate < p)
 +
      {
 +
        sort(array, coordinate); //сортировка массива по нужной координате
 +
        segment_tree = build_normal_tree(array);
 +
        for (each vertex in segment_tree)
 +
        {
 +
            build_compressed_tree(inside_array(each), coordinate + 1);
 +
        }
 +
      }
 +
  }
 +
       
 +
 
 +
При такой оптимизации асимптотика размера структуры составит <tex>O(n\,log^{p-1}\,n)</tex>, а запрос будет аналогичен запросу в обычном <tex>p</tex>-мерном дереве отрезков за <tex>O(log^p\,n)</tex>. Но расплатой станет невозможность делать произвольный запрос модификации: в самом деле, если появится новый элемент, то это приведёт к тому, что мы должны будем в каком-либо дереве отрезков по второй или более координате добавить новый элемент в середину, что эффективно сделать невозможно. Поэтому, если задача поставлена на плоскости, то на практике используются более гибкие структуры данных, например, [[Декартово дерево по неявному ключу]].

Версия 10:00, 7 июня 2011

Эта статья находится в разработке!


Определение:
Пусть дан [math]p[/math]-мерный массив и множество [math]\Omega[/math], состоящее из [math]n[/math] его элементов.
Сжатым [math]p[/math]-мерным деревом отрезков
называется модификация [math]p[/math]-мерного дерева отрезков, позволяющая реализовывать моноидальные операции (нахождение количества элементов, минимального элемента, etc) над элементами множества [math]\Omega[/math], находящимися на [math]p[/math]-мерном прямоугольнике [math](x_a,x_b),(y_a,y_b),...,(z_a,z_b)[/math].

Например, сжатое дерево отрезков решает следующую задачу: заданы [math]n[/math] точек на плоскости с координатами [math](x_i,y_i)[/math], посчитать количество точек на прямоугольнике [math](x_a,x_b),(y_a,y_b)[/math].

Структура

Вообще говоря, с поставленной задачей справится и обычное [math]p[/math]-мерное дерево отрезков. Очевидно, запрос операции на [math]p[/math]-мерном прямоугольнике c помощью такой структуры будет выполняться за [math]O(log^p\,n)[/math], а сама структура будет занимать порядка [math]\Omega(S)[/math] памяти, где [math]S[/math] — количество элементов в [math]p[/math]-мерном массиве. Однако, можно провести следующую оптимизацию — каждый раз дерево отрезков внутри вершины будем строить только по тем элементам, которые встречаются в отрезке, за который отвечает эта вершина. Действительно, другие элементы уже были "исключены" и заведомо лежат вне желаемого [math]p[/math]-мерного прямоугольника. Алгоритм построения такого "усеченного" дерева отрезков будет выглядеть следующим образом:

  • Cоставить массив из всех [math]n[/math] элементов множества [math]\Omega[/math], упорядочить его по первой координате
  • Построить на нём дерево отрезков (для удобства будем использовать сохранение всего подмассива в каждой вершине дерева отрезков)
  • Все подмассивы в вершинах получившегося дерева отрезков упорядочить по следующей координате, после чего повторить построение дерева для каждого из них

Псевдокод:

  build_normal_tree(element[] array)
  {
     //построение одномерного дерева отрезков на массиве array с сохранением подмассива в каждой вершине
  }
  
  get_inside_array(vertex)
  {
     //получение подмассива, сохраненного в вершине vertex
  }
  
  build_compressed_tree(element[] array, int coordinate) 
  {
     //собственно, построение сжатого дерева отрезков
     if (coordinate < p) 
     {
        sort(array, coordinate); //сортировка массива по нужной координате
        segment_tree = build_normal_tree(array);
        for (each vertex in segment_tree) 
        {
           build_compressed_tree(inside_array(each), coordinate + 1);
        }
     }
  }
        

При такой оптимизации асимптотика размера структуры составит [math]O(n\,log^{p-1}\,n)[/math], а запрос будет аналогичен запросу в обычном [math]p[/math]-мерном дереве отрезков за [math]O(log^p\,n)[/math]. Но расплатой станет невозможность делать произвольный запрос модификации: в самом деле, если появится новый элемент, то это приведёт к тому, что мы должны будем в каком-либо дереве отрезков по второй или более координате добавить новый элемент в середину, что эффективно сделать невозможно. Поэтому, если задача поставлена на плоскости, то на практике используются более гибкие структуры данных, например, Декартово дерево по неявному ключу.