Сжатое многомерное дерево отрезков — различия между версиями
| Строка 3: | Строка 3: | ||
{{Определение | {{Определение | ||
|definition= | |definition= | ||
| − | Пусть дан <tex>p</tex>-мерный массив и множество из <tex>n</tex> его элементов.'''<br>Сжатым <tex>p</tex>-мерным деревом отрезков''' называется модификация <tex>p</tex>-мерного дерева отрезков, позволяющая | + | Пусть дан <tex>p</tex>-мерный массив и множество <tex>\Omega</tex>, состоящее из <tex>n</tex> его элементов.'''<br>Сжатым <tex>p</tex>-мерным деревом отрезков''' называется модификация <tex>p</tex>-мерного дерева отрезков, позволяющая реализовывать моноидальные операции (нахождение количества элементов, минимального элемента, etc) над элементами множества <tex>\Omega</tex>, находящимися на <tex>p</tex>-мерном прямоугольнике <tex>(x_a,x_b),(y_a,y_b),...,(z_a,z_b)</tex>. |
}} | }} | ||
| + | Например, сжатое дерево отрезков решает следующую задачу: заданы <tex>n</tex> точек на плоскости с координатами <tex>(x_i,y_i)</tex>, посчитать количество точек на прямоугольнике <tex>(x_a,x_b),(y_a,y_b)</tex>. | ||
| − | + | ==Структура== | |
| + | Вообще говоря, с поставленной задачей справится и обычное <tex>p</tex>-мерное дерево отрезков. Очевидно, запрос операции на <tex>p</tex>-мерном прямоугольнике c помощью такой структуры будет выполняться за <tex>O(log^p\,n)</tex>, а сама структура будет занимать порядка <tex>\Omega(S)</tex> памяти, где <tex>S</tex> — количество элементов в <tex>p</tex>-мерном массиве. Однако, можно провести следующую оптимизацию — каждый раз дерево отрезков внутри вершины будем строить только по тем элементам, которые встречаются в отрезке, за который отвечает эта вершина. Действительно, другие элементы уже были "исключены" и заведомо лежат вне желаемого <tex>p</tex>-мерного прямоугольника. Алгоритм построения такого "усеченного" дерева отрезков будет выглядеть следующим образом:<br> | ||
| + | * Cоставить массив из всех <tex>n</tex> элементов множества <tex>\Omega</tex>, упорядочить его по первой координате | ||
| + | * Построить на нём дерево отрезков (для удобства будем использовать сохранение всего подмассива в каждой вершине дерева отрезков) | ||
| + | * Все подмассивы в вершинах получившегося дерева отрезков упорядочить по следующей координате, после чего повторить построение дерева для каждого из них | ||
| + | |||
| + | Псевдокод: | ||
| + | build_normal_tree(element[] array) | ||
| + | { | ||
| + | //построение одномерного дерева отрезков на массиве array с сохранением подмассива в каждой вершине | ||
| + | } | ||
| + | |||
| + | get_inside_array(vertex) | ||
| + | { | ||
| + | //получение подмассива, сохраненного в вершине vertex | ||
| + | } | ||
| + | |||
| + | build_compressed_tree(element[] array, int coordinate) | ||
| + | { | ||
| + | //собственно, построение сжатого дерева отрезков | ||
| + | if (coordinate < p) | ||
| + | { | ||
| + | sort(array, coordinate); //сортировка массива по нужной координате | ||
| + | segment_tree = build_normal_tree(array); | ||
| + | for (each vertex in segment_tree) | ||
| + | { | ||
| + | build_compressed_tree(inside_array(each), coordinate + 1); | ||
| + | } | ||
| + | } | ||
| + | } | ||
| + | |||
| + | |||
| + | При такой оптимизации асимптотика размера структуры составит <tex>O(n\,log^{p-1}\,n)</tex>, а запрос будет аналогичен запросу в обычном <tex>p</tex>-мерном дереве отрезков за <tex>O(log^p\,n)</tex>. Но расплатой станет невозможность делать произвольный запрос модификации: в самом деле, если появится новый элемент, то это приведёт к тому, что мы должны будем в каком-либо дереве отрезков по второй или более координате добавить новый элемент в середину, что эффективно сделать невозможно. Поэтому, если задача поставлена на плоскости, то на практике используются более гибкие структуры данных, например, [[Декартово дерево по неявному ключу]]. | ||
Версия 10:00, 7 июня 2011
| Определение: |
| Пусть дан -мерный массив и множество , состоящее из его элементов. Сжатым -мерным деревом отрезков называется модификация -мерного дерева отрезков, позволяющая реализовывать моноидальные операции (нахождение количества элементов, минимального элемента, etc) над элементами множества , находящимися на -мерном прямоугольнике . |
Например, сжатое дерево отрезков решает следующую задачу: заданы точек на плоскости с координатами , посчитать количество точек на прямоугольнике .
Структура
Вообще говоря, с поставленной задачей справится и обычное -мерное дерево отрезков. Очевидно, запрос операции на -мерном прямоугольнике c помощью такой структуры будет выполняться за , а сама структура будет занимать порядка памяти, где — количество элементов в -мерном массиве. Однако, можно провести следующую оптимизацию — каждый раз дерево отрезков внутри вершины будем строить только по тем элементам, которые встречаются в отрезке, за который отвечает эта вершина. Действительно, другие элементы уже были "исключены" и заведомо лежат вне желаемого -мерного прямоугольника. Алгоритм построения такого "усеченного" дерева отрезков будет выглядеть следующим образом:
- Cоставить массив из всех элементов множества , упорядочить его по первой координате
- Построить на нём дерево отрезков (для удобства будем использовать сохранение всего подмассива в каждой вершине дерева отрезков)
- Все подмассивы в вершинах получившегося дерева отрезков упорядочить по следующей координате, после чего повторить построение дерева для каждого из них
Псевдокод:
build_normal_tree(element[] array)
{
//построение одномерного дерева отрезков на массиве array с сохранением подмассива в каждой вершине
}
get_inside_array(vertex)
{
//получение подмассива, сохраненного в вершине vertex
}
build_compressed_tree(element[] array, int coordinate)
{
//собственно, построение сжатого дерева отрезков
if (coordinate < p)
{
sort(array, coordinate); //сортировка массива по нужной координате
segment_tree = build_normal_tree(array);
for (each vertex in segment_tree)
{
build_compressed_tree(inside_array(each), coordinate + 1);
}
}
}
При такой оптимизации асимптотика размера структуры составит , а запрос будет аналогичен запросу в обычном -мерном дереве отрезков за . Но расплатой станет невозможность делать произвольный запрос модификации: в самом деле, если появится новый элемент, то это приведёт к тому, что мы должны будем в каком-либо дереве отрезков по второй или более координате добавить новый элемент в середину, что эффективно сделать невозможно. Поэтому, если задача поставлена на плоскости, то на практике используются более гибкие структуры данных, например, Декартово дерево по неявному ключу.