Сжатое многомерное дерево отрезков — различия между версиями
(→Структура) |
|||
Строка 1: | Строка 1: | ||
{{Определение | {{Определение | ||
|definition= | |definition= | ||
− | Пусть | + | Пусть имеется множество <tex>A</tex>, состоящее из <tex>n</tex> взвешенных точек в <tex>p</tex>-мерном пространстве. Необходимо быстро отвечать на запрос о суммарном весе точек, находящихся в <tex>p</tex>-мерном прямоугольнике <tex>(x_a,x_b),(y_a,y_b),\,...\,,(z_a,z_b)</tex> |
}} | }} | ||
Важно понимать, что индексы p-мерного подмассива вполне могут быть заменены координатами в p-мерном вещественном пространстве. Тогда для определения нужного отрезка необходимо будет воспользоваться бинарным поиском. Например, сжатое дерево отрезков решает следующую задачу: заданы <tex>n</tex> точек на плоскости с координатами <tex>(x_i,y_i)</tex>, посчитать количество точек на прямоугольнике <tex>(x_a,x_b),(y_a,y_b)</tex>. | Важно понимать, что индексы p-мерного подмассива вполне могут быть заменены координатами в p-мерном вещественном пространстве. Тогда для определения нужного отрезка необходимо будет воспользоваться бинарным поиском. Например, сжатое дерево отрезков решает следующую задачу: заданы <tex>n</tex> точек на плоскости с координатами <tex>(x_i,y_i)</tex>, посчитать количество точек на прямоугольнике <tex>(x_a,x_b),(y_a,y_b)</tex>. |
Версия 08:10, 8 июня 2011
Определение: |
Пусть имеется множество | , состоящее из взвешенных точек в -мерном пространстве. Необходимо быстро отвечать на запрос о суммарном весе точек, находящихся в -мерном прямоугольнике
Важно понимать, что индексы p-мерного подмассива вполне могут быть заменены координатами в p-мерном вещественном пространстве. Тогда для определения нужного отрезка необходимо будет воспользоваться бинарным поиском. Например, сжатое дерево отрезков решает следующую задачу: заданы
точек на плоскости с координатами , посчитать количество точек на прямоугольнике .Структура
Вообще говоря, с поставленной задачей справится и обычное
-мерное дерево отрезков. Если дерево строить по всем элементам массива, то запрос операции на -мерном прямоугольнике c помощью такой структуры будет выполняться за , а сама структура будет занимать порядка памяти, где — количество элементов в -мерном массиве. Если дерево строить по элементам множества , то асимптотики изменятся на и соответственно. Однако, можно провести следующую оптимизацию — каждый раз дерево отрезков внутри вершины будем строить только по тем элементам множества , которые встречаются в отрезке, за который отвечает эта вершина. Действительно, другие элементы уже были "исключены" и заведомо лежат вне желаемого -мерного прямоугольника. Для этого будем использовать сохранение всего подмассива в каждой вершине дерева отрезков.Построение дерева и запрос операции
Алгоритм построения такого "усеченного" дерева отрезков будет выглядеть следующим образом:
- Cоставить массив из всех элементов множества , упорядочить его по первой координате
- Построить на нём дерево отрезков с сохранением подмассива в каждой вершине
- Все подмассивы в вершинах получившегося дерева отрезков упорядочить по следующей координате, после чего повторить построение дерева для каждого из них
Псевдокод:
build_normal_tree(element[] array) { //построение одномерного дерева отрезков на массиве array с сохранением подмассива в каждой вершине } get_inside_array(vertex) { //получение подмассива, сохраненного в вершине vertex } build_compressed_tree(element[] array, int coordinate = 0) { //собственно, построение сжатого дерева отрезков if (coordinate < p) { sort(array, coordinate); //сортировка массива по нужной координате segment_tree = build_normal_tree(array); for (each vertex in segment_tree) { build_compressed_tree(inside_array(each), coordinate + 1); } } }
При такой оптимизации асимптотика размера структуры составит
, а запрос будет аналогичен запросу в обычном -мерном дереве отрезков за . Но расплатой станет невозможность делать произвольный запрос модификации: в самом деле, если появится новый элемент, то это приведёт к тому, что мы должны будем в каком-либо дереве отрезков по второй или более координате добавить новый элемент в середину, что эффективно сделать невозможно.