Техника частичного каскадирования — различия между версиями
(Добавлены оценки памяти и времени, исправлен пункт 13) |
(Добавлены категории) |
||
Строка 117: | Строка 117: | ||
* [http://www.hpl.hp.com/techreports/Compaq-DEC/SRC-RR-12.pdf Fractional Cascading. Bernard Chazelle and Leonidas J. Guibas] | * [http://www.hpl.hp.com/techreports/Compaq-DEC/SRC-RR-12.pdf Fractional Cascading. Bernard Chazelle and Leonidas J. Guibas] | ||
* [http://intsys.msu.ru/magazine/archive/v15(1-4)/pivovarov-205-222.pdf Техника частичного каскадирования для итеративного поиска в линейно упорядоченных множествах А.П. Пивоваров] | * [http://intsys.msu.ru/magazine/archive/v15(1-4)/pivovarov-205-222.pdf Техника частичного каскадирования для итеративного поиска в линейно упорядоченных множествах А.П. Пивоваров] | ||
+ | |||
+ | [[Категория: Алгоритмы и структуры данных]] | ||
+ | [[Категория: Структуры данных]] |
Версия 00:05, 8 июня 2017
Определение: |
Каталог (англ. catalog)— упорядоченный массив из элементов, на которых введено отношение порядка. В данной статье предполагается, что массив упорядочен по неубыванию. |
Определение: |
Техника частичного каскадирования (англ. fractional cascading technique) — это способ организации структуры данных, который предназначен для быстрого итеративного поиска в | каталогах.
Задача: |
Дано | каталогов , каталог имеет размер . Поступают запросы, которые представляют собой один элемент . Требуется для каждого запроса определить в каждом каталоге максимальный элемент меньше либо равный .
Содержание
Различные подходы к решению
Пусть
1) Для ответа на запрос последовательно посетим все каталоги. Пусть мы находимся в -ом каталоге, тогда мы можем ответить на запрос для данного каталога за , используя бинарный поиск. Так как каталогов штук, то для ответа на запрос понадобится времени. Для хранения всех каталогов понадобится памяти.
2) Для второго способа построим сбалансированное бинарное дерево поиска из всех элементов всех каталогов. В каждой вершине дерева будет хранится дополнительно кортеж из элементов — максимальных представителей каталогов меньше либо равных ключу вершины. Таким образом такая структура будет занимать на дерево поиска и на дополнительные кортежи.Тогда для ответа на запрос найдем в дереве поиска максимальный ключ меньше либо равный и выведем элементов соответствующего кортежа, итого ответ на запрос производится за .
Итого имеем:
Тип подхода к решению | Необходимая память | Время ответа на один запрос |
---|---|---|
|
|
|
|
|
|
Решение с помощью техники частичного каскадирования
Как будет показано далее, эта техника берет лучшее от подходов к решению этой задачи, что были рассмотрены выше, а именно она требует
Идея данной техники построена на следующем:
- 1) Мы можем проводить ссылки из каталога номер
- 2) Мы можем для оптимизации пункта 1 создать модифицированные каталоги , где -ый каталог будет представлять каталог слитый с
Построение
Введем определения: Шаблон:Определения
Первый этап построения:
- : Данный каталог не имеет никаких ссылок и равен .
- : Для построения данного каталога будем сливать каталог с каждым вторым элементом каталога . Каждый элемент из каталога оснастим ссылкой на позицию, откуда мы его взяли, такие ссылки будет называть ссылками вниз.
Второй этап построения:
В каждом модифицированном каталоге для каждого элемента заведем две ссылки. Для неподставных элементов это будут ссылки на максимальныйподставной элемент меньше текущего и на минимальный любого типа больше текущего. Если элемент подставной, то ссылки будут на минимальный неподставной элемент" больше текущего и на максимальный неподставной элемент меньше текущего. Назовем их ссылками влево и вправо.
Рассмотрим на процесс построения на примере.
Пусть дано каталогов:
Для наглядности заведем таблицу, где в -ой строке -ая ячейка будет окрашена в зеленый цвет, если она присутствует в каталоге . Тогда результатом построения будет таблица, которая представлена на рисунке.
Из-за необходимости хранения ссылок будет удобно завести структуру для хранения элементов в модифицированных каталогах:
struct node : element key node left, right, down bool is_alien
Псевдокод построения модифицированных каталогов:
M[k] = C[k] for i = k - 1 to 1 pointer_in_C = 1 pointer_in_next_M = 1 pointer_in_M = 1 last_non_alien = NULL last_alien = NULL while(true) if (pointer_in_next_M > M[i + 1].size && pointer_in_C > C[i].size) break if (pointer_in_next_M > M[i + 1].size || M[i + 1][pointer_in_next_M] >= C[i][pointer_in_C]) M[i][pointer_in_M].key = C[i][pointer_in_C].key M[i][pointer_in_M].key = last_alien last_non_alien = M[i][pointer_in_M] pointer_in_C++ else M[i][pointer_in_M].key = M[i + 1][pointer_in_next_M].key M[i][pointer_in_M].down = M[i + 1][pointer_in_next_M] M[i][pointer_in_M].is_alien = true M[i][pointer_in_M].left = last_non_alien lst_alien = M[i][pointer_in_M] pointer_in_next_M += 2 pointer_in_M++ last_non_alien = (!M[i][M[i].size].is_alien ? M[i][M[i].size] : NULL) for j = M[i].size - 1 to 1 if (M[i][j].is_alien) M[i][j].right = last_non_alien else M[i][j].right = M[i][j + 1] last_non_alien = M[i][j]
Из построения понятно, что мы тратим
на построение последнего каталога, на построение предпоследнего и т.д. Пусть . Тогда получаем оценку памяти. По алгоритму понятно, что такая же оценка верна и для времени на предподсчет.Ответ на запрос
В первом каталоге ответ на запрос найдем с помощью бинарного поиска по
. Пусть ответом для этого каталога будет ячейка . Далее проитерируемся по оставшимся каталогам. Для того, чтобы перейти в новый модифицированный каталог мы перейдем из по ссылке влево, чтобы попасть в подставную вершину, а потом из нее перейдем по ссылке вниз, чтобы попасть в следующий каталог. Если теперь — неподставная вершина, то нам достаточно рассмотреть двух ее соседей справа в , так как , а каждая вторая ячейка из попадает в , т.е. мы бы встретили ее ранее и перешли мы вниз по ней, но это не случилось. Обновив cell максимальным из подходящих значений нужно проверить, является ли она подставным элементом, если да, то перейдем по ссылке влево, попав в ответ для текущего каталога, иначе это и будет ответ.node cell = binary_search(M[1], x) if (cell.is_alien) cell = cell.left ans[1] = cell.key; for i = 2 to k cell = cell.left.down if (cell.right <= x) cell = cell.right if (cell.right <= x) cell = cell.right if (cell.is_alien) cell = cell.left ans[i] = cell.key
Как можно видеть, для того, чтобы найти ответ для первого каталога необходимо сделать один бинарный поиск, что требует
времени, после чего необходимо времени, чтобы ответить на запрос для всех остальных каталогов. Суммарное время работы .