Изменения

Перейти к: навигация, поиск

Решение RMQ с помощью разреженной таблицы

1250 байт добавлено, 22:33, 5 сентября 2019
м
Правка орфографии
'''Разреженная таблица''' (англ. ''sparse table'') позволяет решать задачу online static RMQ (получение минимума или максимума на отрезке, когда элементы массива не могут изменяться, а запросы поступают последовательно) за <tex>O(1)</tex> на запрос, с предподсчётом за <tex>O(N \log N)</tex> и использованием <tex>O(N \log N)</tex> памяти. {{Задача|definition == Постановка задачи RMQ ==Дан массив <tex>A[1..\ldots N]</tex> действительных целых чисел. Поступают запросы вида <tex>(l, r)</tex>: , для каждого из которых требуется найти минимум в подмассиве среди элементов <tex>A[l], A[l + 1], \dotsldots, A[r] </tex>.}}
== Разреженная таблица ==
Разреженная таблица — двумерная структура данных <tex>ST[i, ][j]</tex>, для которой выполнено следующее:  <tex>ST[i][j]=\min\left(A[i], A[i+1], ...\ldots, A[i+2^{j}-1]\right),\quad j \in [0 .. \ldots \log N]</tex>.  Иначе говоря, в этой таблице хранятся минимумы на всех отрезках, длины которых равны степеням двойки. Объёмпамяти, занимаемый таблицей, равен <tex>O(N \log N)</tex>, и заполненными являются только те элементы, для которых <tex>i+2^j \le leqslant N </tex>.
Простой метод построения таблицы заключён в следующем реккурентном рекуррентном соотношении: $$ST[i][j]=\begin{cases}\min\left(ST[i][j-1], ST[i+2^{j-1}][j-1]\right),&\text{если $j > 0$;}\\A[i], &\text{если $j = 0$;}\end{cases}$$
<tex> ST[i][j] = \left\{ \begin{array}{rcl} \min\left(ST[i][j-1], ST[i+2^{j-1}][j-1]\right), j > 0 \\ A[i], j = 0 \\ \end{array} \right. </tex> .=== Идемпотентность ===
Такая простота достигается за счет идемпотентности операции минимум: <tex>\min(a, a)=a</tex>. Это один из ключевых моментов этого метода, так как она позволяет нам корректно считать минимум в области пересечения отрезков.
<wikitex>Пусть $\circ$ - произвольная бинарная операция, которая удовлетворяет свойствам:* ассоциативности {{---}} : $a \circ (b \circ c) = (a \circ b) \circ c $;,* коммутативности {{---}} : $a \circ b = b \circ a$;, * идемпотентности {{---}} : $a \circ a = a $.
{{Утверждение
|statement=
$a_l \circ a_{l+1} \circ \dots ldots \circ a_r = (a_l \circ a_{l+1} \circ \dots ldots \circ a_ka_{l + k}) \circ (a_{r - k} \circ a_{r - k + 1} \circ \dots ldots \circ a_r)$, где $\frac{r - l }{2} \leqslant k \leqslant r- l$.
|proof=
Покажем, что Отрезок $a \circ b \circ c \circ d = (a \circ b \circ c) \circ (b \circ c \circ da_{r-k}, a_{l + k})$содержится в обоих операндах правой части. ДействительноЗначит, $a \circ b \circ c \circ b \circ c \circ d = a \circ b \circ b \circ c \circ c \circ d = a \circ b \circ c \circ d $каждый элемент из него входит два раза. Будем применять это к выражению По коммутативности мы можем располагать элементы в любом порядке, по ассоциативности мы можем выполнять операции в произвольном порядке, поэтому повторяющие в правой части равенства до тех пор, пока не получим элементы мы можем расположить рядом друг с другом и затем по идемпотентности один из них убрать. Переставляя оставшиеся элементы в правой затем легко получаем выражение в левой части. Поле каждого шага количество одинаковых элементов сократится на два. А так как их конечное четное число, то и количество шагов будет конечным.
}}
Таким образом мы получаем целый класс задач, которые могут решаться разреженной таблицей.
</wikitex>
== Применение к задаче RMQ ==
 
<div> Предпосчитаем для длины отрезка <tex>l</tex> величину <tex>\lfloor \log_2l \rfloor</tex>. Для этого введем функцию <tex>fl</tex> (от ''floor'', т.к. логарифм округляется вниз):
 
'''int''' '''fl'''('''int''' len):
'''if''' len <tex>=</tex> 1
'''return''' 0
'''else'''
'''return''' fl(<tex>\lfloor \cfrac{len}{2}\rfloor</tex>) + 1
 
Вычисление <tex>fl[l]</tex> происходит за <tex>O(\log (l))</tex>. А так как длина может принимать <tex>N</tex> различных значений, то суммарное время предпосчета составляет <tex>O(N\log N)</tex>.
 
Пусть теперь дан запрос <tex>(l, r)</tex>. Заметим, что <tex>\min(A[l], A[l+1], \ldots, A[r]) = \min\left(ST[l][j], ST[r-2^j+1][j]\right)</tex>, где <tex>j = \max \{k \mid 2^k \leqslant r - l + 1\}</tex>, то есть логарифм длины запрашиваемого отрезка, округленный вниз. Но эту величину мы уже предпосчитали, поэтому запрос выполняется за <tex>O (1)</tex>.
 
[[Файл:SparseTableRMQ.png|right|Решение задачи RMQ на разреженной таблице]]
<div>Дан запрос <tex>(l, r)</tex>. По нему найдем <tex>k = \max \{j| 2^j \le r - l + 1\}</tex>, т.е. логарифм длины запрашиваемого отрезка. Заметим, что <tex>k</tex> зависит лишь от длины отрезка. Предпосчитать эту величину за <tex>O(N\log N)</tex> можно введением функции <tex>fl[l] = k</tex>, для которой верно <tex>fl[1] = 0, fl[x] = fl[\lfloor \frac{x}{2}\rfloor] + 1</tex>.Далее заметимИз выше доказанной теоремы следует, что <tex>\min(A[l]этот метод работает не только с операцией минимум, A[l+1]но и с любой идемпотентной, ассоциативной и коммутативной операцией..., A[r]) = \min\left(ST[l][k], ST[r-2^k+1][j]\right)</tex>. Таким образом мы можем находить <tex>k</tex> за <tex>O(1)</tex>получаем целый класс задач, решаемых разреженной таблицей.</div>
<div style="clear:both"></div>
* [[Алгоритм Фарака-Колтона и Бендера | Алгоритм Фарака-Колтона и Бендера]]
* [[Сведение задачи RMQ к задаче LCA | Сведение задачи RMQ к задаче LCA]]
* [[ Heavy-light декомпозиция | Heavy-light декомпозиция]]
== Источники информации==
* ''Bender, M.A., Farach-Colton, M. et al.'' — '''Lowest common ancestors in trees and directed acyclic graphs'''. — J. Algorithms 57(2) (2005) — с. 75–94.
 
[[Категория: Алгоритмы и структуры данных]]
[[Категория: Задача о наименьшем общем предке]]
24
правки

Навигация