Алгоритм Фарака-Колтона и Бендера — различия между версиями
|  (→Минимум внутри блока) | м (rollbackEdits.php mass rollback) | ||
| (не показаны 22 промежуточные версии 7 участников) | |||
| Строка 1: | Строка 1: | ||
| − | '''Алгоритм Фарака-Колтона, Бендера''' (англ. ''Farach-Colton, Bender'') — применяется для решения за <tex>\langle O(N),O(1) \rangle</tex> времени специального случая задачи <tex>\mathrm{RMQ}</tex> (поиск минимума на отрезке), в котором соседние элементы входной последовательности различаются на <tex> | + | '''Алгоритм Фарака-Колтона, Бендера''' (англ. ''Farach-Colton, Bender'') — применяется для решения за <tex>\langle O(N),O(1) \rangle</tex> времени специального случая задачи <tex>\mathrm{RMQ}</tex> (поиск минимума на отрезке), в котором соседние элементы входной последовательности различаются на <tex>\pm 1</tex>. Может быть использован также для [[Сведение задачи LCA к задаче RMQ|решения задачи <tex>\mathrm{LCA}</tex>]]. | 
| {{Задача | {{Задача | ||
| Строка 9: | Строка 9: | ||
| Данный алгоритм основывается на методе решения задачи <tex>\mathrm{RMQ}</tex> с помощью [[Решение RMQ с помощью разреженной таблицы|разреженной таблицы]] за <tex>\langle O(N \log N),O(1) \rangle</tex>. | Данный алгоритм основывается на методе решения задачи <tex>\mathrm{RMQ}</tex> с помощью [[Решение RMQ с помощью разреженной таблицы|разреженной таблицы]] за <tex>\langle O(N \log N),O(1) \rangle</tex>. | ||
| − | Чтобы избавиться от логарифма используется предподсчёт ответа для небольших подстрок входной последовательности. Разделим последовательность <tex>A_i</tex> на блоки длины <tex>\dfrac{1}{2}\log_2 N</tex>. Для каждого блока вычислим минимум на нём и определим <tex>B_i</tex> как позицию минимального элемента в <tex>i</tex>-ом блоке. | + | Чтобы избавиться от логарифма используется предподсчёт ответа для небольших подстрок входной последовательности. Разделим последовательность <tex>A_i</tex> на блоки длины <tex>K=\dfrac{1}{2}\log_2 N</tex>. Для каждого блока вычислим минимум на нём и определим <tex>B_i</tex> как позицию минимального элемента в <tex>i</tex>-ом блоке. | 
| − | На новой последовательности <tex>B_i</tex> построим [[Решение RMQ с помощью разреженной таблицы|разреженную таблицу]]. Теперь для ответа на запрос <tex>\mathrm{RMQ}</tex><tex>[l:r]</tex>, если <tex>l</tex> и <tex>r</tex> находятся в разных блоках, нам необходимо вычислить следующее:    | + | На новой последовательности <tex>B_i</tex> построим [[Решение RMQ с помощью разреженной таблицы|разреженную таблицу]]. При этом размер разреженной таблицы и время её построения будут равны: | 
| + | |||
| + | <tex>\dfrac{N}{K}\log\dfrac{N}{K}=\bigg(\dfrac{2N}{\log N}\bigg)\log\bigg(\dfrac{2N}{\log N}\bigg)=\bigg(\dfrac{2N}{\log N}\bigg)\bigg(1+\log\bigg(\dfrac{N}{\log N}\bigg)\bigg)\leqslant \dfrac{2N}{\log N}</tex> <tex>+2N=O(N)</tex> | ||
| + | |||
| + | Теперь для ответа на запрос <tex>\mathrm{RMQ}</tex><tex>[l:r]</tex>, если <tex>l</tex> и <tex>r</tex> находятся в разных блоках, нам необходимо вычислить следующее:    | ||
| * минимум на отрезке от <tex>l</tex> до конца блока, содержащего <tex>l</tex>; | * минимум на отрезке от <tex>l</tex> до конца блока, содержащего <tex>l</tex>; | ||
| * минимум по всем блокам, находящимся между блоками, содержащими <tex>l</tex> и <tex>r</tex>; | * минимум по всем блокам, находящимся между блоками, содержащими <tex>l</tex> и <tex>r</tex>; | ||
| * минимум от начала блока, содержащего <tex>r</tex>, до <tex>r</tex>. | * минимум от начала блока, содержащего <tex>r</tex>, до <tex>r</tex>. | ||
| − | Ответом на запрос будет позиция меньшего из  | + | Ответом на запрос будет позиция меньшего из этих трёх элементов. | 
| [[Файл:F-C_B_algo.png|500px|center|Части, из которых состоит ответ на запрос RMQ]] | [[Файл:F-C_B_algo.png|500px|center|Части, из которых состоит ответ на запрос RMQ]] | ||
| Строка 38: | Строка 42: | ||
| }} | }} | ||
| − | Осталось создать <tex>O(\sqrt N)</tex> таблиц {{---}} по одной для каждого типа блока. В такую таблицу необходимо занести предподсчитанные ответы на все возможные запросы минимума внутри блока соответствующего типа, которых <tex>\bigg(\dfrac{1}{2}\log_2 N\bigg)^2 = O(\log^2 N)</tex>. Для каждого блока в <tex>B_i</tex> необходимо заранее вычислить его тип. Таким образом мы получили возможность отвечать на запрос минимума по любой части блока за <tex>O(1)</tex>, затратив на предподсчёт <tex>O( | + | Осталось создать <tex>O(\sqrt N)</tex> таблиц {{---}} по одной для каждого типа блока. В такую таблицу необходимо занести предподсчитанные ответы на все возможные запросы минимума внутри блока соответствующего типа, которых <tex>\bigg(\dfrac{1}{2}\log_2 N\bigg)^2 = O(\log^2 N)</tex>. Для каждого блока в <tex>B_i</tex> необходимо заранее вычислить его тип. Для этого нужно подобрать некоторую функцию из множества блоков в множество натуральных чисел, не вызывающую коллизий. Например, вектор из нулей и единиц, соответствующий типу блока, можно записать в целочисленный тип. Таким образом мы получили возможность отвечать на запрос минимума по любой части блока за <tex>O(1)</tex>, затратив на предподсчёт <tex>O(N)</tex> времени. | 
| === Псевдокод === | === Псевдокод === | ||
| − | |||
|    '''function''' precalc(A: '''int[N]'''):   |    '''function''' precalc(A: '''int[N]'''):   | ||
| Строка 47: | Строка 50: | ||
|      K = <tex>\lceil</tex>N / block_size<tex>\rceil</tex> <font color=green> // количество блоков </font>   |      K = <tex>\lceil</tex>N / block_size<tex>\rceil</tex> <font color=green> // количество блоков </font>   | ||
|      <font color=green>// предподсчитаем позиции минимумов в каждом блоке</font> |      <font color=green>// предподсчитаем позиции минимумов в каждом блоке</font> | ||
| − |      cur_block =  | + |      cur_block = -1 | 
| − | |||
|      '''for''' i = 0 '''to''' K - 1   |      '''for''' i = 0 '''to''' K - 1   | ||
|        B[i] = -1   |        B[i] = -1   | ||
|      '''for''' i = 0 '''to''' N - 1 |      '''for''' i = 0 '''to''' N - 1 | ||
| − |        '''if'''  | + |        '''if''' i '''mod''' block_size == 0   | 
| − | |||
|          cur_block++   |          cur_block++   | ||
|        '''if''' B[cur_block] = -1 '''or''' A[B[cur_block]] > A[i] |        '''if''' B[cur_block] = -1 '''or''' A[B[cur_block]] > A[i] | ||
| Строка 63: | Строка 64: | ||
|        '''for''' i = 0 '''to''' K - 1 |        '''for''' i = 0 '''to''' K - 1 | ||
|          ind = (1 << (j - 1)) + i |          ind = (1 << (j - 1)) + i | ||
| − |          '''if''' ind  | + |          '''if''' ind ≥ K | 
|            ST[i][j] = ST[i][j - 1] |            ST[i][j] = ST[i][j - 1] | ||
|          '''else if''' A[ST[i][j - 1]] > A[ST[ind][j - 1]] |          '''else if''' A[ST[i][j - 1]] > A[ST[ind][j - 1]] | ||
| Строка 69: | Строка 70: | ||
|          '''else''' |          '''else''' | ||
|            ST[i][j] = ST[i][j - 1] |            ST[i][j] = ST[i][j - 1] | ||
| − |      <font color=green>// Посчитаем  | + |      <font color=green>// Посчитаем тип для каждого блока</font> | 
| + |     '''for''' i = 0 '''to''' K - 1  | ||
| + |       type[i] = 0  | ||
|      cur_block = 0 |      cur_block = 0 | ||
|      j = 0 |      j = 0 | ||
| − | + |      i = 0 | |
| − | + |      '''while''' i < N or j < block_size | |
| − |      ''' | + |        '''if''' j ≥ block_size   | 
| − |        '''if''' j  | ||
|          j = 0 |          j = 0 | ||
|          cur_block++   |          cur_block++   | ||
| − |        '''if''' j > 0 '''and''' (i  | + |        '''if''' j > 0 '''and''' (i ≥ N '''or''' A[i - 1] < A[i]) | 
| − | + |          type[cur_block] += (1 << (j - 1))   | |
| + |       i++ | ||
| + |       j++ | ||
|      <font color=green>// Осталось только для каждого блока предподсчитать позиции минимумов на всех подотрезках</font> |      <font color=green>// Осталось только для каждого блока предподсчитать позиции минимумов на всех подотрезках</font> | ||
|      '''for''' i = 0 '''to''' K - 1 |      '''for''' i = 0 '''to''' K - 1 | ||
| Строка 86: | Строка 90: | ||
|            block_min[i][l][r] = -1   |            block_min[i][l][r] = -1   | ||
|      '''for''' i = 0 '''to''' K - 1 |      '''for''' i = 0 '''to''' K - 1 | ||
| − |        type  | + |        t = type[i] | 
| − |        '''if''' block_min[ | + |        '''if''' block_min[t][0][0] = -1 <font color=green>// если там записано, что-то отличное от -1, то значит, мы уже посчитали ответ для такого типа отрезков</font> | 
|          '''for''' l = 0 '''to''' block_size - 1 |          '''for''' l = 0 '''to''' block_size - 1 | ||
| − |            block_min[ | + |            block_min[t][l][l] = l | 
|            '''for''' r = l + 1 '''to''' block_size - 1 |            '''for''' r = l + 1 '''to''' block_size - 1 | ||
| − |              block_min[ | + |              block_min[t][l][r] = block_min[t][l][r - 1] | 
| − |              '''if''' i * block_size + r  | + |              '''if''' i * block_size + r ≤ N '''and''' A[i * block_size + block_min[t][l][r]] > A[i * block_size + r] | 
| − |                  block_min[ | + |                  block_min[t][l][r] = r | 
|    '''function''' block_RMQ(block_number: '''int''', l: '''int''', r: '''int'''): '''int''' |    '''function''' block_RMQ(block_number: '''int''', l: '''int''', r: '''int'''): '''int''' | ||
| − |      '''return''' block_min[ | + |      '''return''' block_min[type[block_number]][l][r] + block_number * block_size | 
|    '''function''' RMQ(l: '''int''', r: '''int'''): '''int''' |    '''function''' RMQ(l: '''int''', r: '''int'''): '''int''' | ||
| Строка 104: | Строка 108: | ||
|        '''return''' A[block_RMQ(bl, l % block_size, r % block_size)] |        '''return''' A[block_RMQ(bl, l % block_size, r % block_size)] | ||
|      '''if''' bl + 1 < br <font color=green>// найдем минимум на блоках между крайними, если таковые есть</font> |      '''if''' bl + 1 < br <font color=green>// найдем минимум на блоках между крайними, если таковые есть</font> | ||
| − |        power = log(br - bl  | + |        power = log(br - bl - 1) | 
|        ansb = min(A[ST[bl + 1][power]], A[ST[br - (1 << power)][power]]) |        ansb = min(A[ST[bl + 1][power]], A[ST[br - (1 << power)][power]]) | ||
|      ansl = A[block_RMQ(bl, l % block_size, block_size - 1)] <font color=green>// найдем минимум на отрезке от l до конца блока, содержащего l</font> |      ansl = A[block_RMQ(bl, l % block_size, block_size - 1)] <font color=green>// найдем минимум на отрезке от l до конца блока, содержащего l</font> | ||
| − |      ansr = A[block_RMQ( | + |      ansr = A[block_RMQ(br, 0, r % block_size)] <font color=green>// найдем минимум от начала блока, содержащего r, до r </font>     | 
|      '''return''' min(ansb, min(ansl, ansr)) |      '''return''' min(ansb, min(ansl, ansr)) | ||
| − | |||
| − | |||
| − | |||
| − | |||
| === Результат === | === Результат === | ||
Текущая версия на 19:39, 4 сентября 2022
Алгоритм Фарака-Колтона, Бендера (англ. Farach-Colton, Bender) — применяется для решения за времени специального случая задачи (поиск минимума на отрезке), в котором соседние элементы входной последовательности различаются на . Может быть использован также для решения задачи .
| Задача: | 
| Дан массив целых чисел, соседние элементы которого отличаются на . Поступают онлайн запросы вида , для каждого из которых требуется найти минимум среди элементов . | 
Содержание
Алгоритм
Данный алгоритм основывается на методе решения задачи с помощью разреженной таблицы за .
Чтобы избавиться от логарифма используется предподсчёт ответа для небольших подстрок входной последовательности. Разделим последовательность на блоки длины . Для каждого блока вычислим минимум на нём и определим как позицию минимального элемента в -ом блоке.
На новой последовательности построим разреженную таблицу. При этом размер разреженной таблицы и время её построения будут равны:
Теперь для ответа на запрос , если и находятся в разных блоках, нам необходимо вычислить следующее:
- минимум на отрезке от до конца блока, содержащего ;
- минимум по всем блокам, находящимся между блоками, содержащими и ;
- минимум от начала блока, содержащего , до .
Ответом на запрос будет позиция меньшего из этих трёх элементов.
Второй элемент мы уже умеем находить за с помощью и разреженной таблицы. Осталось научиться находить минимум по отрезку, границы которого не совпадают с границами блоков.
Минимум внутри блока
| Утверждение: | 
| Если две последовательности  и  таковы, что все их элементы на соответствующих позициях различаются на одну и ту же константу (т.е. ), то любой запрос  даст один и тот же ответ для обеих последовательностей. | 
Таким образом, мы можем нормализовать блок, вычтя из всех его элементов первый. Тем самым мы значительно уменьшим число возможных типов блоков.
| Утверждение: | 
| Существует  различных типов нормализованных блоков. | 
| Соседние элементы в блоках отличаются на . Первый элемент в нормализованном блоке всегда равен нулю. Таким образом, каждый нормализованный блок может быть представлен -вектором длины . Таких векторов . | 
Осталось создать таблиц — по одной для каждого типа блока. В такую таблицу необходимо занести предподсчитанные ответы на все возможные запросы минимума внутри блока соответствующего типа, которых . Для каждого блока в необходимо заранее вычислить его тип. Для этого нужно подобрать некоторую функцию из множества блоков в множество натуральных чисел, не вызывающую коллизий. Например, вектор из нулей и единиц, соответствующий типу блока, можно записать в целочисленный тип. Таким образом мы получили возможность отвечать на запрос минимума по любой части блока за , затратив на предподсчёт времени.
Псевдокод
function precalc(A: int[N]): block_size = log(N) / 2 // размеры блоков K = N / block_size // количество блоков // предподсчитаем позиции минимумов в каждом блоке cur_block = -1 for i = 0 to K - 1 B[i] = -1 for i = 0 to N - 1 if i mod block_size == 0 cur_block++ if B[cur_block] = -1 or A[B[cur_block]] > A[i] B[cur_block] = i // построим Sparse table на массиве B for i = 0 to K - 1 ST[i][0] = B[i] for j = 1 to log(N) for i = 0 to K - 1 ind = (1 << (j - 1)) + i if ind ≥ K ST[i][j] = ST[i][j - 1] else if A[ST[i][j - 1]] > A[ST[ind][j - 1]] ST[i][j] = ST[ind][j - 1] else ST[i][j] = ST[i][j - 1] // Посчитаем тип для каждого блока for i = 0 to K - 1 type[i] = 0 cur_block = 0 j = 0 i = 0 while i < N or j < block_size if j ≥ block_size j = 0 cur_block++ if j > 0 and (i ≥ N or A[i - 1] < A[i]) type[cur_block] += (1 << (j - 1)) i++ j++ // Осталось только для каждого блока предподсчитать позиции минимумов на всех подотрезках for i = 0 to K - 1 for l = 0 to block_size - 1 for r = 0 to block_size - 1 block_min[i][l][r] = -1 for i = 0 to K - 1 t = type[i] if block_min[t][0][0] = -1 // если там записано, что-то отличное от -1, то значит, мы уже посчитали ответ для такого типа отрезков for l = 0 to block_size - 1 block_min[t][l][l] = l for r = l + 1 to block_size - 1 block_min[t][l][r] = block_min[t][l][r - 1] if i * block_size + r ≤ N and A[i * block_size + block_min[t][l][r]] > A[i * block_size + r] block_min[t][l][r] = r
function block_RMQ(block_number: int, l: int, r: int): int return block_min[type[block_number]][l][r] + block_number * block_size
 function RMQ(l: int, r: int): int
   bl = l / block_size
   br = r / block_size
   if bl = br // если оба индекса внутри одного блока
     return A[block_RMQ(bl, l % block_size, r % block_size)]
   if bl + 1 < br // найдем минимум на блоках между крайними, если таковые есть
     power = log(br - bl - 1)
     ansb = min(A[ST[bl + 1][power]], A[ST[br - (1 << power)][power]])
   ansl = A[block_RMQ(bl, l % block_size, block_size - 1)] // найдем минимум на отрезке от l до конца блока, содержащего l
   ansr = A[block_RMQ(br, 0, r % block_size)] // найдем минимум от начала блока, содержащего r, до r    
   return min(ansb, min(ansl, ansr))
Результат
Итого, на предподсчёт требуется времени и памяти, а ответ на запрос вычисляется за .
См. также
- Решение RMQ с помощью разреженной таблицы
- Сведение задачи RMQ к задаче LCA
- Сведение задачи LCA к задаче RMQ
Источники информации
- Bender, M.A., Farach-Colton, M. — The LCA Problem Revisited. LATIN (2000), с. 88-94

