Изменения

Алгоритм Мо

3118 байт добавлено, 12:57, 11 июля 2021

Нет описания правки

'''Алгоритм Мо''' (англ. ''Mo's algorithm'') — применяется для решения задач, в которых требуется отвечать на запросы <tex>aarr[l \~~dots~~ ldots r]</tex> на массиве ''без'' изменения элементов в оффлайн за время <tex>O(Q \cdot \log{Q} + (N + Q) \cdot \sqrt{N})</tex>, где <tex>Q</tex> {{--- }} количество запросов,а <tex>N</tex> {{--- }} количество элементов в массиве. Характерными примерами задач на этот алгоритм являются: нахождение ~~моды~~ медианы на отрезке (число, которое встречается больше всех остальных),

вычисление количества инверсий на отрезке.

==Алгоритм==

В каждый момент времени ~~поддерживаем структуру данных, в которой хранится некоторый~~ будем хранить непрерывный отрезок <tex>[a \~~dots~~ ldots b]</tex> исходного массива (будем называть его рабочим отрезком), вместе со структурой данных,которая ~~поддерживает~~ умеет обрабатывать следующие операции:* <tex>~~AddLeft~~\mathtt{addLeft(a-1)}</tex>, <tex>~~AddRight~~\mathtt{addRight(b+1)}</tex> {{--- }} операции, которые позволяют добавить элемент в рабочий отрезок слева и справа соответственно.;* <tex>~~DelLeft~~\mathtt{delLeft(a)}</tex>, <tex>~~DelRight~~\mathtt{delRight(b)}</tex> {{--- }} операции, которые позволяют удалить элемент рабочего отрезка слева и справа соответственно.;* <tex>~~Answer~~\mathtt{answer}</tex> {{--- }} операция, которая позволяет получить ответ на запрос, если бы его границами был рабочий отрезок.

Изначально в качестве рабочего отрезка можно взять любой отрезок. Для удобства чтения будем считать изначальным отрезок <tex>[1;1)</tex>, ~~если не не забыть~~то есть <tex>a = 1</tex>, <tex>b = 0</tex>, фактически {{---}} пустой отрезок.

Запишем все запросы в массив, ~~некоторым образом~~ отсортируем их ~~отсортируем и~~ определённым способом (который будет описан ниже) будем их обрабатывать в том порядке, в котором они будут лежать в массиве после [[Сортировки | сортировки]].

Допустим, что текущий рабочий отрезок — <tex>[a \~~dots~~ ldots b]</tex>, а первый необработанный запрос — <tex>[l_i, r_i]</tex> тогда ~~сначала расширим наш~~ рассмотрим случаи: * Если изначально было <tex> a > l_i </tex>, то будем добавлять в рабочий отрезокэлементы слева по одному, пока граница не совпадёт;~~используя только операции~~ * Если же это не так, то есть <tex>~~AddLeft~~a < l_i </tex>это значит, что в рабочем отрезке присутствуют те элементы, которых там быть не должно, и они должны быть удалены;* При равенстве <tex>a=l_i</tex> никаких действий с левой границей рабочего отрезка производить не потребуется. Аналогично поступим с <tex>~~AddRight~~b</tex> и <tex>r_i</tex>. Для компактности и наглядности кода мы сначала расширим рабочий отрезок до отрезка <tex>[l \~~dots~~ ldots r]</tex>,где <tex>l = \min(a, l_i)</tex>, а <tex>r = \max(b, r_i)</tex>, а затем удалим лишние элементы при помощи операций <tex>~~DelLeft~~\mathtt{delLeft}</tex>, <tex>~~DelRight~~\mathtt{delRight}</tex>, чтобы получить отрезок <tex>[l_i \~~dots~~ ldots r_i]</tex>, после чего вызовем <tex>~~Answer~~\mathtt{answer}</tex> и запомним ответ для этого запроса.

Теперь разберём поподробнее, как именно следует сортировать запросы для достижения вышеназванной асимптотики по времени.

~~Давайте разделим~~ Разделим все запросы на блоки размера <tex>K</tex> по левой границе: те запросы, для которых <tex>1 \le leqslant l_i \le leqslant K</tex> {{- --}} попадают в первую группу, те запросы, для которых <tex>K + 1 \le leqslant l_i \le leqslant 2 \cdot K</tex> {{--- }} во вторую, <tex>2 \cdot K + 1 \le leqslant l_i \le leqslant 3 \cdot K</tex> {{--- }} в третью, и так далее. Будем рассматривать все группы запросов независимо друг от друга. Если внутри каждой группы отсортировать запросы по увеличению правой ~~границе~~границы, ~~будет нетрудно заметить, что~~ то асимптотика по времени для ~~всей~~ обработки одной группы ~~суммарно~~ будет ~~выполнено не больше чем~~ <tex>~~3 \cdot~~ O(N + Q_i \cdot K)</tex> ~~операций <tex>Add</tex> и <tex>Del</tex>~~ , где <tex>Q_i</tex> {{--- }} количество запросов, принадлежащих группе под номером <tex>i</tex>.

Для доказательства этого давайте рассмотрим отдельно количество сделанных операций каждого из четырёх типов:==Доказательство==* ИзначальноДокажем, ~~до обработки~~ что на обработку одной группы, рабочий отрезок был <tex>[a \dots b]</tex>, для обработки первого запроса может потребоваться <tex>2 \cdot N</tex> операций <tex>Add</tex>, <tex>Del</tex>* <tex>DelRight</tex> не произойдёт ни разу, т.к. рабочий отрезок будет только расширяться в сторону правого конца* <tex>AddRight</tex> произойдёт суммарно уйдёт не больше чем <tex>3 \cdot N+ Q_i \cdot K</tex> ~~раз, так как минимальная правая граница - <tex>1</tex>, а максимальная - <tex>N</tex>~~* Для оставшихся двух операций ~~рассмотрим два последовательных запроса~~ <tex>~~[l_i~~ \~~dots r_i]~~mathtt{add}</tex>, и <tex>~~[l_j~~ \~~dots r_j]~~mathtt{del}</tex>. Нетрудно заметить, что так как отрезки принадлежат одной группе, то <tex>|l_i - l_j| < K</tex>, следовательно, количество операций <tex>AddLeft</tex> или <tex>DelLeft</tex> также не будет превосходить <tex>K</tex>

~~Таким образом~~Для этого рассмотрим отдельно количество сделанных операций каждого из четырёх типов:* изначально, ~~нетрудно видеть~~до обработки группы, рабочий отрезок был <tex>[a \ldots b]</tex>, для обработки первого запроса может потребоваться <tex>2 \cdot N</tex> операций <tex>\mathtt{add}</tex>, <tex>\mathtt{del}</tex>;* <tex>\mathtt{delRight}</tex> между отрезками одной группы не произойдёт ни разу, ~~все~~ так как рабочий отрезок внутри одной группы ~~будут обработаны за время~~ будет только расширяться в сторону правого конца;* <tex>O(\~~frac~~mathtt{addRight}</tex> в этой группе произойдёт суммарно не больше чем <tex>N^2</tex> раз, так как минимальная правая граница {{---}}<tex>1</tex>, а максимальная {{---}} <tex>N</tex>;* для оставшихся двух операций рассмотрим два последовательных запроса <tex>[l_i \ldots r_i]</tex>, <tex>[l_j \ldots r_j]</tex>. Нетрудно заметить, что так как отрезки принадлежат одной группе, то <tex>|l_i - l_j| < K</tex>, следовательно, количество операций <tex>\mathtt{addLeft}</tex> или <tex>\mathtt{delLeft} + </tex> не будет превосходить <tex>K </tex>, а суммарно для всей группы {{---}} <tex>Q_i \cdot Q)K</tex>.

Таким образом, нетрудно видеть, все группы будут обработаны за время <tex>O \left( \dfrac{N^2}{K} + K \cdot Q \right) </tex>. При выборе <tex>K = \sqrt{N}</tex> с учётом сортировки по правой границе получается асимптотика времени <tex>O(Q \cdot \log Q + (N + Q) \cdot \sqrt N)</tex>.

==Реализация==

'''int''' K = sqrt(N)

'''int''' a = 1, b = 0 // создаём пустой рабочий отрезок

'''bool''' ~~compare~~isLess('''Query''' a, '''Query''' b): '''if''' (a.l / K != b.l / K):

'''return''' a.l < b.l

'''return''' a.r < b.r

'''function''' process('''Query'''[Q] q):

sort(q, ~~compare~~isLess) //сортируем запросы, используя функцию '''~~compare~~isLess''' как оператор сравнения '''~~int~~for''' ~~a = 1, b~~ i = 0 ~~//создаём пустой рабочий отрезок~~ '''~~for~~to''' ~~i = 0 to~~ Q - 1: '''while''' (a > q[i].l): ~~AddLeft~~addLeft(a - 1)

a -= 1

'''while''' (b < q[i].r): ~~AddRight~~addRight(b + 1)

b += 1

'''while''' (a < q[i].l): ~~DelLeft~~delLeft(a)

a += 1

'''while''' (b > q[i].r): ~~DelRight~~delRight(b)

b -= 1

result[q[i].id] = ~~Answer~~answer()// получаем ответ на [a...b]

Рассмотрим для наглядности решение задачи нахождения моды на отрезке:

Будем использовать код описанный выше, осталось только описать операции <tex>~~AddLeft~~\mathtt{addLeft}</tex>, <tex>~~AddRight~~\mathtt{addRight}</tex>, <tex>~~DelLeft~~\mathtt{delLeft}</tex>, <tex>~~DelRight~~\mathtt{delRight}</tex>.

Так как в данной задаче порядок чисел на отрезке не важен, важно лишь количество вхождений каждого, то реализация отдельных функций для добавления слева и справа нам не потребуется.

Для простоты будем считать, что все числа '''не превышают <tex>N</tex>''', тогда будем хранить массив <tex>cnt[N + 1]</tex>, где <tex>cnt[value]</tex> - количество вхождений числа <tex>value</tex> в рабочем отрезке. Будем помимо этого массива хранить отсортированное множество <tex>current</tex>, в котором будут содержаться все пары вида <tex>\langle \mathtt{cnt[value]}, \mathtt{value} \rangle</tex>, для ненулевых <tex>cnt[value]</tex>. Реализовать его можно, например, используя [[Красно-черное_дерево | красно-черное дерево]] Тогда операции будут иметь следующий вид: '''function''' ~~Add~~add('''int''' index): '''int''' value = arr[index] '''if''' cnt[value] > 0: current.erase((cnt[value], value))

cnt[a[index]] += 1

~~update_best~~current.insert((cnt[value], value))

'''function''' ~~Del~~del('''int''' index): '''int''' value = arr[index] current.erase((cnt[value], value))

cnt[a[index]] -= 1

~~update_best~~'''if''' cnt[value] > 0: current.insert((cnt[value], value)) '''function''' answer(): '''int''' '''return''' current.max.second // находим максимальную пару в множестве Итоговая асимптотика решения: <tex>O(Q \cdot \log Q + (N + Q) \cdot \sqrt{N} \cdot \log N)</tex>. == См. также ==* [[Статистики_на_отрезках._Корневая_эвристика | Корневая эвристика]]* [[Решение_RMQ_с_помощью_разреженной_таблицы#.D0.A0.D0.B0.D0.B7.D1.80.D0.B5.D0.B6.D0.B5.D0.BD.D0.BD.D0.B0.D1.8F_.D1.82.D0.B0.D0.B1.D0.BB.D0.B8.D1.86.D0.B0 | Разреженная таблица]] ==Источники информации==* [https://www.hackerearth.com/practice/notes/mos-algorithm/ HackerEarth - Mo's algorithm]

В данном случае реализовать '''update_best''' будет проще всего используя <tex>TreeSet</tex> или его аналоги из стандартной библиотеки языка. Стоит отметить, что это добавляет множитель <tex>O(\log N)</tex> в асимптотике. Итоговая асимптотика тогда <tex>O(Q \cdot \log{Q} + (N + Q) \cdot \sqrt{N} \cdot \log N)</tex>[[Категория: Алгоритмы и структуры данных]][[Категория:Сортировки]][[Категория: Задача о наименьшем общем предке]]

Анонимный участник

188.130.155.161

Изменения

Алгоритм Мо

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты