Meet-in-the-middle — различия между версиями

Текущая версия на 19:31, 4 сентября 2022

Определение:

Встреча в середине (англ. Meet-in-the-middle) — это метод решения уравнения вида , где и , который работает за время , где — время построения множества , — время поиска элемента в множестве , удовлетворяющее решению при заданном , или проверка, что такого не существует.

Meet-in-the-middle разбивает задачу пополам и решает всю задачу через частичный расчет половинок. Он работает следующим образом: переберем все возможные значения [math] {x} [/math] и запишем пару значений [math] ({x},{f({x})}) [/math] в множество. Затем будем перебирать всевозможные значения [math] y [/math], для каждого из них будем вычислять [math] g(y) [/math], которое мы будем искать в нашем множестве. Если в качестве множества использовать отсортированный массив, а в качестве функции поиска — бинарный поиск, то время работы нашего алгоритма составляет [math] {O(X\log{X})} [/math] на сортировку, и [math] {O(Y\log{X})} [/math] на двоичный поиск, что дает в сумме [math]{O((X + Y)\log{X}})[/math].

Содержание

1 Задача о нахождении четырех чисел с суммой равной нулю
- 1.1 Реализация
2 Задача о рюкзаке
- 2.1 Алгоритм
- 2.2 Реализация
3 Задача о количестве полных подграфов в графе
- 3.1 Алгоритм решения
4 Задача о нахождении кратчайшего расстояния между двумя вершинами в графе
- 4.1 Алгоритм решения
5 См. также
6 Источники информации

Задача о нахождении четырех чисел с суммой равной нулю

Дан массив целых чисел [math]{A}[/math]. Требуется найти любые [math] 4 [/math] числа, сумма которых равна [math] 0 [/math] (одинаковые элементы могут быть использованы несколько раз).

Например : [math] {A} = ({2,3,1,0,-4,-1}) [/math]. Решением данной задачи является, например, четверка чисел [math] 3 + 1 + 0 - 4 = 0[/math] или [math] 0 + 0 + 0 + 0 = 0[/math].

Наивный алгоритм заключается в переборе всевозможных комбинаций чисел. Это решение работает за [math] {O(N^4)}[/math]. Теперь, с помощью Meet-in-the-middle мы можем сократить время работы до [math] {O(N^2\log{N}}) [/math].

Для этого заметим, что сумму [math] a + b + c + d = 0 [/math] можно записать как [math] a + b = -(c + d)[/math]. Мы будем хранить все [math] {N^2} [/math] пар сумм [math] a + b [/math] в массиве [math] sum [/math], который мы отсортируем. Далее перебираем все [math] {N^2} [/math] пар сумм [math] c + d [/math] и проверяем бинарным поиском, есть ли сумма [math] -(c + d) [/math] в массиве [math] sum [/math].

Реализация

 // sum — массив сумм a + b, cnt — счетчик массива sum
 function findsum(int[N] A): String
   for a = 0..N - 1
     for b = 0..N - 1
       sum[cnt].res = A[a] + A[b]
       sum[cnt].a = a
       sum[cnt].b = b
       cnt++
   sort(sum, key = "res") // сортируем sum по полю res 
   for c = 0..N - 1
     for d = 0..N - 1
       if сумма - (A[c] + A[d]) есть в массив sum
          index = индекс суммы -(A[c] + A[d])
          return (sum[index].a, sum[index].b, A[c], A[d])
   return "No solution"

Итоговое время работы [math] {O(N^2\log{N}}) [/math].

Если вместо отсортированного массива использовать хэш-таблицу, то задачу можно будет решить за время [math] O(N^2) [/math].

Задача о рюкзаке

Классической задачей является задача о наиболее эффективной упаковке рюкзака. Каждый предмет характеризуется весом ([math] {w_{i} \leqslant 10^{9}} [/math] ) и ценностью (). В рюкзак, ограниченный по весу, необходимо набрать вещей с максимальной суммарной стоимостью. Для ее решения изначальное множество вещей N разбивается на два равных(или примерно равных) подмножества, для которых за приемлемое время можно перебрать все варианты и подсчитать суммарный вес и стоимость, а затем для каждого из них найти группу вещей из первого подмножества с максимальной стоимостью, укладывающуюся в ограничение по весу рюкзака. Сложность алгоритма . Память [math] O({2^{\frac{N}{2}}})[/math].

Алгоритм

Разделим наше множество на две части. Подсчитаем все подмножества из первой части и будем хранить их в массиве [math]\mathtt{first}[/math]. Отсортируем массив [math]\mathtt{first}[/math] по весу. Далее пройдемся по этому массиву и оставим только те подмножества, для которых не существует другого подмножества с меньшим весом и большей стоимостью. Очевидно, что подмножества, для которых существует другое, более легкое и одновременно более ценное подмножество, можно удалять. Таким образом в массиве [math]\mathtt{first}[/math] мы имеем подмножества, отсортированные не только по весу, но и по стоимости. Тогда начнем перебирать все возможные комбинации вещей из второй половины и находить бинарным поиском удовлетворяющие нам подмножества из первой половины, хранящиеся в массиве [math]\mathtt{first}[/math].

Реализация

 // N — количество всех вещей, w[N] — массив весов всех вещей, cost[N] — массив стоимостей всех вещей, R — ограничение по весу рюкзака.
 function knapsack(int[N] w, int[N] cost, int R): int
   sn = N / 2
   fn = N - sn
   for mask = 0..2 ** sn - 1
     for j = 0..sn
       if j-ый бит mask == 1
         first[i].w += w[j]
         first[i].c += cost[j]
   sort(first, key = "w") // сортируем first по весу 
   for i = 0..2 ** sn - 1
     if существует такое подмножество с индексом j, что first[j].w [math] \leqslant [/math] first[i].w and first[j].c [math] \geqslant [/math] first[i].c
       удалим множество с индексом i из массива first
   for mask = 0..2 ** fn - 1
     for j = 0..fn
       if j-ый бит mask == 1
         curw += w[j + sn]
         curcost += cost[j + sn]
     index = позиция, найденная бинарным поиском в массиве first, подмножества с максимальным весом, не превыщающим R - curv
     if first[index].w [math] \leqslant [/math] R - curw and first[index].c + curcost [math] \gt  [/math] ans
       ans = first[index].c + curcost
   return ans

Итоговое время работы .

Задача о количестве полных подграфов в графе

Граф с 23 × 1-вершинными кликами (сами вершины), 42 × 2-вершинными кликами (отрезки), 19 × 3-вершинными кликами (светло-синие и тёмно-синие треугольники) и 2 × 4-вершинными кликами (тёмно-синие зоны). Всего 86 клик.

Дан граф [math]G[/math], в котором [math]N[/math] вершин. Требуется подсчитать количество клик.

Наивное решение — перебор всех возможных подграфов и проверка для каждого, что он является кликой, сложность — [math]O(2^N \times N^2)[/math]

Этот алгоритм можно улучшить до [math]O(2^N \times N)[/math]. Для этого нужно в функции перебора хранить маску вершин, которые мы ещё можем добавить. Поддерживая эту маску, можно добавлять только «нужные» вершины, и тогда не нужно будет в конце проверять подграф на то что он — клика. Добавлять вершину можно за [math]O(1)[/math], используя побитовое И текущей маски и строчки матрицы смежности добавляемой вершины.

Алгоритм решения

Разбиваем граф [math]G[/math] на [math]2[/math] графа [math]{G}_1[/math] и [math]{G}_2[/math] по [math]\dfrac{N}{2}[/math] вершин. Находим за [math]O(2^{\frac{N}{2}})[/math] все клики в каждом из них.

Теперь надо узнать для каждой клики графа [math]{G}_1[/math] количество клик графа [math]{G}_2[/math], таких, что их объединение — клика. Их сумма и есть итоговый ответ.

Для одной клики [math]K[/math] графа [math]{G}_1[/math] может быть несколько подходящих клик в [math]{G}_2[/math]. О клике [math]K[/math] мы "знаем" только маску вершин графа [math]{G}_2[/math], которые ещё можно добавить. Для каждой такой маски в [math]{G}_2[/math] нужно предподсчитать ответ. С помощью динамического программирования предподсчитаем для каждой маски вершин графа [math]{G}_2[/math] количество клик, вершины которых являются подмножеством выбранной маски. Количество состояний — [math]2^{\frac{N}{2}}[/math]. Количество переходов:[math]N[/math] . Асимптотика — .

Для каждой клики [math]K[/math] (в том числе и пустой) графа [math]{G}_1[/math] прибавим к глобальному ответу предподсчитанное количество клик, которые можно добавить к [math]K[/math] (в том числе и пустых). Асимптотика: [math]O(2^{\frac{N}{2}})[/math].

Итоговая сложность:

Задача о нахождении кратчайшего расстояния между двумя вершинами в графе

Нахождение кратчайшего расстояния между двумя вершинами

Еще одна задача, решаемая Meet-in-the-middle — это нахождение кратчайшего расстояния между двумя вершинами, зная начальное состояние, конечное состояние и то, что длина оптимального пути не превышает [math] N [/math]. Стандартным подходом для решения данной задачи, является применение алгоритма обхода в ширину. Пусть из каждого состояния у нас есть [math] K [/math] переходов, тогда бы мы сгенерировали [math] {K^{N}} [/math] состояний. Асимптотика данного решения составила бы [math] {O({K^{N}})} [/math]. Meet-in-the-middle помогает снизить асимптотику до [math] {O({K^{\frac{N}{2}}})} [/math].

Алгоритм решения

1. Сгенерируем BFS-ом все состояния, доступные из начала и конца за [math] {\dfrac{N}{2}} [/math] или меньше ходов.

2. Найдем состояния, которые достижимы из начала и из конца.

3. Найдем среди них наилучшее по сумме длин путей.

Таким образом, BFS-ом из двух концов, мы сгенерируем максимум [math] {O({K^{\frac{N}{2}}})} [/math] состояний.

См. также

Источники информации

@@ Строка 1: / Строка 1: @@
 {{Определение
 |definition=
-'''Meet-in-the-middle''' (Встреча в середине)  — это метод решения уравнения вида <tex> f({x}) = g({y}) </tex>, где <tex> x \in {X} </tex> и <tex> y \in {Y} </tex>, который работает за время <tex> O(F(X) + Y \cdot G_X(y))</tex>, где <tex> F(X) </tex> {{---}} время построения множества <tex> X </tex>, <tex> G_X(y) </tex> {{---}} время поиска элемента <tex> x </tex> в множестве <tex> X </tex>, удовлетворяющее решению при заданном <tex> y </tex>, или проверка, что такого <tex> x </tex> не существует.
+'''Встреча в середине''' (англ. ''Meet-in-the-middle'')  — это метод решения уравнения вида <tex> f({x}) = g({y}) </tex>, где <tex> x \in {X} </tex> и <tex> y \in {Y} </tex>, который работает за время <tex> O(F(X) + Y \times G_X(y))</tex>, где <tex> F(X) </tex> {{---}} время построения множества <tex> X </tex>, <tex> G_X(y) </tex> {{---}} время поиска элемента <tex> x </tex> в множестве <tex> X </tex>, удовлетворяющее решению при заданном <tex> y </tex>, или проверка, что такого <tex> x </tex> не существует.
 }}
 '''Meet-in-the-middle''' разбивает задачу пополам и решает всю задачу через частичный расчет половинок. Он работает следующим образом: переберем все возможные значения <tex> {x} </tex> и запишем пару значений <tex> ({x},{f({x})}) </tex>  в множество. Затем будем перебирать всевозможные значения <tex> y </tex>, для каждого из них будем вычислять <tex> g(y) </tex>, которое мы будем искать в нашем множестве. Если в качестве множества использовать отсортированный массив, а в качестве функции поиска {{---}} [[Целочисленный двоичный поиск | бинарный поиск]], то время работы нашего алгоритма составляет <tex> {O(X\log{X})} </tex> на сортировку, и <tex> {O(Y\log{X})} </tex> на двоичный поиск, что дает в сумме <tex>{O((X + Y)\log{X}})</tex>.
@@ Строка 15: / Строка 15: @@
 === Реализация ===
-   // sum - массив сумм a + b, cnt - счетчик массива sum
+   <font color=darkgreen>// sum — массив сумм a + b, cnt — счетчик массива sum</font>
-   '''findsum'''():
+   '''function''' findsum('''int['''N''']''' A): String
      '''for''' a = 0..N - 1
        '''for''' b = 0..N - 1
-         sum[cnt].res = A[a] + B[b]
+         sum[cnt].res = A[a] + A[b]
          sum[cnt].a = a
          sum[cnt].b = b
          cnt++
-     sort(sum, key = "res") // сортируем sum по полю res
+     sort(sum, key = "res") <font color=darkgreen>// сортируем sum по полю res </font>
      '''for''' c = 0..N - 1
        '''for''' d = 0..N - 1
-         '''if''' сумма -(A[c] + A[d]) есть в массив sum
+         '''if''' сумма - (A[c] + A[d]) есть в массив sum
             index = индекс суммы -(A[c] + A[d])
             '''return''' (sum[index].a, sum[index].b, A[c], A[d])
@@ Строка 35: / Строка 35: @@
 == Задача о рюкзаке ==
-Классической задачей является задача о наиболее эффективной упаковке рюкзака. Каждый предмет характеризуется весом (<tex> {w_{i} \leqslant 10^{9}} </tex> ) и ценностью (<tex>{cost_{i} \leqslant 10^{9}} </tex>). В рюкзак, ограниченный по весу, необходимо набрать вещей с максимальной суммарной стоимостью. Для ее решения изначальное множество вещей N разбивается на два равных(или примерно равных) подмножества, для которых за приемлемое время можно перебрать все варианты и подсчитать суммарный вес и стоимость, а затем для каждого из них найти группу вещей из первого подмножества с максимальной стоимостью, укладывающуюся в ограничение по весу рюкзака. Сложность алгоритма <tex>O({2^{N/2}}\cdot{N})</tex>. Память <tex> O({2^{N/2}})</tex>.
+Классической задачей является задача о наиболее эффективной упаковке рюкзака. Каждый предмет характеризуется весом (<tex> {w_{i} \leqslant 10^{9}} </tex> ) и ценностью (<tex>{cost_{i} \leqslant 10^{9}} </tex>). В рюкзак, ограниченный по весу, необходимо набрать вещей с максимальной суммарной стоимостью. Для ее решения изначальное множество вещей N разбивается на два равных(или примерно равных) подмножества, для которых за приемлемое время можно перебрать все варианты и подсчитать суммарный вес и стоимость, а затем для каждого из них найти группу вещей из первого подмножества с максимальной стоимостью, укладывающуюся в ограничение по весу рюкзака. Сложность алгоритма <tex>O({2^{\frac{N}{2}}}\times{N})</tex>. Память <tex> O({2^{\frac{N}{2}}})</tex>.
+=== Алгоритм ===
+Разделим наше множество на две части. Подсчитаем все подмножества из первой части и будем хранить их в массиве <tex>\mathtt{first}</tex>. Отсортируем массив <tex>\mathtt{first}</tex> по весу. Далее пройдемся по этому массиву и оставим только те подмножества, для которых не существует другого подмножества с меньшим весом и большей стоимостью. Очевидно, что подмножества, для которых существует другое, более легкое и одновременно более ценное подмножество, можно удалять.
+Таким образом в массиве <tex>\mathtt{first}</tex> мы имеем подмножества, отсортированные не только по весу, но и по стоимости. Тогда начнем перебирать все возможные комбинации вещей из второй половины и находить бинарным поиском удовлетворяющие нам подмножества из первой половины, хранящиеся в массиве <tex>\mathtt{first}</tex>.
 === Реализация ===
-Разделим наше множество на две части. Подсчитаем все подмножества из первой части и будем хранить их в массиве <tex> first </tex>. Отсортируем массив <tex> first </tex> по весу. Далее пройдемся по этому массиву и оставим только те подмножества, для которых не существует другого подмножества с меньшим весом и большей стоимостью. Очевидно, что подмножества, для которых существует другое, более легкое и одновременно более ценное подмножество, можно удалять.
+  <font color=darkgreen>// N — количество всех вещей, w[N] — массив весов всех вещей, cost[N] — массив стоимостей всех вещей, R — ограничение по весу рюкзака.</font>
-Таким образом в массиве <tex> first </tex> мы имеем подмножества, отсортированные не только по весу, но и по стоимости. Тогда начнем перебирать все возможные комбинации вещей из второй половины и находить бинарным поиском удовлетворяющие нам подмножества из первой половины, хранящиеся в массиве <tex> first </tex>.
+   '''function''' knapsack('''int['''N''']''' w, '''int['''N''']''' cost, '''int''' R): '''int'''
-Реализуем данный алгоритм:
-  // N - количество всех вещей, w[] - массив весов всех вещей, cost[] - массив стоимостей всех вещей, R - ограничение по весу рюкзака.
-   '''knapsack'''():
      sn = N / 2
      fn = N - sn
-     '''for''' mask = 0..2 ** sn  - 1
+     '''for''' mask = 0..2 ** sn - 1
        '''for''' j = 0..sn
          '''if''' j-ый бит mask == 1
-           first[i].w += w[j];
+           first[i].w += w[j]
            first[i].c += cost[j]
-     сортируем first по весу
+     sort(first, key = "w") <font color=darkgreen>// сортируем first по весу </font>
      '''for''' i = 0..2 ** sn - 1
        '''if''' существует такое подмножество с индексом j, что first[j].w <tex> \leqslant </tex> first[i].w '''and''' first[j].c <tex> \geqslant </tex> first[i].c
          удалим множество с индексом i из массива first
      '''for''' mask = 0..2 ** fn - 1
        '''for''' j = 0..fn
@@ Строка 62: / Строка 60: @@
            curw += w[j + sn]
            curcost += cost[j + sn]
        index = позиция, найденная бинарным поиском в массиве first, подмножества с максимальным весом, не превыщающим R - curv
        '''if''' first[index].w <tex> \leqslant </tex> R - curw '''and''' first[index].c + curcost <tex> > </tex> ans
@@ Строка 68: / Строка 65: @@
      '''return''' ans
-Итоговое время работы <tex> {O({2^{N/2}}\cdot({N}+\log{2^{N/2}}))} = O({2^{N/2}}\cdot{N}) </tex>.
+Итоговое время работы <tex> {O({2^{\frac{N}{2}}}\times({N}+\log{2^{\frac{N}{2}}}))} = O({2^{\frac{N}{2}}}\times{N}) </tex>.
+== Задача о количестве полных подграфов в графе ==
+[[Файл:cliques.png|450px|thumb|right|Граф с 23 × 1-вершинными кликами (сами вершины),
+× 2-вершинными кликами (отрезки),
+× 3-вершинными кликами (светло-синие и тёмно-синие треугольники) и
+× 4-вершинными кликами (тёмно-синие зоны). Всего 86 клик.]]
+Дан граф <tex>G</tex>, в котором <tex>N</tex> вершин. Требуется подсчитать количество [[Основные_определения_теории_графов#Часто используемые графы | клик]].
+Наивное решение — перебор всех возможных подграфов и проверка для каждого, что он является кликой, сложность — <tex>O(2^N \times N^2)</tex>
+Этот алгоритм можно улучшить до <tex>O(2^N \times N)</tex>. Для этого нужно в функции перебора хранить маску вершин, которые мы ещё можем добавить. Поддерживая эту маску, можно добавлять только «нужные» вершины, и тогда не нужно будет в конце проверять подграф на то что он — клика. Добавлять вершину можно за <tex>O(1)</tex>, используя [[Побитовые_операции#Побитовое И | побитовое И]] текущей маски и строчки матрицы смежности добавляемой вершины.
+===Алгоритм решения===
+Разбиваем граф <tex>G</tex> на <tex>2</tex> графа <tex>{G}_1</tex> и <tex>{G}_2</tex> по <tex>\dfrac{N}{2}</tex> вершин. Находим за <tex>O(2^{\frac{N}{2}})</tex> все клики в каждом из них.
+Теперь надо узнать для каждой клики графа <tex>{G}_1</tex> количество клик графа <tex>{G}_2</tex>, таких, что их объединение — клика. Их сумма и есть итоговый ответ.
+Для одной клики <tex>K</tex> графа <tex>{G}_1</tex> может быть несколько подходящих клик в <tex>{G}_2</tex>. О клике <tex>K</tex> мы ''"знаем"'' только маску вершин графа <tex>{G}_2</tex>, которые ещё можно добавить. Для каждой такой маски в <tex>{G}_2</tex> нужно предподсчитать ответ.
+С помощью динамического программирования предподсчитаем для каждой маски вершин графа <tex>{G}_2</tex> количество клик, вершины которых являются подмножеством выбранной маски. Количество состояний — <tex>2^{\frac{N}{2}}</tex>. Количество переходов:<tex>N</tex> . Асимптотика — <tex>O(2^{\frac{N}{2}} \times N)</tex>.
+Для каждой клики <tex>K</tex> (в том числе и пустой) графа <tex>{G}_1</tex> прибавим к глобальному ответу предподсчитанное количество клик, которые можно добавить к <tex>K</tex> (в том числе и пустых). Асимптотика: <tex>O(2^{\frac{N}{2}})</tex>.
+Итоговая сложность: <tex>O(2^{\frac{N}{2}} \times N)</tex>
 == Задача о нахождении кратчайшего расстояния между двумя вершинами в графе ==
 [[Файл:bfs.png|600px|thumb|right|Нахождение кратчайшего расстояния между двумя вершинами]]
 Еще одна задача, решаемая '''Meet-in-the-middle'''  —  это нахождение кратчайшего расстояния между двумя вершинами, зная начальное состояние, конечное состояние и то, что длина оптимального пути не превышает <tex> N </tex>.
-Стандартным подходом для решения данной задачи, является применение алгоритма [[Обход в ширину|обхода в ширину]]. Пусть из каждого состояния у нас есть <tex> K </tex> переходов, тогда бы мы сгенерировали <tex> {K^{N}} </tex> состояний. Асимптотика данного решения составила бы <tex> {O({K^{N}})} </tex>. '''Meet-in-the-middle''' помогает снизить асимптотику до <tex> {O({K^{N/2}})} </tex>. <br>
+Стандартным подходом для решения данной задачи, является применение алгоритма [[Обход в ширину|обхода в ширину]]. Пусть из каждого состояния у нас есть <tex> K </tex> переходов, тогда бы мы сгенерировали <tex> {K^{N}} </tex> состояний. Асимптотика данного решения составила бы <tex> {O({K^{N}})} </tex>. '''Meet-in-the-middle''' помогает снизить асимптотику до <tex> {O({K^{\frac{N}{2}}})} </tex>. <br>
 === Алгоритм решения ===
-. Сгенерируем '''bfs'''-ом все состояния, доступные из начала и конца за <tex> {N/2} </tex> или меньше ходов.
+. Сгенерируем '''BFS'''-ом все состояния, доступные из начала и конца за <tex> {\dfrac{N}{2}} </tex> или меньше ходов.
 . Найдем состояния, которые достижимы из начала и из конца.
@@ Строка 83: / Строка 103: @@
-Таким образом, '''bfs-ом''' из двух концов, мы сгенерируем максимум <tex> {O({K^{N/2}})} </tex> состояний.
+Таким образом, '''BFS-ом''' из двух концов, мы сгенерируем максимум <tex> {O({K^{\frac{N}{2}}})} </tex> состояний.
 == См. также ==
@@ Строка 89: / Строка 109: @@
 * [[Целочисленный двоичный поиск]]
-==Cсылки==
+==Источники информации==
-*[http://infoarena.ro/blog/meet-in-the-middle Meet-in-the-middle]
+*[http://infoarena.ro/blog/meet-in-the-middle infoarena.ro — Meet-in-the-middle]
-*[http://g6prog.narod.ru/dpl.ps Лекции по информатике (36 страница)]
+*[http://g6prog.narod.ru/dpl.ps g6prog.narod.ru — Лекции по информатике (36 страница)]
+*[https://en.wikipedia.org/wiki/Clique_(graph_theory) wikipedia.org — Clique]
 [[Категория: Дискретная математика и алгоритмы]]
 [[Категория: Динамическое программирование ]]
+[[Категория: Классические задачи динамического программирования ]]

Meet-in-the-middle — различия между версиями

Текущая версия на 19:31, 4 сентября 2022

Содержание

Задача о нахождении четырех чисел с суммой равной нулю

Реализация

Задача о рюкзаке

Алгоритм

Реализация

Задача о количестве полных подграфов в графе

Алгоритм решения

Задача о нахождении кратчайшего расстояния между двумя вершинами в графе

Алгоритм решения

См. также

Источники информации

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты