Изменения

Перейти к: навигация, поиск

Метод четырёх русских для умножения матриц

496 байт добавлено, 18:07, 8 октября 2019
Нет описания правки
{{Задача|definition = Дано две квадратных матрицы <tex>A_{[n \times n]}</tex> и <tex>B_{[n \times n]}</tex>,
состоящие из нулей и единиц. Нужно найти их произведение. При этом, все операции выполняются по модулю <tex>2</tex>.
}}</noinclude><includeonly>{{#if: {{{neat|}}}|<div style="background-color: #fcfcfc; float:left;"><div style="background-color: #ddd;">'''Задача:'''</div><div style="border:1px dashed #2f6fab; padding: 8px; font-style: italic;">{{{definition}}}</div></div>|<table border="0" width="100%"><tr><td style="background-color: #ddd">'''Задача:'''</td></tr><tr><td style="border:1px dashed #2f6fab; padding: 8px; background-color: #fcfcfc; font-style: italic;">{{{definition}}}</td></tr></table>}}</includeonly>
== Простое решение ==
Если мы будем считать произведение матриц <tex>C = A \cdot B</tex> по определению(<tex dpi=140130>\left(c_{i, j} = \sum\limits_{k = 1}^n a_{i,k}b_{k,j}\right)</tex>), то трудоёмкость сложность работы алгоритма составит <tex>O(n^3)</tex> {{---}} каждый из <tex>n^2</tex> элементов результирующей матрицы <tex>C</tex> вычисляется за время, пропорциональное <tex>n</tex>.
Сейчас будет показано, как немного уменьшить это время.
Аналогично поступим с матрицей <tex>B</tex>, вместо строк деля столбцы. Получим матрицу <tex dpi=140>B'_{\lceil\frac nk\rceil\times n}</tex>.
Теперь, если вместо произведения матриц <tex>A</tex> и <tex>B</tex> считать произведение новых матриц <tex>A'</tex> и <tex>B'</tex>, воспользовавшись посчитанными скалярными произведениями, то каждый элемент матрицы <tex>C</tex> будет получаться уже за время, пропорциональное <tex>\lceil \frac nk dfrac{n}{k} \rceil</tex> вместо <tex>n</tex>, и время произведения матриц сократится с <tex>O(n^3)</tex> до <tex dpi=140>O(n^2 \cdot\frac dfrac nk) = O(\fracdfrac{n^3}{k}) </tex>.
== Оценка трудоёмкости сложности алгоритма и выбор k ==[[Файл:exampleFourRussiansAlgoFinalPicture.png|500px|right]]
Оценим трудоёмкость асимптотику данного алгоритма.
* Предподсчёт скалярных произведений работает за <tex>O(2^{2k}k)</tex>.
* Создание матриц <tex>A'</tex> и <tex>B'</tex> {{---}} <tex>O(n^2)</tex>.* Перемножение полученных матриц {{---}} <tex dpi>O(\dfrac{n^3}{k})</tex>. Итого: <tex>O(2^{2k}k) + O(\dfrac{n^3}{k})</tex>.Выбрав <tex>k =140\log n </tex>, получаем требуемую асимптотику <tex>O(n^2 \log n) + O(\fracdfrac{n^3}{k\log n}) = O(\dfrac{n^3}{\log n})</tex> == Пример работы алгоритма == Рассмотрим работу алгоритма на примере перемножения двух матриц <tex> A </tex> и <tex> B </tex>, где  <tex> A = </tex><tex>\left(\begin{array}{cccc} 0 & 1 & 1 & 1 \\ 0 & 1 & 0 & 0 \\ 1 & 1 & 0 & 1 \\ 1 & 0 & 0 & 1 \end{array}\right)</tex>, <tex> B = </tex><tex>\left(\begin{array}{cccc} 1 & 0 & 0 & 1 \\ 0 & 0 & 1 & 1 \\ 1 & 0 & 1 & 0 \\ 0 & 1 & 0 & 1 \end{array}\right)</tex> <tex> k = \log_2 n = \log_2 4 = 2</tex>, то предподсчитаем все скалярные произведения:
Итого: Для удобства каждому битовому вектору будет соответствовать двоичное число с ведущими нулями, т.е. в данном случае имеем числа <tex> 00 </tex>, <tex> 01 </tex>, <tex>O(2^{2k}k) + O(\frac{n^3}{k})10 </tex>.Приведем анализ выбора числа , <tex>k11 </tex> для получения оптимальной сложности алгоритма.Ниже приведена таблица, в которой записаны все искомые произведения:
В силу возрастания функции <tex>f(k) = 2^\begin{array}{|c|c|c|c|c|} \hline & \textbf{00} & \textbf{01} & \textbf{10} & \textbf{11} \\ \hline \textbf{00} & 0 & 0 & 0 & 0 \\ \hline \textbf{01} & 0 & 1 & 0 & 1 \\ \hline \textbf{2k10}k</tex> и убывания функции <tex>g(k) = & 0 & 0 & 1 & 1 \\ \hline \fractextbf{n^311}& 0 & 1 & 1 & 0\\ \hline \end{karray}</tex> имеем, что сложность будет оптимальна при таком значении <tex>k</tex>, что <tex>f(k) = g(k)</tex>. Прологарифмируем обе части этого равенства:
Согласно соглашению относительно битовых векторов и двоичных чисел получим новые матрицы <tex>k \ln 4 + \ln k= 3 \ln n - \ln kA' </tex>и <tex> B' </tex>:
<tex>k A' = </tex><tex>\fracleft(\begin{array}{3 cccc} 01 & 11 \ln n - 2 \ln k 01 & 00 \\ 11 & 01 \\ 10 & 01 \end{array}\right)</tex>,<tex> B' = </tex><tex>\left(\begin{array}{cccc} 10 & 00 & 01 & 11 \ln 4\ 10 & 01 & 10 & 01 \end{array} \right)</tex>
<tex> k = 3 \log_4 n - 2 \log_4 k </tex>Перемножим эти матрицы по модулю два с использованием нашего предпосчета:
В силу того, что <tex> C = A' \log_4 k times B' = </tex> пренебрежительно мал по сравнению с <tex> k </tex> имеем, что <tex> k </tex> с точностью до константы равен <tex> \left(\begin{array}{cccc} 1 & 1 & 0 & 0 \\ 0 & 0 & 1 & 1 \\ 1 & 1 & 1 & 1 \\ 1 & 1 & 0 & 0 \end{array}\log n right)</tex>
Таким образом, при подстановке Матрица <tex>k = \log nC </tex>, получаем итоговую трудоёмкость <tex dpi=140>O(n^2 \log n) + O(\frac{n^3}{\log n}) = O(\frac{n^3}{\log n})</tex>== Код алгоритма ==<code> // Чтение матриц for i := 0 to n - 1 for j := 0 to n - 1 { read(cur); a[i][j] = cur; -} for i := 0 to n - 1 for j := 0 to n - 1 { read(cur); b[i][j] = cur; } // Предподсчёт скалярных произведений // Пусть preСalc[i][j] - "скалярное произведение для битовых представлений" чисел i и j // "&" - битовый and; "**" - возведение в степеньискомая. int k = ceil(log2(n)); //округление вверх for i := 0 to (2 ** k) - 1 for j := 0 to (2 ** k) - 1 { int scalMul = 0; for pos := 0 to k - 1 if (((2 ** pos) & i) != 0 and ((2 ** pos) & j) != 0) { scalMul = (scalMul + 1) mod 2; } preСalc[i][j] = scalMul; } // Создание сжатых матриц anew, bnew for i := 0 to n - 1 { while (start < n) { int curSumA = 0, curSumB = 0, curPos = start, deg = (2 ** (k - 1)); while (curPos < start + k and curPos < n) { curSumA = curSumA + a[i][curPos] * deg; curSumB = curSumB + b[curPos][i] * deg; deg = deg div 2; curPos = curPos + 1; } anew[i][start div k] = curSumA; bnew[start div k][i] = curSumB; start = start + k; } } //Перемножение полученных матриц for i := 0 to n - 1 for j := 0 to n - 1 { int curAns = 0; for pos := 0 to m - 1 { curAns = (curAns + preСalc[anew[i][pos]][bnew[pos][j]]) mod 2; } ans[i][j] = curAns; } // Вывод ответа for i := 0 to n - 1 for j := 0 to n - 1 { write(ans[i][j]); } writeln(); }
</code>== Литература Источники информации ==* ''Gregory V. Bard'' — '''Accelerating Cryptanalysis with the Method of Four Russians'''. July 22, 2006. Страница 5
[[Категория: Дискретная математика и алгоритмы]]
[[Категория: Динамическое программирование]]
[[Категория: Способы оптимизации методов динамического программирования]]
Анонимный участник

Навигация