Метод четырёх русских для умножения матриц — различия между версиями
Строка 4: | Строка 4: | ||
== Простое решение == | == Простое решение == | ||
− | Если мы будем считать произведение матриц <tex>C = A \cdot B</tex> по определению(<tex dpi=140>c_{i, j} = \sum\limits_{k = 1}^n a_{i,k}b_{k,j}</tex>), то | + | Если мы будем считать произведение матриц <tex>C = A \cdot B</tex> по определению(<tex dpi=140>c_{i, j} = \sum\limits_{k = 1}^n a_{i,k}b_{k,j}</tex>), то сложность работы алгоритма составит <tex>O(n^3)</tex> {{---}} каждый из <tex>n^2</tex> элементов результирующей матрицы <tex>C</tex> вычисляется за время, пропорциональное <tex>n</tex>. |
Сейчас будет показано, как немного уменьшить это время. | Сейчас будет показано, как немного уменьшить это время. | ||
Строка 18: | Строка 18: | ||
Теперь, если вместо произведения матриц <tex>A</tex> и <tex>B</tex> считать произведение новых матриц <tex>A'</tex> и <tex>B'</tex>, воспользовавшись посчитанными скалярными произведениями, то каждый элемент матрицы <tex>C</tex> будет получаться уже за время, пропорциональное <tex>\lceil \frac nk \rceil</tex> вместо <tex>n</tex>, и время произведения матриц сократится с <tex>O(n^3)</tex> до <tex dpi=140>O(n^2 \cdot\frac nk) = O(\frac{n^3}{k}) </tex>. | Теперь, если вместо произведения матриц <tex>A</tex> и <tex>B</tex> считать произведение новых матриц <tex>A'</tex> и <tex>B'</tex>, воспользовавшись посчитанными скалярными произведениями, то каждый элемент матрицы <tex>C</tex> будет получаться уже за время, пропорциональное <tex>\lceil \frac nk \rceil</tex> вместо <tex>n</tex>, и время произведения матриц сократится с <tex>O(n^3)</tex> до <tex dpi=140>O(n^2 \cdot\frac nk) = O(\frac{n^3}{k}) </tex>. | ||
− | == Оценка | + | == Оценка сложности алгоритма и выбор k == |
− | Оценим | + | Оценим асимптотику данного алгоритма. |
* Предподсчёт скалярных произведений работает за <tex>O(2^{2k}k)</tex>. | * Предподсчёт скалярных произведений работает за <tex>O(2^{2k}k)</tex>. | ||
Строка 39: | Строка 39: | ||
В силу того, что <tex> \log_4 k </tex> пренебрежительно мал по сравнению с <tex> k </tex> имеем, что <tex> k </tex> с точностью до константы равен <tex> \log n </tex> | В силу того, что <tex> \log_4 k </tex> пренебрежительно мал по сравнению с <tex> k </tex> имеем, что <tex> k </tex> с точностью до константы равен <tex> \log n </tex> | ||
− | Таким образом, при подстановке <tex>k = \log n</tex>, получаем итоговую | + | Таким образом, при подстановке <tex>k = \log n</tex>, получаем итоговую асимптотику <tex dpi=140>O(n^2 \log n) + O(\frac{n^3}{\log n}) = O(\frac{n^3}{\log n})</tex> |
== Код алгоритма == | == Код алгоритма == | ||
<code> | <code> |
Версия 08:14, 22 декабря 2011
Дано две квадратных матрицы
и , состоящие из нулей и единиц. Нужно найти их произведение. При этом, все операции выполняются по модулю .Содержание
Простое решение
Если мы будем считать произведение матриц
по определению( ), то сложность работы алгоритма составит — каждый из элементов результирующей матрицы вычисляется за время, пропорциональное .Сейчас будет показано, как немного уменьшить это время.
Сжатие матриц
Для выполнения сжатия матриц выполним следующий предподсчёт : для всех возможных пар двоичных векторов длины
подсчитаем и запомним их скалярное произведение по модулю .Возьмём первую матрицу. разделим каждую её строку на куски размера
. Для каждого куска определим номер двоичного вектора, который соответствует числам, находящимся на этом куске. Если кусок получился неравным по длине (последний кусок строки), то будем считать, что в конце в нём идут не влияющие на умножение нули. Получим матрицу .Аналогично поступим с матрицей
, вместо строк деля столбцы. Получим матрицу .Теперь, если вместо произведения матриц
и считать произведение новых матриц и , воспользовавшись посчитанными скалярными произведениями, то каждый элемент матрицы будет получаться уже за время, пропорциональное вместо , и время произведения матриц сократится с до .Оценка сложности алгоритма и выбор k
Оценим асимптотику данного алгоритма.
- Предподсчёт скалярных произведений работает за .
- Создание матриц и —
- Перемножение полученных матриц —
Итого:
. Приведем анализ выбора числа для получения оптимальной сложности алгоритма.В силу возрастания функции
и убывания функции имеем, что сложность будет оптимальна при таком значении , что . Прологарифмируем обе части этого равенства:
В силу того, что
пренебрежительно мал по сравнению с имеем, что с точностью до константы равенТаким образом, при подстановке
, получаем итоговую асимптотикуКод алгоритма
// Чтение матриц for i := 0 to n - 1 for j := 0 to n - 1 { read(cur); a[i][j] = cur; } for i := 0 to n - 1 for j := 0 to n - 1 { read(cur); b[i][j] = cur; } // Предподсчёт скалярных произведений // Пусть preСalc[i][j] - "скалярное произведение для битовых представлений" чисел i и j // "&" - битовый and; "**" - возведение в степень. int k = ceil(log2(n)); //округление вверх for i := 0 to (2 ** k) - 1 for j := 0 to (2 ** k) - 1 { int scalMul = 0; for pos := 0 to k - 1 if (((2 ** pos) & i) != 0 and ((2 ** pos) & j) != 0) { scalMul = (scalMul + 1) mod 2; } preСalc[i][j] = scalMul; } // Создание сжатых матриц anew, bnew for i := 0 to n - 1 { while (start < n) { int curSumA = 0, curSumB = 0, curPos = start, deg = (2 ** (k - 1)); while (curPos < start + k and curPos < n) { curSumA = curSumA + a[i][curPos] * deg; curSumB = curSumB + b[curPos][i] * deg; deg = deg div 2; curPos = curPos + 1; } anew[i][start div k] = curSumA; bnew[start div k][i] = curSumB; start = start + k; } } //Перемножение полученных матриц for i := 0 to n - 1 for j := 0 to n - 1 { int curAns = 0; for pos := 0 to m - 1 { curAns = (curAns + preСalc[anew[i][pos]][bnew[pos][j]]) mod 2; } ans[i][j] = curAns; } // Вывод ответа for i := 0 to n - 1 for j := 0 to n - 1 { write(ans[i][j]); } writeln(); }
Литература
- Gregory V. Bard — Accelerating Cryptanalysis with the Method of Four Russians