Метод четырёх русских для умножения матриц
Версия от 06:32, 21 декабря 2011; 192.168.0.2 (обсуждение)
Рассмотрим следующую задачу: «Дано две квадратных матрицы
и , состоящие из нулей и единиц. Нужно найти их произведение. При этом, все операции выполняются по модулю .»Содержание
Простое решение
Если мы будем считать произведение матриц
по определению( ), то трудоёмкость алгоритма составит — каждый из элементов результирующей матрицы вычисляется за время, пропорциональное .Сейчас будет показано, как немного уменьшить это время.
Сжатие матриц
Для выполнения сжатия матриц выполним следующий предподсчёт : для всех возможных пар двоичных векторов длины
подсчитаем и запомним их скалярное произведение по модулю .Возьмём первую матрицу. разделим каждую её строку на куски размера
. Для каждого куска определим номер двоичного вектора, который соответствует числам, находящимся на этом куске. Если кусок получился неравным по длине (последний кусок строки), то будем считать, что в конце в нём идут не влияющие на умножение нули. Получим матрицу .Аналогично поступим с матрицей
, вместо строк деля столбцы. Получим матрицу .Теперь, если вместо произведения матриц
и считать произведение новых матриц и , воспользовавшись посчитанными скалярными произведениями, то каждый элемент матрицы будет получаться уже за время, пропорциональное вместо , и время произведения матриц сократится с до .Оценка трудоёмкости и выбор k
Оценим трудоёмкость данного алгоритма.
- Предподсчёт скалярных произведений работает за .
- Создание матриц и —
- Перемножение полученных матриц —
Итого:
. Приведем анализ выбора числа для получения оптимальной сложности алгоритма.В силу возрастания функции
и убывания функции имеем, что сложность будет оптимальна при таком значении , что . Прологарифмируем обе части этого равенства:
В силу того, что
пренебрежительно мал по сравнению с имеем, что с точностью до константы равенТаким образом, при подстановке
, получаем итоговую трудоёмкостьКод алгоритма
// Предподсчёт скалярных произведений // Пусть precalc[i][j] - "скалярное произведение для битовых представлений" чисел i и j // "&" - битовый and; "<<" - битовый сдвиг влево. int k = ceil(log n); //округление вверх for i := 0 to (1 << k) - 1 for j := 0 to (1 << k) - 1 { int scalmul = 0; for pos := 0 to k - 1 if (((1 << pos) & i) != 0 and ((1 << pos) & j) != 0) { scalmul = (scalmul + 1) mod 2; } precalc[i][j] = scalmul; } // Создание сжатых матриц anew, bnew for i := 0 to n - 1 { while (start < n) { int cursuma = 0, cursumb = 0, curpos = start, deg = (1 << (k - 1)); while (curpos < start + k and curpos < n) { cursuma = cursuma + a[i][curpos] * deg; cursumb = cursumb + b[curpos][i] * deg; deg = deg div 2; curpos = curpos + 1; } anew[i][start div k] = cursuma; bnew[start div k][i] = cursumb; start = start + k; } } //Перемножение полученных матриц for i := 0 to n - 1 for j := 0 to n - 1 { int curans = 0; for pos := 0 to m - 1 { curans = (curans + precalc[anew[i][pos]][bnew[pos][j]]) % 2; } ans[i][j] = curans; }
Литература
- Gregory V. Bard — Accelerating Cryptanalysis with the Method of Four Russians