Метод четырёх русских для умножения матриц — различия между версиями
| Строка 42: | Строка 42: | ||
== Код алгоритма == | == Код алгоритма == | ||
<code> | <code> | ||
| − | + | // Чтение матриц | |
| + | for i := 0 to n - 1 | ||
| + | for j := 0 to n - 1 { | ||
| + | read(cur); | ||
| + | a[i][j] = cur; | ||
| + | } | ||
| + | // Чтение матриц | ||
| + | for i := 0 to n - 1 | ||
| + | for j := 0 to n - 1 { | ||
| + | read(cur); | ||
| + | b[i][j] = cur; | ||
| + | } | ||
| + | |||
// Предподсчёт скалярных произведений | // Предподсчёт скалярных произведений | ||
// Пусть precalc[i][j] - "скалярное произведение для битовых представлений" чисел i и j | // Пусть precalc[i][j] - "скалярное произведение для битовых представлений" чисел i и j | ||
// "&" - битовый and; "<<" - битовый сдвиг влево. | // "&" - битовый and; "<<" - битовый сдвиг влево. | ||
| − | int k = ceil( | + | int k = ceil(log2(n)); //округление вверх |
for i := 0 to (1 << k) - 1 | for i := 0 to (1 << k) - 1 | ||
for j := 0 to (1 << k) - 1 { | for j := 0 to (1 << k) - 1 { | ||
| Строка 82: | Строка 94: | ||
ans[i][j] = curans; | ans[i][j] = curans; | ||
} | } | ||
| − | + | ||
| + | // Вывод ответа | ||
| + | for i := 0 to n - 1 | ||
| + | for j := 0 to n - 1 { | ||
| + | write(ans[i][j]); | ||
| + | } | ||
| + | writeln(); | ||
| + | } | ||
</code> | </code> | ||
Версия 06:52, 22 декабря 2011
Дано две квадратных матрицы и , состоящие из нулей и единиц. Нужно найти их произведение. При этом, все операции выполняются по модулю .
Содержание
Простое решение
Если мы будем считать произведение матриц по определению(), то трудоёмкость алгоритма составит — каждый из элементов результирующей матрицы вычисляется за время, пропорциональное .
Сейчас будет показано, как немного уменьшить это время.
Сжатие матриц
Для выполнения сжатия матриц выполним следующий предподсчёт : для всех возможных пар двоичных векторов длины подсчитаем и запомним их скалярное произведение по модулю .
Возьмём первую матрицу. разделим каждую её строку на куски размера . Для каждого куска определим номер двоичного вектора, который соответствует числам, находящимся на этом куске. Если кусок получился неравным по длине (последний кусок строки), то будем считать, что в конце в нём идут не влияющие на умножение нули. Получим матрицу .
Аналогично поступим с матрицей , вместо строк деля столбцы. Получим матрицу .
Теперь, если вместо произведения матриц и считать произведение новых матриц и , воспользовавшись посчитанными скалярными произведениями, то каждый элемент матрицы будет получаться уже за время, пропорциональное вместо , и время произведения матриц сократится с до .
Оценка трудоёмкости и выбор k
Оценим трудоёмкость данного алгоритма.
- Предподсчёт скалярных произведений работает за .
- Создание матриц и —
- Перемножение полученных матриц —
Итого: . Приведем анализ выбора числа для получения оптимальной сложности алгоритма.
В силу возрастания функции и убывания функции имеем, что сложность будет оптимальна при таком значении , что . Прологарифмируем обе части этого равенства:
В силу того, что пренебрежительно мал по сравнению с имеем, что с точностью до константы равен
Таким образом, при подстановке , получаем итоговую трудоёмкость
Код алгоритма
// Чтение матриц
for i := 0 to n - 1
for j := 0 to n - 1 {
read(cur);
a[i][j] = cur;
}
// Чтение матриц
for i := 0 to n - 1
for j := 0 to n - 1 {
read(cur);
b[i][j] = cur;
}
// Предподсчёт скалярных произведений
// Пусть precalc[i][j] - "скалярное произведение для битовых представлений" чисел i и j
// "&" - битовый and; "<<" - битовый сдвиг влево.
int k = ceil(log2(n)); //округление вверх
for i := 0 to (1 << k) - 1
for j := 0 to (1 << k) - 1 {
int scalmul = 0;
for pos := 0 to k - 1
if (((1 << pos) & i) != 0 and ((1 << pos) & j) != 0) {
scalmul = (scalmul + 1) mod 2;
}
precalc[i][j] = scalmul;
}
// Создание сжатых матриц anew, bnew
for i := 0 to n - 1 {
while (start < n) {
int cursuma = 0, cursumb = 0, curpos = start, deg = (1 << (k - 1));
while (curpos < start + k and curpos < n) {
cursuma = cursuma + a[i][curpos] * deg;
cursumb = cursumb + b[curpos][i] * deg;
deg = deg div 2;
curpos = curpos + 1;
}
anew[i][start div k] = cursuma;
bnew[start div k][i] = cursumb;
start = start + k;
}
}
//Перемножение полученных матриц
for i := 0 to n - 1
for j := 0 to n - 1 {
int curans = 0;
for pos := 0 to m - 1 {
curans = (curans + precalc[anew[i][pos]][bnew[pos][j]]) mod 2;
}
ans[i][j] = curans;
}
// Вывод ответа
for i := 0 to n - 1
for j := 0 to n - 1 {
write(ans[i][j]);
}
writeln();
}
Литература
- Gregory V. Bard — Accelerating Cryptanalysis with the Method of Four Russians