Метод четырёх русских для умножения матриц

Дано две квадратных матрицы [math]A_{[n \times n]}[/math] и [math]B_{[n \times n]}[/math], состоящие из нулей и единиц. Нужно найти их произведение. При этом, все операции выполняются по модулю [math]2[/math].

Содержание

1 Простое решение
2 Сжатие матриц
3 Оценка трудоёмкости и выбор k
4 Код алгоритма
5 Литература

Простое решение

Если мы будем считать произведение матриц [math]C = A \cdot B[/math] по определению(), то трудоёмкость алгоритма составит [math]O(n^3)[/math] — каждый из [math]n^2[/math] элементов результирующей матрицы [math]C[/math] вычисляется за время, пропорциональное [math]n[/math].

Сейчас будет показано, как немного уменьшить это время.

Сжатие матриц

Для выполнения сжатия матриц выполним следующий предподсчёт : для всех возможных пар двоичных векторов длины [math]k[/math] подсчитаем и запомним их скалярное произведение по модулю [math]2[/math].

Возьмём первую матрицу. разделим каждую её строку на куски размера [math]k[/math]. Для каждого куска определим номер двоичного вектора, который соответствует числам, находящимся на этом куске. Если кусок получился неравным по длине [math]k[/math](последний кусок строки), то будем считать, что в конце в нём идут не влияющие на умножение нули. Получим матрицу .

Аналогично поступим с матрицей [math]B[/math], вместо строк деля столбцы. Получим матрицу .

Теперь, если вместо произведения матриц [math]A[/math] и [math]B[/math] считать произведение новых матриц [math]A'[/math] и [math]B'[/math], воспользовавшись посчитанными скалярными произведениями, то каждый элемент матрицы [math]C[/math] будет получаться уже за время, пропорциональное [math]\lceil \frac nk \rceil[/math] вместо [math]n[/math], и время произведения матриц сократится с [math]O(n^3)[/math] до .

Оценка трудоёмкости и выбор k

Оценим трудоёмкость данного алгоритма.

Предподсчёт скалярных произведений работает за [math]O(2^{2k}k)[/math].
Создание матриц [math]A'[/math] и [math]B'[/math] — [math]O(n^2)[/math]
Перемножение полученных матриц — [math]O(\frac{n^3}{k})[/math]

Итого: . Приведем анализ выбора числа [math]k[/math] для получения оптимальной сложности алгоритма.

В силу возрастания функции [math]f(k) = 2^{2k}k[/math] и убывания функции [math]g(k) = \frac{n^3}{k}[/math] имеем, что сложность будет оптимальна при таком значении [math]k[/math], что [math]f(k) = g(k)[/math]. Прологарифмируем обе части этого равенства:

В силу того, что [math] \log_4 k [/math] пренебрежительно мал по сравнению с [math] k [/math] имеем, что [math] k [/math] с точностью до константы равен [math] \log n [/math]

Таким образом, при подстановке [math]k = \log n[/math], получаем итоговую трудоёмкость

Код алгоритма


  // Чтение матриц
  for i := 0 to n - 1
     for j := 0 to n - 1 {
        read(cur);
        a[i][j] = cur;
     }   
 // Чтение матриц
  for i := 0 to n - 1
     for j := 0 to n - 1 {
        read(cur);
        b[i][j] = cur;
     }   
       
  // Предподсчёт скалярных произведений
  // Пусть precalc[i][j] - "скалярное произведение для битовых представлений" чисел i и j
  // "&" - битовый and; "<<" - битовый сдвиг влево.
  int k = ceil(log2(n)); //округление вверх
  for i := 0 to (1 << k) - 1
     for j := 0 to (1 << k) - 1 {
        int scalmul = 0;
        for pos := 0 to k - 1
           if (((1 << pos) & i) != 0 and ((1 << pos) & j) != 0) {  
              scalmul = (scalmul + 1) mod 2;
           }
        precalc[i][j] = scalmul;
     }
  
  // Создание сжатых матриц anew, bnew
  for i := 0 to n - 1 {
     while (start < n) {
        int cursuma = 0, cursumb = 0, curpos = start, deg = (1 << (k - 1));
        while (curpos < start + k and curpos < n) {
           cursuma = cursuma + a[i][curpos] * deg;
           cursumb = cursumb + b[curpos][i] * deg;
           deg = deg div 2;
           curpos = curpos + 1;
        }
        anew[i][start div k] = cursuma;
        bnew[start div k][i] = cursumb;
        start = start + k;
     }
  }
  
  //Перемножение полученных матриц
  for i := 0 to n - 1
     for j := 0 to n - 1 {
        int curans = 0;
        for pos := 0 to m - 1 {
           curans = (curans + precalc[anew[i][pos]][bnew[pos][j]]) mod 2;
        }
        ans[i][j] = curans;
  }

  // Вывод ответа
  for i := 0 to n - 1
     for j := 0 to n - 1 {
        write(ans[i][j]);
     }
     writeln();
  }

Литература

Gregory V. Bard — Accelerating Cryptanalysis with the Method of Four Russians

Метод четырёх русских для умножения матриц

Содержание

Простое решение

Сжатие матриц

Оценка трудоёмкости и выбор k

Код алгоритма

Литература

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты