Метод четырёх русских для умножения матриц — различия между версиями
| Строка 42: | Строка 42: | ||
| == Код алгоритма == | == Код алгоритма == | ||
| <code> | <code> | ||
| − | + |    // Чтение матриц | |
| + |    for i := 0 to n - 1 | ||
| + |       for j := 0 to n - 1 { | ||
| + |          read(cur); | ||
| + |          a[i][j] = cur; | ||
| + |       }    | ||
| + |   // Чтение матриц | ||
| + |    for i := 0 to n - 1 | ||
| + |       for j := 0 to n - 1 { | ||
| + |          read(cur); | ||
| + |          b[i][j] = cur; | ||
| + |       }    | ||
| + | |||
|     // Предподсчёт скалярных произведений |     // Предподсчёт скалярных произведений | ||
|     // Пусть precalc[i][j] - "скалярное произведение для битовых представлений" чисел i и j |     // Пусть precalc[i][j] - "скалярное произведение для битовых представлений" чисел i и j | ||
|     // "&" - битовый and; "<<" - битовый сдвиг влево. |     // "&" - битовый and; "<<" - битовый сдвиг влево. | ||
| − |     int k = ceil( | + |     int k = ceil(log2(n)); //округление вверх | 
|     for i := 0 to (1 << k) - 1 |     for i := 0 to (1 << k) - 1 | ||
|        for j := 0 to (1 << k) - 1 { |        for j := 0 to (1 << k) - 1 { | ||
| Строка 82: | Строка 94: | ||
|           ans[i][j] = curans; |           ans[i][j] = curans; | ||
|     } |     } | ||
| − | + | ||
| + |    // Вывод ответа | ||
| + |    for i := 0 to n - 1 | ||
| + |       for j := 0 to n - 1 { | ||
| + |          write(ans[i][j]); | ||
| + |       } | ||
| + |       writeln(); | ||
| + |    } | ||
| </code> | </code> | ||
Версия 06:52, 22 декабря 2011
Дано две квадратных матрицы и , состоящие из нулей и единиц. Нужно найти их произведение. При этом, все операции выполняются по модулю .
Содержание
Простое решение
Если мы будем считать произведение матриц по определению(), то трудоёмкость алгоритма составит — каждый из элементов результирующей матрицы вычисляется за время, пропорциональное .
Сейчас будет показано, как немного уменьшить это время.
Сжатие матриц
Для выполнения сжатия матриц выполним следующий предподсчёт : для всех возможных пар двоичных векторов длины подсчитаем и запомним их скалярное произведение по модулю .
Возьмём первую матрицу. разделим каждую её строку на куски размера . Для каждого куска определим номер двоичного вектора, который соответствует числам, находящимся на этом куске. Если кусок получился неравным по длине (последний кусок строки), то будем считать, что в конце в нём идут не влияющие на умножение нули. Получим матрицу .
Аналогично поступим с матрицей , вместо строк деля столбцы. Получим матрицу .
Теперь, если вместо произведения матриц и считать произведение новых матриц и , воспользовавшись посчитанными скалярными произведениями, то каждый элемент матрицы будет получаться уже за время, пропорциональное вместо , и время произведения матриц сократится с до .
Оценка трудоёмкости и выбор k
Оценим трудоёмкость данного алгоритма.
- Предподсчёт скалярных произведений работает за .
- Создание матриц и —
- Перемножение полученных матриц —
Итого: . Приведем анализ выбора числа для получения оптимальной сложности алгоритма.
В силу возрастания функции и убывания функции имеем, что сложность будет оптимальна при таком значении , что . Прологарифмируем обе части этого равенства:
В силу того, что пренебрежительно мал по сравнению с имеем, что с точностью до константы равен
Таким образом, при подстановке , получаем итоговую трудоёмкость
Код алгоритма
  // Чтение матриц
  for i := 0 to n - 1
     for j := 0 to n - 1 {
        read(cur);
        a[i][j] = cur;
     }   
 // Чтение матриц
  for i := 0 to n - 1
     for j := 0 to n - 1 {
        read(cur);
        b[i][j] = cur;
     }   
       
  // Предподсчёт скалярных произведений
  // Пусть precalc[i][j] - "скалярное произведение для битовых представлений" чисел i и j
  // "&" - битовый and; "<<" - битовый сдвиг влево.
  int k = ceil(log2(n)); //округление вверх
  for i := 0 to (1 << k) - 1
     for j := 0 to (1 << k) - 1 {
        int scalmul = 0;
        for pos := 0 to k - 1
           if (((1 << pos) & i) != 0 and ((1 << pos) & j) != 0) {  
              scalmul = (scalmul + 1) mod 2;
           }
        precalc[i][j] = scalmul;
     }
  
  // Создание сжатых матриц anew, bnew
  for i := 0 to n - 1 {
     while (start < n) {
        int cursuma = 0, cursumb = 0, curpos = start, deg = (1 << (k - 1));
        while (curpos < start + k and curpos < n) {
           cursuma = cursuma + a[i][curpos] * deg;
           cursumb = cursumb + b[curpos][i] * deg;
           deg = deg div 2;
           curpos = curpos + 1;
        }
        anew[i][start div k] = cursuma;
        bnew[start div k][i] = cursumb;
        start = start + k;
     }
  }
  
  //Перемножение полученных матриц
  for i := 0 to n - 1
     for j := 0 to n - 1 {
        int curans = 0;
        for pos := 0 to m - 1 {
           curans = (curans + precalc[anew[i][pos]][bnew[pos][j]]) mod 2;
        }
        ans[i][j] = curans;
  }
  // Вывод ответа
  for i := 0 to n - 1
     for j := 0 to n - 1 {
        write(ans[i][j]);
     }
     writeln();
  }
Литература
- Gregory V. Bard — Accelerating Cryptanalysis with the Method of Four Russians
