Метод четырёх русских для умножения матриц — различия между версиями
| Строка 10: | Строка 10: | ||
| Сейчас будет показано, как немного уменьшить это время. | Сейчас будет показано, как немного уменьшить это время. | ||
| − | |||
| − | |||
| − | |||
| == Сжатие матриц ==   | == Сжатие матриц ==   | ||
| − | + | Для выполнения сжатия матриц выполним следующий предподсчёт : для всех возможных пар двоичных векторов длины <tex>k</tex> подсчитаем и запомним их скалярное произведение по модулю <tex>2</tex>. | |
| Возьмём первую матрицу. разделим каждую её строку на куски размера <tex>k</tex>. Для каждого куска определим номер двоичного вектора, который соответствует числам, находящимся на этом куске. Если кусок получился неравным по длине <tex>k</tex>(последний кусок строки), то будем считать, что в конце в нём идут не влияющие на умножение нули. Получим матрицу <tex dpi=140>A'_{n \times \lceil\frac{n}{k} \rceil}</tex>. | Возьмём первую матрицу. разделим каждую её строку на куски размера <tex>k</tex>. Для каждого куска определим номер двоичного вектора, который соответствует числам, находящимся на этом куске. Если кусок получился неравным по длине <tex>k</tex>(последний кусок строки), то будем считать, что в конце в нём идут не влияющие на умножение нули. Получим матрицу <tex dpi=140>A'_{n \times \lceil\frac{n}{k} \rceil}</tex>. | ||
| Строка 29: | Строка 26: | ||
| * Предподсчёт скалярных произведений работает за <tex>O(2^{2k}k)</tex>. | * Предподсчёт скалярных произведений работает за <tex>O(2^{2k}k)</tex>. | ||
| − | * Создание матриц <tex>A'</tex> и <tex>B'</tex> {{---}} <tex>O( | + | * Создание матриц <tex>A'</tex> и <tex>B'</tex> {{---}} <tex>O(n^2)</tex> | 
| * Перемножение полученных матриц {{---}} <tex dpi=140>O(\frac{n^3}{k})</tex> | * Перемножение полученных матриц {{---}} <tex dpi=140>O(\frac{n^3}{k})</tex> | ||
Версия 06:27, 16 декабря 2011
Содержание
Постановка задачи
Рассмотрим следующую задачу: «Дано две квадратных матрицы и , состоящие из нулей и единиц. Нужно найти их произведение. При этом, все операции выполняются по модулю .»
Простое решение
Если мы будем считать произведение матриц по определению(), то трудоёмкость алгоритма составит — каждый из элементов результирующей матрицы вычисляется за время, пропорциональное .
Сейчас будет показано, как немного уменьшить это время.
Сжатие матриц
Для выполнения сжатия матриц выполним следующий предподсчёт : для всех возможных пар двоичных векторов длины подсчитаем и запомним их скалярное произведение по модулю .
Возьмём первую матрицу. разделим каждую её строку на куски размера . Для каждого куска определим номер двоичного вектора, который соответствует числам, находящимся на этом куске. Если кусок получился неравным по длине (последний кусок строки), то будем считать, что в конце в нём идут не влияющие на умножение нули. Получим матрицу .
Аналогично поступим с матрицей , вместо строк деля столбцы. Получим матрицу .
Теперь, если вместо произведения матриц и считать произведение новых матриц и , воспользовавшись посчитанными скалярными произведениями, то каждый элемент матрицы будет получаться уже за время, пропорциональное вместо , и время произведения матриц сократится с до .
Оценка трудоёмкости и выбор k
Оценим трудоёмкость данного алгоритма.
- Предподсчёт скалярных произведений работает за .
- Создание матриц и —
- Перемножение полученных матриц —
Итого: . Приведем анализ выбора числа для получения оптимальной сложности алгоритма.
В силу возрастания функции и убывания функции имеем, что сложность будет оптимальна при таком значении , что . Прологарифмируем обе части этого равенства:
В силу того, что пренебрежительно мал по сравнению с имеем, что с точностью до константы равен
Таким образом, при подстановке , получаем итоговую трудоёмкость
Код алгоритма
int n, cur;
vector <vector <int> > a, b, preculc, anew, bnew, ans;
int main() {
  freopen("input.txt", "r", stdin);
  freopen("output.txt", "w", stdout);
  cin >> n;
  a.resize(n);
  b.resize(n);
  ans.resize(n);
  // Чтение матриц
  for (int i = 0; i < n; i++) 
     for (int j = 0; j < n; j++) {
        cin >> cur;
        a[i].push_back(cur);
     }   
  for (int i = 0; i < n; i++) 
     for (int j = 0; j < n; j++) {
        cin >> cur;
        b[i].push_back(cur);
     }   
  // Предподсчёт скалярных произведений
  int k = ceil(log( (double) n));
  preculc.resize(1 << k);
  for (int i = 0; i < (1 << k); i++)
     for (int j = 0; j < (1 << k); j++) {
        int scalmul = 0;
        for (int pos = 0; pos < k; pos++)
           if (((1 << pos) & i) != 0 && ((1 << pos) & j) != 0) {
              scalmul = (scalmul + 1) % 2;
           }
        preculc[i].push_back(scalmul);
     }
  // Создание сжатых матриц
  int m = ceil(((double) n) / k);
  anew.resize(n);
  bnew.resize(m);
  for (int i = 0; i < n; i++) {
     
     for (int start = 0; start < n; start += k) {
        int cursuma = 0, cursumb = 0, curpos = start, deg = (1 << (k - 1));
        while (curpos < start + k && curpos < n) {
           cursuma += a[i][curpos] * deg;
           cursumb += b[curpos][i] * deg;
           deg /= 2;
           curpos++;
        }
        anew[i].push_back(cursuma);
        bnew[start / k].push_back(cursumb);
     }
  }
  //Перемножение полученных матриц
  for (int i = 0; i < n; i++)
     for (int j = 0; j < n; j++) {
        int curans = 0;
        for (int pos = 0; pos < m; pos++) {
           curans = (curans + preculc[anew[i][pos]][bnew[pos][j]]) % 2;
        }
        ans[i].push_back(curans);
     }
  // Вывод ответа
  for (int i = 0; i < n; i++) {
     for (int j = 0; j < n; j++) {
        cout << ans[i][j] << " ";
     }
     cout << endl;
  }
  return 0;
}
