Метод четырёх русских для умножения матриц — различия между версиями
| Строка 46: | Строка 46: | ||
Таким образом, при подстановке <tex>k = \log n</tex>, получаем итоговую трудоёмкость <tex dpi=140>O(n^2 \log n) + O(\frac{n^3}{\log n}) = O(\frac{n^3}{\log n})</tex>  | Таким образом, при подстановке <tex>k = \log n</tex>, получаем итоговую трудоёмкость <tex dpi=140>O(n^2 \log n) + O(\frac{n^3}{\log n}) = O(\frac{n^3}{\log n})</tex>  | ||
| + | == Код алгоритма ==  | ||
| + | <code>  | ||
| + |  int n, cur;  | ||
| + |  vector <vector <int> > a, b, preculc, anew, bnew, ans;  | ||
| + |  int main() {  | ||
| + |    freopen("input.txt", "r", stdin);  | ||
| + |    freopen("output.txt", "w", stdout);  | ||
| + |    cin >> n;  | ||
| + |    a.resize(n);  | ||
| + |    b.resize(n);  | ||
| + |    ans.resize(n);  | ||
| + |    // Чтение матриц  | ||
| + |    for (int i = 0; i < n; i++)   | ||
| + |       for (int j = 0; j < n; j++) {  | ||
| + |          cin >> cur;  | ||
| + |          a[i].push_back(cur);  | ||
| + |       }     | ||
| + |    for (int i = 0; i < n; i++)   | ||
| + |       for (int j = 0; j < n; j++) {  | ||
| + |          cin >> cur;  | ||
| + |          b[i].push_back(cur);  | ||
| + |       }     | ||
| + |    // Предподсчёт скалярных произведений  | ||
| + |    int k = ceil(log( (double) n));  | ||
| + |    preculc.resize(1 << k);  | ||
| + |    for (int i = 0; i < (1 << k); i++)  | ||
| + |       for (int j = 0; j < (1 << k); j++) {  | ||
| + |          int scalmul = 0;  | ||
| + |          for (int pos = 0; pos < k; pos++)  | ||
| + |             if (((1 << pos) & i) != 0 && ((1 << pos) & j) != 0) {  | ||
| + |                scalmul = (scalmul + 1) % 2;  | ||
| + |             }  | ||
| + |          preculc[i].push_back(scalmul);  | ||
| + |       }  | ||
| + |    // Создание сжатых матриц  | ||
| + |    int m = ceil(((double) n) / k);  | ||
| + |    anew.resize(n);  | ||
| + |    bnew.resize(m);  | ||
| + |    for (int i = 0; i < n; i++) {  | ||
| + | |||
| + |       for (int start = 0; start < n; start += k) {  | ||
| + |          int cursuma = 0, cursumb = 0, curpos = start, deg = (1 << (k - 1));  | ||
| + |          while (curpos < start + k && curpos < n) {  | ||
| + |             cursuma += a[i][curpos] * deg;  | ||
| + |             cursumb += b[curpos][i] * deg;  | ||
| + |             deg /= 2;  | ||
| + |             curpos++;  | ||
| + |          }  | ||
| + |          anew[i].push_back(cursuma);  | ||
| + |          bnew[start / k].push_back(cursumb);  | ||
| + |       }  | ||
| + |    }  | ||
| + |    //Перемножение полученных матриц  | ||
| + |    for (int i = 0; i < n; i++)  | ||
| + |       for (int j = 0; j < n; j++) {  | ||
| + |          int curans = 0;  | ||
| + |          for (int pos = 0; pos < m; pos++) {  | ||
| + |             curans = (curans + preculc[anew[i][pos]][bnew[pos][j]]) % 2;  | ||
| + |          }  | ||
| + |          ans[i].push_back(curans);  | ||
| + |       }  | ||
| + |    // Вывод ответа  | ||
| + |    for (int i = 0; i < n; i++) {  | ||
| + |       for (int j = 0; j < n; j++) {  | ||
| + |          cout << ans[i][j] << " ";  | ||
| + |       }  | ||
| + |       cout << endl;  | ||
| + |    }  | ||
| + |    return 0;  | ||
| + |  }  | ||
| + | </code>  | ||
Версия 05:48, 16 декабря 2011
Содержание
Постановка задачи
Рассмотрим следующую задачу: «Дано две квадратных матрицы и , состоящие из нулей и единиц. Нужно найти их произведение. При этом, все операции выполняются по модулю .»
Простое решение
Если мы будем считать произведение матриц по определению(), то трудоёмкость алгоритма составит — каждый из элементов результирующей матрицы вычисляется за время, пропорциональное .
Сейчас будет показано, как немного уменьшить это время.
Предподсчёт
Воспользуемся следующим приёмом. Возьмём некоторое целое число . Для всех возможных пар двоичных векторов длины подсчитаем и запомним их скалярное произведение по модулю .
Сжатие матриц
Воспользуемся полученным в предыдущем пункте результатом.
Возьмём первую матрицу. разделим каждую её строку на куски размера . Для каждого куска определим номер двоичного вектора, который соответствует числам, находящимся на этом куске. Если кусок получился неравным по длине (последний кусок строки), то будем считать, что в конце в нём идут не влияющие на умножение нули. Получим матрицу .
Аналогично поступим с матрицей , вместо строк деля столбцы. Получим матрицу .
Теперь, если вместо произведения матриц и считать произведение новых матриц и , воспользовавшись посчитанными скалярными произведениями, то каждый элемент матрицы будет получаться уже за время, пропорциональное вместо , и время произведения матриц сократится с до .
Оценка трудоёмкости и выбор k
Оценим трудоёмкость данного алгоритма.
- Предподсчёт скалярных произведений работает за .
 - Создание матриц и —
 - Перемножение полученных матриц —
 
Итого: . Приведем анализ выбора числа для получения оптимальной сложности алгоритма.
В силу возрастания функции и убывания функции имеем, что сложность будет оптимальна при таком значении , что . Прологарифмируем обе части этого равенства:
В силу того, что пренебрежительно мал по сравнению с имеем, что с точностью до константы равен
Таким образом, при подстановке , получаем итоговую трудоёмкость
Код алгоритма
int n, cur;
vector <vector <int> > a, b, preculc, anew, bnew, ans;
int main() {
  freopen("input.txt", "r", stdin);
  freopen("output.txt", "w", stdout);
  cin >> n;
  a.resize(n);
  b.resize(n);
  ans.resize(n);
  // Чтение матриц
  for (int i = 0; i < n; i++) 
     for (int j = 0; j < n; j++) {
        cin >> cur;
        a[i].push_back(cur);
     }   
  for (int i = 0; i < n; i++) 
     for (int j = 0; j < n; j++) {
        cin >> cur;
        b[i].push_back(cur);
     }   
  // Предподсчёт скалярных произведений
  int k = ceil(log( (double) n));
  preculc.resize(1 << k);
  for (int i = 0; i < (1 << k); i++)
     for (int j = 0; j < (1 << k); j++) {
        int scalmul = 0;
        for (int pos = 0; pos < k; pos++)
           if (((1 << pos) & i) != 0 && ((1 << pos) & j) != 0) {
              scalmul = (scalmul + 1) % 2;
           }
        preculc[i].push_back(scalmul);
     }
  // Создание сжатых матриц
  int m = ceil(((double) n) / k);
  anew.resize(n);
  bnew.resize(m);
  for (int i = 0; i < n; i++) {
     
     for (int start = 0; start < n; start += k) {
        int cursuma = 0, cursumb = 0, curpos = start, deg = (1 << (k - 1));
        while (curpos < start + k && curpos < n) {
           cursuma += a[i][curpos] * deg;
           cursumb += b[curpos][i] * deg;
           deg /= 2;
           curpos++;
        }
        anew[i].push_back(cursuma);
        bnew[start / k].push_back(cursumb);
     }
  }
  //Перемножение полученных матриц
  for (int i = 0; i < n; i++)
     for (int j = 0; j < n; j++) {
        int curans = 0;
        for (int pos = 0; pos < m; pos++) {
           curans = (curans + preculc[anew[i][pos]][bnew[pos][j]]) % 2;
        }
        ans[i].push_back(curans);
     }
  // Вывод ответа
  for (int i = 0; i < n; i++) {
     for (int j = 0; j < n; j++) {
        cout << ans[i][j] << " ";
     }
     cout << endl;
  }
  return 0;
}