Метод четырёх русских для умножения матриц — различия между версиями
Строка 9: | Строка 9: | ||
Сейчас будет показано, как немного уменьшить это время. | Сейчас будет показано, как немного уменьшить это время. | ||
− | |||
== Сжатие матриц == | == Сжатие матриц == |
Версия 06:34, 16 декабря 2011
Содержание
Постановка задачи
Рассмотрим следующую задачу: «Дано две квадратных матрицы
и , состоящие из нулей и единиц. Нужно найти их произведение. При этом, все операции выполняются по модулю .»Простое решение
Если мы будем считать произведение матриц
по определению( ), то трудоёмкость алгоритма составит — каждый из элементов результирующей матрицы вычисляется за время, пропорциональное .Сейчас будет показано, как немного уменьшить это время.
Сжатие матриц
Для выполнения сжатия матриц выполним следующий предподсчёт : для всех возможных пар двоичных векторов длины
подсчитаем и запомним их скалярное произведение по модулю .Возьмём первую матрицу. разделим каждую её строку на куски размера
. Для каждого куска определим номер двоичного вектора, который соответствует числам, находящимся на этом куске. Если кусок получился неравным по длине (последний кусок строки), то будем считать, что в конце в нём идут не влияющие на умножение нули. Получим матрицу .Аналогично поступим с матрицей
, вместо строк деля столбцы. Получим матрицу .Теперь, если вместо произведения матриц
и считать произведение новых матриц и , воспользовавшись посчитанными скалярными произведениями, то каждый элемент матрицы будет получаться уже за время, пропорциональное вместо , и время произведения матриц сократится с до .Оценка трудоёмкости и выбор k
Оценим трудоёмкость данного алгоритма.
- Предподсчёт скалярных произведений работает за .
- Создание матриц и —
- Перемножение полученных матриц —
Итого:
. Приведем анализ выбора числа для получения оптимальной сложности алгоритма.В силу возрастания функции
и убывания функции имеем, что сложность будет оптимальна при таком значении , что . Прологарифмируем обе части этого равенства:
В силу того, что
пренебрежительно мал по сравнению с имеем, что с точностью до константы равенТаким образом, при подстановке
, получаем итоговую трудоёмкостьКод алгоритма
int n, cur; vector <vector <int> > a, b, preculc, anew, bnew, ans; int main() { freopen("input.txt", "r", stdin); freopen("output.txt", "w", stdout); cin >> n; a.resize(n); b.resize(n); ans.resize(n); // Чтение матриц for (int i = 0; i < n; i++) for (int j = 0; j < n; j++) { cin >> cur; a[i].push_back(cur); } for (int i = 0; i < n; i++) for (int j = 0; j < n; j++) { cin >> cur; b[i].push_back(cur); } // Предподсчёт скалярных произведений int k = ceil(log( (double) n)); preculc.resize(1 << k); for (int i = 0; i < (1 << k); i++) for (int j = 0; j < (1 << k); j++) { int scalmul = 0; for (int pos = 0; pos < k; pos++) if (((1 << pos) & i) != 0 && ((1 << pos) & j) != 0) { scalmul = (scalmul + 1) % 2; } preculc[i].push_back(scalmul); } // Создание сжатых матриц int m = ceil(((double) n) / k); anew.resize(n); bnew.resize(m); for (int i = 0; i < n; i++) { for (int start = 0; start < n; start += k) { int cursuma = 0, cursumb = 0, curpos = start, deg = (1 << (k - 1)); while (curpos < start + k && curpos < n) { cursuma += a[i][curpos] * deg; cursumb += b[curpos][i] * deg; deg /= 2; curpos++; } anew[i].push_back(cursuma); bnew[start / k].push_back(cursumb); } } //Перемножение полученных матриц for (int i = 0; i < n; i++) for (int j = 0; j < n; j++) { int curans = 0; for (int pos = 0; pos < m; pos++) { curans = (curans + preculc[anew[i][pos]][bnew[pos][j]]) % 2; } ans[i].push_back(curans); } // Вывод ответа for (int i = 0; i < n; i++) { for (int j = 0; j < n; j++) { cout << ans[i][j] << " "; } cout << endl; } return 0; }