Задача о порядке перемножения матриц — различия между версиями
Tsarevfs (обсуждение | вклад) |
(→Рекурсивное решение) |
||
Строка 11: | Строка 11: | ||
<tex> m[i,j] = \left \{ | <tex> m[i,j] = \left \{ | ||
\begin{array}{ll} | \begin{array}{ll} | ||
− | 0, & i | + | 0, & i \ge j \\ |
min(m[i,k] + m[k+1,j] + p_{i-1}p_kp_j | i \le k < j) & i < j | min(m[i,k] + m[k+1,j] + p_{i-1}p_kp_j | i \le k < j) & i < j | ||
\end{array} | \end{array} | ||
Строка 18: | Строка 18: | ||
Объясняется оно просто: для того, чтобы найти произведение матриц <tex>A_{i..j}</tex> при i=j не нужно ничего делать — это и есть сама матрица <tex>A_i</tex>. При нетривиальном случае мы перебираем все точки разбиения матрицы <tex>A_{i..j}</tex> на матрицы <tex>A_{i..k}</tex> и <tex>A_{k+1..j}</tex>, ищем кол-во операций, необходимое чтобы их получить и затем перемножаем для получения матрицы <tex>A_{i..j}</tex>.(Оно будет равно кол-ву операций, потраченное на решение подзадач + стоимость умножения матриц <tex>A_{i..k}A_{k+1..j}</tex>). Считаем, что размеры матриц заданы в массиве <tex>p</tex> и размер матрицы <tex>A_i</tex> равен <tex>p_{i-1} \times p_i</tex>. В данном случае рекурсивный метод нельзя использовать напрямую — он будет экспоненциальным из-за большого кол-ва перекрывающихся подзадач. | Объясняется оно просто: для того, чтобы найти произведение матриц <tex>A_{i..j}</tex> при i=j не нужно ничего делать — это и есть сама матрица <tex>A_i</tex>. При нетривиальном случае мы перебираем все точки разбиения матрицы <tex>A_{i..j}</tex> на матрицы <tex>A_{i..k}</tex> и <tex>A_{k+1..j}</tex>, ищем кол-во операций, необходимое чтобы их получить и затем перемножаем для получения матрицы <tex>A_{i..j}</tex>.(Оно будет равно кол-ву операций, потраченное на решение подзадач + стоимость умножения матриц <tex>A_{i..k}A_{k+1..j}</tex>). Считаем, что размеры матриц заданы в массиве <tex>p</tex> и размер матрицы <tex>A_i</tex> равен <tex>p_{i-1} \times p_i</tex>. В данном случае рекурсивный метод нельзя использовать напрямую — он будет экспоненциальным из-за большого кол-ва перекрывающихся подзадач. | ||
+ | |||
=== Динамическое программирование === | === Динамическое программирование === | ||
Будем запоминать в двумерном массиве <tex>m</tex> результаты вычислений для подзадач, чтобы избежать пересчета для уже вычислявшихся подзадач. После вычислений ответ будет в <tex>m[1,n]</tex>(Сколько перемножений требуется для последовательности матриц от <tex>1</tex> до <tex>n</tex> — то есть ответ на поставленную задачу).Сложность алгоритма будет <tex>O(n^3)</tex>, так как у нас <tex>{n \choose 2}</tex> вариантов выбора <tex>i, j : 1 \le i \le j \le n</tex> и <tex>O(N)</tex> точек разделения для каждого варианта. | Будем запоминать в двумерном массиве <tex>m</tex> результаты вычислений для подзадач, чтобы избежать пересчета для уже вычислявшихся подзадач. После вычислений ответ будет в <tex>m[1,n]</tex>(Сколько перемножений требуется для последовательности матриц от <tex>1</tex> до <tex>n</tex> — то есть ответ на поставленную задачу).Сложность алгоритма будет <tex>O(n^3)</tex>, так как у нас <tex>{n \choose 2}</tex> вариантов выбора <tex>i, j : 1 \le i \le j \le n</tex> и <tex>O(N)</tex> точек разделения для каждого варианта. |
Версия 02:07, 26 сентября 2011
Задача о порядке перемножения матриц — классическая задача динамического программирования, в которой дана последовательность матриц
и требуется минимизировать количество скалярных операций для вычисления их произведения. Матрицы предполагаются совместимыми по отношению к матричному умножению (то есть количество столбцов совпадает с количеством строк матрицы).Содержание
Подробное описание задачи
Произведение матриц — ассоциативная операция. Когда матрицы велики по одному измерению и малы по другому, количество скалярных операций может серьёзно зависеть от порядка перемножений матриц. Допустим, нам даны 3 матрицы
размерами соответственно и . Существует 2 способа их перемножения (расстановки скобок): и . В первом случае нам потребуется скалярных умножений, а во втором случае умножений — разница налицо. Поэтому может оказаться выгоднее потратить некоторое время на предобработку, решив, в каком порядке лучше всего умножать, чем умножать сразу в лоб. Таким образом, даны матриц: , , …, . Требуется определить, в каком порядке перемножать их, чтобы количество операций умножения было минимальным.Динамическое решение
Сведение задачи к подзадачам
Обозначим результат перемножения матриц
через , где . Если , то при любом способе расстановки скобок, последнее выполненное умножение для вычисления между матрицами и , то есть чтобы вычислить надо сначала вычислить , потом и затем их перемножить. Заметим, что если способ расстановки скобок оптимален, то расстановка скобок в этих матрицах должна быть оптимальной, иначе если бы существовал более эффективный способ расстановки скобок в матрицах и , то мы могли бы получить за меньшее число умножений, получаем противоречие, что расстановка скобок в оптимальна. Таким образом мы свели задачу к подзадачам. Это означает, что возможно решить задачу, используя динамическое программирование на подотрезке.Рекурсивное решение
Обозначим через
минимальное количество скалярных умножений для вычисления матрицы . Получаем следующее рекуррентное соотношение:Объясняется оно просто: для того, чтобы найти произведение матриц
при i=j не нужно ничего делать — это и есть сама матрица . При нетривиальном случае мы перебираем все точки разбиения матрицы на матрицы и , ищем кол-во операций, необходимое чтобы их получить и затем перемножаем для получения матрицы .(Оно будет равно кол-ву операций, потраченное на решение подзадач + стоимость умножения матриц ). Считаем, что размеры матриц заданы в массиве и размер матрицы равен . В данном случае рекурсивный метод нельзя использовать напрямую — он будет экспоненциальным из-за большого кол-ва перекрывающихся подзадач.Динамическое программирование
Будем запоминать в двумерном массиве
результаты вычислений для подзадач, чтобы избежать пересчета для уже вычислявшихся подзадач. После вычислений ответ будет в (Сколько перемножений требуется для последовательности матриц от до — то есть ответ на поставленную задачу).Сложность алгоритма будет , так как у нас вариантов выбора и точек разделения для каждого варианта.Ссылки
использованы материалы ru.wikipedia.org [1]
Литература
- Томас Х. Кормен и др. Алгоритмы: построение и анализ
- Sanjoy Dasgupta , Christos H. Papadimitriou, Umesh Vazirani Algorithms