Дерево Уоллеса — различия между версиями

Материал из Викиконспекты
Перейти к: навигация, поиск
(math → tex)
м (rollbackEdits.php mass rollback)
 
(не показано 25 промежуточных версий 7 участников)
Строка 1: Строка 1:
==Определение==
+
'''Дерево Уоллеса''' (англ. ''Wallace tree'') {{---}} [[Реализация булевой функции схемой из функциональных элементов|схема]] для умножения двух чисел. Время работы <tex>O(\log n)</tex>.
 
 
Дерево Уоллеса - схема для умножения двух чисел.
 
  
 
==Принцип работы==
 
==Принцип работы==
Строка 8: Строка 6:
 
[[file:wallace_tree.png|thumb|200px|Иллюстрация работы дерева для суммирования 9 чисел]]
 
[[file:wallace_tree.png|thumb|200px|Иллюстрация работы дерева для суммирования 9 чисел]]
  
В отличие от ещё одной схемы для умножения --- [[Матричный умножитель|матричного умножителя]], дерево Уоллеса складывает все числа не последовательно, а с помощью специального элемента(назовём его <tex>3\to2</tex>), преобразующего 3 числа <tex>x, y</tex> и <tex> z </tex> в числа <tex>a</tex> и <tex>b</tex> такие, что <tex>x + y + z = a + b</tex>.
+
Для получения произведения, воспользуемся методом, напоминающим умножение «в столбик»: распишем произведение в сумму <tex>n</tex>
 +
чисел (как в [[Матричный умножитель|матричном умножителе]]).
 +
 
 +
Однако, в отличие от [[Матричный умножитель|матричного умножителя]], дерево Уоллеса складывает все числа не последовательно, а с помощью специального элемента(назовём его <tex>3\to2</tex>), преобразующего <tex>3</tex> числа <tex>x</tex>, <tex>y</tex> и <tex> z </tex> в числа <tex>a</tex> и <tex>b</tex> такие, что <tex>x + y + z = a + b</tex>.
  
 
С помощью этого элемента на каждом шаге производятся следующие операции:
 
С помощью этого элемента на каждом шаге производятся следующие операции:
# Берутся тройки чисел <tex>(x_1, x_2, x_3)</tex>, <tex>(x_4, x_5, x_6)</tex>, <tex>\ldots</tex>. При этом какие-то числа могут остаться.
+
# Берутся тройки чисел <tex>(x_1, x_2, x_3)</tex>, <tex>(x_4, x_5, x_6)</tex>, <tex>\ldots</tex>
 
# Для каждой тройки применяется элемент <tex>3\to2</tex>.
 
# Для каждой тройки применяется элемент <tex>3\to2</tex>.
# Повторяются пункты 1 и 2 пока не осталось 2 числа.
+
# Повторяются пункты 1 и 2 пока не осталось <tex>2</tex> числа.
# Оставшиеся 2 числа складываются с помощью [[Двоичный каскадный сумматор|двоичного каскадного сумматора]].
+
# Оставшиеся <tex>2</tex> числа складываются с помощью [[Двоичный каскадный сумматор|двоичного каскадного сумматора]].
  
 
На выходе имеем число, которое равно сумме чисел на всех входах.
 
На выходе имеем число, которое равно сумме чисел на всех входах.
  
 
===Элемент 3→2===
 
===Элемент 3→2===
[[file:3→2.png|thumb|200px|Элемент 3→2]]
+
[[file:3v2.png|thumb|300px|Элемент 3→2]]
Теперь о том, как устроен элемент <tex>3\to2</tex>.
+
Для того, чтобы представить сумму трёх чисел с помощью двух чисел, воспользуемся полным сумматором. Для каждого <tex>i</tex> направим <tex>x_i</tex>, <tex>y_i</tex> и <tex>z_i</tex> на вход полного сумматора. Тогда младший бит сумматора будет <tex>i</tex>-ым битом первого числа, а старший {{---}} <tex>(i + 1)</tex>-ым второго.  
 
 
Для построения элемента <tex>3\to2</tex> нам потребуется элемент, который умеет складывать 3 бита и возвращать 2 бита результата.
 
Основная идея реализации - отдельная обработка переносов и остатков.
 
  
Тогда первое число ответа <tex>a</tex> может быть получена так:
+
Очевидно, полученные числа в сумме дают <tex>x + y + z</tex>.
<tex>a_i = x_i \oplus y_i \oplus z_i</tex> ,
 
где <tex>x</tex>, <tex>y</tex> и <tex>z</tex> - входные числа, а <tex>x_i</tex>, <tex>y_i</tex> и <tex>z_i</tex> - соответствующие их <tex>i</tex>-е биты.
 
  
Второе же число <tex>b</tex> можно получить так:
+
На иллюстрации изображён элемент <tex>3\to2</tex> для четырёхбитных чисел, в верхнем прямоугольнике изображены четыре полных сумматора, выходы которых и являются разрядами результатов.
<tex> \begin{cases}
 
b_0 & = 0\\
 
b_{i + 1} & = \langle x_i, y_i, z_i \rangle
 
\end{cases}</tex> ,
 
где <tex>\langle x, y, z\rangle</tex> - функция медианы(она же "голосование 2 из 3"). С помощью этой функции считается перенос.
 
  
Очевидно, полученные числа <tex>a</tex> и <tex>b</tex> дадут в сумме <tex>x + y + z</tex>
+
Поскольку все полные сумматоры работают параллельно (выходы на каждом из них зависят только от собственных входов), то глубина такой схемы есть константа (не зависит от количества бит).
  
 
==Схемная сложность==
 
==Схемная сложность==
  
Определим схемную сложность этого элемента.
+
Определим количество элементов и глубину схемы для умножения двух чисел из <tex>n</tex> бит.
  
 
Каждый элемент <tex>3\to2</tex> имеет глубину <tex>O(1)</tex> и размер <tex>O(n)</tex>.
 
Каждый элемент <tex>3\to2</tex> имеет глубину <tex>O(1)</tex> и размер <tex>O(n)</tex>.
  
Подсчитаем количество элементов <tex>3\to2</tex>. На каждом шаге количество чисел, которые нужно просуммировать, уменьшается в <tex>1,{}5</tex> раза. Тогда глубина дерева будет равна <tex>\log_{3/2}n</tex>, и в нём будет <tex>n + \frac23n + \left(\frac23\right)^2n + \ldots = O(n)</tex> элементов <tex>3\to2</tex>.
+
Подсчитаем количество элементов <tex>3\to2</tex>. На каждом шаге количество чисел, которые нужно просуммировать, уменьшается в полтора раза. Тогда глубина дерева будет равна <tex>\log_{\frac{3}{2}}n</tex>, и в нём будет <tex> n + \dfrac{2}{3} n + \left(\dfrac{2}{3}\right)^2n + \ldots = O(n)</tex> элементов <tex>3\to2</tex>. Обозначим за <tex>size</tex> общее количество элементов в цепи; за <tex>size_{3\to2}</tex> количество элементов <tex>3\to2</tex>; за <tex>size_{sum}</tex> количество элементов двоичного каскадного сумматора в схеме; за <tex>depth</tex> глубину схемы; за <tex>depth_{3\to2}</tex> глубину каждого из элементов <tex>3\to2</tex>; за <tex>depth_{sum}</tex> глубину каждого из элементов двоичного каскадного сумматора.
 
Тогда общая сложность равна
 
Тогда общая сложность равна
  
Строка 50: Строка 41:
  
 
<tex>size = size_{3\to2} \cdot O(n) + size_{sum} = O(n^2) </tex>
 
<tex>size = size_{3\to2} \cdot O(n) + size_{sum} = O(n^2) </tex>
 +
 +
== См. также ==
 +
* [[Матричный умножитель]]
 +
* [[Сумматор]]
 +
* [[Каскадный сумматор]]
 +
* [[Двоичный каскадный сумматор]]
 +
 +
== Источники информации==
 +
 +
* Кормен, Т., Лейзерсон, Ч., Ривест, Р. Алгоритмы: построение и анализ — 960 с. — ISBN 5-900916-37-5
 +
 +
[[Категория: Дискретная математика и алгоритмы]]
 +
 +
[[Категория: Схемы из функциональных элементов ]]

Текущая версия на 19:39, 4 сентября 2022

Дерево Уоллеса (англ. Wallace tree) — схема для умножения двух чисел. Время работы [math]O(\log n)[/math].

Принцип работы

Дерево Уоллеса

Иллюстрация работы дерева для суммирования 9 чисел

Для получения произведения, воспользуемся методом, напоминающим умножение «в столбик»: распишем произведение в сумму [math]n[/math] чисел (как в матричном умножителе).

Однако, в отличие от матричного умножителя, дерево Уоллеса складывает все числа не последовательно, а с помощью специального элемента(назовём его [math]3\to2[/math]), преобразующего [math]3[/math] числа [math]x[/math], [math]y[/math] и [math] z [/math] в числа [math]a[/math] и [math]b[/math] такие, что [math]x + y + z = a + b[/math].

С помощью этого элемента на каждом шаге производятся следующие операции:

  1. Берутся тройки чисел [math](x_1, x_2, x_3)[/math], [math](x_4, x_5, x_6)[/math], [math]\ldots[/math]
  2. Для каждой тройки применяется элемент [math]3\to2[/math].
  3. Повторяются пункты 1 и 2 пока не осталось [math]2[/math] числа.
  4. Оставшиеся [math]2[/math] числа складываются с помощью двоичного каскадного сумматора.

На выходе имеем число, которое равно сумме чисел на всех входах.

Элемент 3→2

Элемент 3→2

Для того, чтобы представить сумму трёх чисел с помощью двух чисел, воспользуемся полным сумматором. Для каждого [math]i[/math] направим [math]x_i[/math], [math]y_i[/math] и [math]z_i[/math] на вход полного сумматора. Тогда младший бит сумматора будет [math]i[/math]-ым битом первого числа, а старший — [math](i + 1)[/math]-ым второго.

Очевидно, полученные числа в сумме дают [math]x + y + z[/math].

На иллюстрации изображён элемент [math]3\to2[/math] для четырёхбитных чисел, в верхнем прямоугольнике изображены четыре полных сумматора, выходы которых и являются разрядами результатов.

Поскольку все полные сумматоры работают параллельно (выходы на каждом из них зависят только от собственных входов), то глубина такой схемы есть константа (не зависит от количества бит).

Схемная сложность

Определим количество элементов и глубину схемы для умножения двух чисел из [math]n[/math] бит.

Каждый элемент [math]3\to2[/math] имеет глубину [math]O(1)[/math] и размер [math]O(n)[/math].

Подсчитаем количество элементов [math]3\to2[/math]. На каждом шаге количество чисел, которые нужно просуммировать, уменьшается в полтора раза. Тогда глубина дерева будет равна [math]\log_{\frac{3}{2}}n[/math], и в нём будет [math] n + \dfrac{2}{3} n + \left(\dfrac{2}{3}\right)^2n + \ldots = O(n)[/math] элементов [math]3\to2[/math]. Обозначим за [math]size[/math] общее количество элементов в цепи; за [math]size_{3\to2}[/math] количество элементов [math]3\to2[/math]; за [math]size_{sum}[/math] количество элементов двоичного каскадного сумматора в схеме; за [math]depth[/math] глубину схемы; за [math]depth_{3\to2}[/math] глубину каждого из элементов [math]3\to2[/math]; за [math]depth_{sum}[/math] глубину каждого из элементов двоичного каскадного сумматора. Тогда общая сложность равна

[math]depth = depth_{3\to2} \cdot \log_{3/2}n + depth_{sum} = O(\log n)[/math]

[math]size = size_{3\to2} \cdot O(n) + size_{sum} = O(n^2) [/math]

См. также

Источники информации

  • Кормен, Т., Лейзерсон, Ч., Ривест, Р. Алгоритмы: построение и анализ — 960 с. — ISBN 5-900916-37-5