Интервальная арифметика

Материал из Викиконспекты
Перейти к: навигация, поиск

Интервальная арифметика — способ работы с floating-point арифметикой, который для вещественных интервалов определяет операции, аналогичные обычным арифметическим. Этот способ удобен для работы с величинами, значения которых известны только приближённо, то есть определён конечный интервал, в котором эти значения содержатся.

Операции над интервалами

Мы будем рассматривать всевозможные конечные вещественные интервалы [math] [a, b]\ (a \leqslant b) [/math]. Операции над ними определяются следующим образом:

  • Сложение: [math] [a, b] + [c, d] = [a \underline{\oplus} c, b \overline{\oplus} d] [/math]
  • Вычитание: [math] [a, b] - [c, d] = [a \underline{\ominus} d, b \overline{\ominus} c] [/math]
  • Умножение: [math] [a, b] \times [c, d] = [\min(a \underline{\otimes} c, a \underline{\otimes} d, b \underline{\otimes} c, b \underline{\otimes} d), \max(a \overline{\otimes} c, a \overline{\otimes} d, b \overline{\otimes} c, b \overline{\otimes} d)] [/math]
  • Деление: [math] [a, b] / [c, d] = [\min(a \underline{\oslash} c, a \underline{\oslash} d, b \underline{\oslash} c, b \underline{\oslash} d), \max(a \overline{\oslash} c, a \overline{\oslash} d, b \overline{\oslash} c, b \overline{\oslash} d)] [/math]

Здесь и далее [math] \underline{\odot} [/math] и [math] \overline{\odot} [/math] — выполнение операции [math] \odot [/math] по правилам вещественной арифметики с округлением в меньшую и большую сторону соответственно.

Из определения видно, что интервал-сумма содержит всевозможные суммы чисел из интервалов-слагаемых и определяет границы множества таких сумм. Аналогично трактуются прочие действия. Отметим, что операция деления определена только в том случае, когда интервал-делитель не содержит нуля.

Вырожденные интервалы, у которых начало и конец совпадают, можно отождествить с обычными вещественными числами.

Применение в вычислительной геометрии

Допустим, нам нужно точно определить знак некоторого выражения (это может потребоваться, например, при вычислении предиката "левый поворот"). Будем использовать для его вычисления интервальную арифметику. Все исходные переменные, входящие в него, будут вырожденными интервалами. При выполнении одной из элементарных операций, описанных выше, будем вычислять нижнюю границу с округлением вниз, а верхнюю — с округлением вверх. Из-за погрешностей, возникающих при округлении вещественных чисел, истинные значения операций нам неизвестны, но они обязательно будет содержаться в посчитанных интервалах. Если левая и правая границы интервала для всего выражения оказались одного знака, то и само выражение однозначно будет иметь тот же знак. В противном случае требуются дополнительные действия.

В Microsoft Visual C++ и GCC режим округления и другие настройки вещественной арифметики можно изменить с помощью функции _controlfp (MSDN рекомендует использовать более безопасную версию _controlfp_s, но GCC ее не поддерживает).

Проблемы и ограничения

Переключение режима округления в процессоре является довольно длительной операцией, поэтому, если использовать его в каждой элементарной операции, это может сильно замедлить вычисления. Впрочем, эту проблему можно легко решить. Пусть мы вычисляем операцию [math]l = a \underline{\odot} b [/math], тогда [math] r = a \overline{\odot} b [/math] можно вычислить, заменив знаки операндов на противоположные и восстановив корректный знак [math] a \odot b [/math]. Например, для сложения, [math] a \overline{\oplus} b = \ominus ((\ominus a) \underline{\oplus} (\ominus b)) [/math] Значит, можно включить округление вниз до работы с интервалами и вернуть стандартный режим после нее, тогда много переключений не потребуется.

Предполагается, что мы можем управлять округлением в операциях над вещественными числами. Стандарт IEEE 754 гарантирует такую возможность, но не все современные языки/архитектуры его выполняют. Например, согласно этому материалу, вещественная арифметика в Java не соответствует стандарту IEEE 754 (в частности, не позволяет указывать правила округления). Поэтому на Java нельзя реализовать требуемую интервальную арифметику с использованием только примитивных типов double/float.

Ссылки