Просмотр исходного текста страницы Представление чисел с плавающей точкой

{{В разработке}}
== Плавающая точка ==
{{Определение
|definition=
'''Плавающая точка (floating point)''' - метод представления действительных чисел, при котором число хранится в виде мантиссы и показателя степени.
}}
Такой метод является компромиссом между точностью и диапазоном представляемых значений.
Представление чисел с плавающей точкой рассмотрим на примере чисел ''двойной точности'' (''double precision'').
Такие числа занимают в памяти два машинных слова (8  байт на 32-битных системах). Наиболее распространенное представление описано в стандарте IEEE 754.

== Числа двойной точности ==
Число с плавающей точкой хранится в нормализованной форме и состоит из трех частей (в скобках указано количество бит, отводимых на каждую секцию в формате double):
# знак
# экспонента (показатель степени) (в виде целого числа в коде со сдвигом)
# мантисса (в нормализованной форме)
В качестве базы (основания степени) используется число <tex> 2 </tex>.
Экспонента хранится со сдвигом <tex> -1023 </tex>.

{|class="wikitable" style="border-collapse: collapse; border: none"
|-
!colspan=7 style="background-color: powderblue; border: thin solid black; border-bottom: none"|Знак
|-
!style="background-color: powderblue; border: thin solid black; border-top: none"|
!colspan=11 style="background-color: lightgreen; border: thin solid black"|Экспонента<br />(11 бит)
!colspan=53 style="background-color: lightcoral; border: thin solid black"|Мантисса<br />(52+1 бит)
|-style="text-align: right"
!style="background-color: powderblue; border: thin solid black"|0
!style="background-color: lightgreen; border: thin solid black"|0
!style="background-color: lightgreen; border: thin solid black"|0
!style="background-color: lightgreen; border: thin solid black"|0
!style="background-color: lightgreen; border: thin solid black"|0
!style="background-color: lightgreen; border: thin solid black"|0
!style="background-color: lightgreen; border: thin solid black"|0
!style="background-color: lightgreen; border: thin solid black"|0
!style="background-color: lightgreen; border: thin solid black"|0
!style="background-color: lightgreen; border: thin solid black"|0
!style="background-color: lightgreen; border: thin solid black"|0
!style="background-color: lightgreen; border: thin solid black"|0
!style="border: none"|1,
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: lightcoral; border: thin solid black"|0
|-
|style="border: none"| 
|colspan=4  style="border: none; border-left: 1px solid gray; text-align: left"|62
|colspan=7  style="border: none; border-right: 1px solid gray; text-align: right"|52
|style="border: none"| 
|colspan=48 style="border: none; border-left: 1px solid gray; text-align: left"|51
|colspan=4  style="border: none; border-right: 1px solid gray; text-align: right"|0
|}

{{Утверждение
|statement=
Итоговое значение числа вычисляется по формуле:
<br><tex> x = (-1)^{sign} \times (1.mant) \times 2^{exp} </tex>
}}

== Нормальная и нормализованная формы ==
{{Определение
|definition=
'''Нормальной''' называется форма представления числа, при которой абсолютное значение мантиссы десятичного числа находится на полуинтервале <tex> [0,1) </tex>.
}}
Недостатком такой записи является тот факт, что числа нельзя записать однозначно: <tex> 0.01 = 0.001 \times 10^1 </tex>.
{{Определение
|definition=
'''Нормализованной''' называется форма представления числа, при которой абсолютное значение мантиссы десятичного числа лежит на полуинтервале <tex> [1, 10) </tex>, а двоичного на полуинтервале <tex> [1, 2) </tex>.
}}

== Свойства чисел с плавающей точкой ==
# В нормализованном виде любое отличное от нуля число представимо в единственном виде. Недостатком такой записи является тот факт, что невозможно представить число 0.
# Так как старший бит двоичного числа, записанного в нормализованной форме, всегда равен 1, его можно опустить. Это используется в стандарте IEEE 754.
# В отличие от целочисленных стандартов (например, integer), имеющих равномерное распределение на всем множестве значений, числа с плавающей точкой (double, например) имеют квазиравномерное распределение.
# В следствие свойства 3, числа с плавающей точкой имеют постоянную относительную погрешность (в отличие от целочисленных, которые имеют постоянную абсолютную погрешность).
# Очевидно, не все действительные числа возможно представить в виде числа с плавающей точкой.
# Точно в таком формате представимы только числа, являющиеся суммой некоторых обратных степеней двойки (не ниже -53). Остальные числа попадают в некоторый диапазон и округляются до ближайшей его границы. Таким образом, абсолютная погрешность составляет половину величины младшего бита.
# В формате double представимы числа в диапазоне <tex> [2.3 \times 10^{-308}, 1.7 \times 10^{308}] </tex>.

== Особые значение чисел с плавающей точкой ==
=== Ноль (со знаком) ===
В нормализованной форме невозможно представить ноль. Для его представления в стандарте зарезервированы специальные значения мантиссы и экспоненты.
{|class="wikitable" style="border-collapse: collapse; border: none"
|-
!colspan=5 style="background-color: powderblue; border: thin solid black; border-bottom: none"|Знак
|-
!style="background-color: powderblue; border: thin solid black; border-top: none"|
!colspan=5 style="background-color: lightgreen; border: thin solid black"|Экспонента
!colspan=11 style="background-color: lightcoral; border: thin solid black"|Мантисса
!style="border: none"| 
|-style="text-align: right"
!style="background-color: powderblue; border: thin solid black"|<sup>0</sup>/<sub>1</sub>
!style="background-color: lightgreen; border: thin solid black"|0
!style="background-color: lightgreen; border: thin solid black"|0
!style="background-color: lightgreen; border: thin solid black"|0
!style="background-color: lightgreen; border: thin solid black"|0
!style="background-color: lightgreen; border: thin solid black"|0
!style="border: none"|1,
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: transparent; border: none"|&nbsp;=&nbsp;<tex>\pm0</tex>
|}
Согласно стандарту выполняются следующие свойства:
* <tex> +0 = -0 </tex>
* <tex> \frac{-0}{ \left| x \right| } = -0\,\!</tex> (если <tex>x\ne0</tex>)
* <tex> (-0) \cdot (-0) = +0\,\!</tex>
* <tex> \left| x \right| \cdot (-0) = -0\,\!</tex>
* <tex> x + (\pm 0) = x\,\!</tex>
* <tex> (-0) + (-0) = -0\,\!</tex>
* <tex> (+0) + (+0) = +0\,\!</tex>
* <tex> \frac{-0}{-\infty} = +0\,\!</tex>
* <tex> \frac{\left|x\right|}{-0} = -\infty\,\!</tex>  (если <tex>x\ne0</tex>)

=== Бесконечность (со знаком) ===
Для приближения ответа к правильному при переполнении, в double можно записать бесконечное значение. Так же, как и в случае с нолем, для этого используются специальные значение мантиссы и экспоненты.
{|class="wikitable" style="border-collapse: collapse; border: none"
|-
!colspan=5 style="background-color: powderblue; border: thin solid black; border-bottom: none"|Знак
|-
!style="background-color: powderblue; border: thin solid black; border-top: none"|
!colspan=5 style="background-color: lightgreen; border: thin solid black"|Экспонента
!colspan=11 style="background-color: lightcoral; border: thin solid black"|Мантисса
!style="border: none"| 
|-style="text-align: right"
!style="background-color: powderblue; border: thin solid black"|<sup>0</sup>/<sub>1</sub>
!style="background-color: lightgreen; border: thin solid black"|1
!style="background-color: lightgreen; border: thin solid black"|1
!style="background-color: lightgreen; border: thin solid black"|1
!style="background-color: lightgreen; border: thin solid black"|1
!style="background-color: lightgreen; border: thin solid black"|1
!style="border: none"|1,
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: lightcoral; border: thin solid black"|0
!style="background-color: transparent; border: none"|&nbsp;=&nbsp;<tex>\pm\infty</tex>
|}
Бесконечное значение можно получить при переполнении или при делении ненулевого числа на ноль.

=== Неопределенность ===
В математике встречается понятие неопределенности. В стандарте double предусмотрено псевдочисло, которое арифметическая операция может вернуть даже в случае ошибки.
{|class="wikitable" style="border-collapse: collapse; border: none"
|-
!colspan=5 style="background-color: powderblue; border: thin solid black; border-bottom: none"|Знак
|-
!style="background-color: powderblue; border: thin solid black; border-top: none"|
!colspan=5 style="background-color: lightgreen; border: thin solid black"|Экспонента
!colspan=11 style="background-color: lightcoral; border: thin solid black"|Мантисса
!style="border: none"| 
|-style="text-align: right"
!style="background-color: powderblue; border: thin solid black"|<sup>0</sup>/<sub>1</sub>
!style="background-color: lightgreen; border: thin solid black"|1
!style="background-color: lightgreen; border: thin solid black"|1
!style="background-color: lightgreen; border: thin solid black"|1
!style="background-color: lightgreen; border: thin solid black"|1
!style="background-color: lightgreen; border: thin solid black"|1
!style="border: none"|1,
!style="background-color: lightcoral; border: thin solid black"|<sup>0</sup>/<sub>1</sub>
!style="background-color: lightcoral; border: thin solid black"|<sup>0</sup>/<sub>1</sub>
!style="background-color: lightcoral; border: thin solid black"|<sup>0</sup>/<sub>1</sub>
!style="background-color: lightcoral; border: thin solid black"|<sup>0</sup>/<sub>1</sub>
!style="background-color: lightcoral; border: thin solid black"|<sup>0</sup>/<sub>1</sub>
!style="background-color: lightcoral; border: thin solid black"|<sup>0</sup>/<sub>1</sub>
!style="background-color: lightcoral; border: thin solid black"|<sup>0</sup>/<sub>1</sub>
!style="background-color: lightcoral; border: thin solid black"|<sup>0</sup>/<sub>1</sub>
!style="background-color: lightcoral; border: thin solid black"|<sup>0</sup>/<sub>1</sub>
!style="background-color: lightcoral; border: thin solid black"|<sup>0</sup>/<sub>1</sub>
!style="background-color: transparent; border: none"|&nbsp;=&nbsp;<tex>NaN</tex>
|}

Неопределенность можно получить в нескольких случаях. Приведем некоторые из них:
* <tex> f(NaN) = NaN </tex>, где <tex> f </tex> - любая арифметическая операция
* <tex> \infty + (-\infty) = NaN </tex>
* <tex> 0 \times \infty = NaN </tex>
* <tex> \frac{\pm0}{\pm0} = \frac{\pm \infty}{\pm \infty} = NaN </tex>
* <tex> \sqrt{x} = NaN </tex>, где <tex> x < 0 </tex>

=== Денормализованные числа ===

== Машинная эпсилон ==
{{Определение
|definition=
'''Машинная эпсилон''' - наименьшее положительное число <tex> \varepsilon_m </tex>, такое что, <tex> 1 \oplus \varepsilon_m = 1 </tex>, где <tex> \oplus </tex> - машинное сложение.
}}
{{Утверждение
|statement=
Таким образом, компьютер не различает числа <tex> x </tex> и <tex> y </tex>, если <tex> 1 < \frac{x}{y} < 1 + \varepsilon_m </tex>.
}}
{{Утверждение
|statement=
Из свойств чисел двойной точности следует, что для них <tex> \varepsilon_m = 2^{-54}</tex>.
}}

== Погрешность предиката "левый поворот" ==
=== Постановка задачи ===
Найти <tex> \varepsilon(a, b, c) = \varepsilon: |(b - a) \times (c - a)| > \varepsilon \Rightarrow a, b, c </tex> не лежат на одной прямой.

=== Решение ===
Рассмотрим формулу: <tex> |b_x - a_x||c_y - a_y| + |b_y - a_y||c_x - a_x| </tex>. <br>
Относительная погрешность <tex> \delta(|b_x - a_x|) = \delta(|c_y - a_y|) = \delta(|b_y - a_y|) = \delta(|c_x - a_x|) = \varepsilon_m </tex>, где <tex> \varepsilon_m </tex> - машинная эпсилон. <br>
Тогда относительная погрешность <tex> \delta(|b_x - a_x||c_y - a_y|) = \delta(|b_y - a_y||c_x - a_x|) = 2 \varepsilon_m </tex>. <br>
Таким образом, абсолютная погрешность предиката: <br><tex> \varepsilon = |b_x - a_x||c_y - a_y| \times \delta(|b_x - a_x||c_y - a_y|) + |b_y - a_y||c_x - a_x| \times \delta(|b_y - a_y||c_x - a_x|) = 2 \varepsilon_m (|b_x - a_x||c_y - a_y| + |b_y - a_y||c_x - a_x|) </tex>.

=== Ответ ===
<tex dpi="180"> \varepsilon(a, b, c) = 2 \varepsilon_m (|b_x - a_x||c_y - a_y| + |b_y - a_y||c_x - a_x|) </tex>

== Ссылки ==
[http://en.wikipedia.org/wiki/Floating_point en.wikipedia.org ''Floating point'']<br>
[http://en.wikipedia.org/wiki/Double_precision_floating-point_format en.wikipedia.org ''Double precision floating point format'']<br>
[http://citeseer.ist.psu.edu/viewdoc/download?doi=10.1.1.102.244&rep=rep1&type=pdf Goldberg, D. 1991 ''What every computer scientist should know about floating-point arithmetic'']<br>
[http://grouper.ieee.org/groups/754 ieee.org ''IEEE 754'']<br>
[http://neerc.ifmo.ru/mediawiki/index.php/%D0%9F%D1%80%D0%B5%D0%B4%D0%B8%D0%BA%D0%B0%D1%82_%22%D0%BB%D0%B5%D0%B2%D1%8B%D0%B9_%D0%BF%D0%BE%D0%B2%D0%BE%D1%80%D0%BE%D1%82%22 neerc.ifmo.ru/mediawiki ''Предикат "левый поворот"'']