Изменения

Представление вещественных чисел

4061 байт добавлено, 18:20, 23 июня 2020

→‎Сложение и вычитание

Вещественные числа обычно представляются в виде чисел с плавающей запятой. Числа с плавающей запятой — один из возможных способов ~~предсталения~~ представления действительных чисел, который является компромиссом между точностью и диапазоном принимаемых значений, его можно считать аналогом экспоненциальной записи чисел, но только в памяти компьютера.

Число с плавающей запятой состоит из набора отдельных двоичных разрядов, условно разделенных на так называемые '''знак''' (англ.'' sign''), '''порядок ''' (англ. ''exponent'') и '''мантиссу''' (англ. ''mantis''). В наиболее распространённом формате (стандарт IEEE 754) число с плавающей запятой представляется в виде набора битов, часть из которых кодирует собой мантиссу числа, другая часть — показатель степени, и ещё один бит используется для указания знака числа, (<tex>0 </tex> {{--- }} если число положительное, <tex>1 </tex> {{--- }} если число отрицательное). При этом порядок записывается как целое число в [[Представление целых чисел: прямой код, код со сдвигом, дополнительный код|коде со сдвигом]], а мантисса {{---}} в [[#Нормальная и нормализованная форма|нормализованном виде]], своей дробной частью в двоичной системе счисления. Вот пример такого числа из <tex>16 </tex> двоичных разрядов:

{|class="wikitable" style="border-collapse: collapse; border: none"

|-

|}

Знак {{- --}} один бит, указывающий знак всего числа с плавающей точкой. Порядок и мантисса — целые числа, которые вместе со знаком дают представление числа с плавающей запятой в следующем виде:

<tex>(-1)^s S \times M \times B^E</tex>, где ~~s —~~ <tex>S</tex> {{---}} знак, <tex>B</tex> {{---}} основание, <tex>E — </tex> {{---}} порядок, а <tex>M — </tex> {{---}} мантисса.Десятичное число, записываемое как <tex> ReE</tex>, где <tex>R</tex> {{---}} число в полуинтервале <tex>[1; 10)</tex>, <tex>E</tex> {{---}} степень, в которой стоит множитель <tex>10</tex>; в нормализированной форме модуль <tex>R</tex> будет являться мантиссой, а <tex>E</tex> {{---}} порядком, а <tex>S</tex> будет равно <tex>1</tex> тогда и только тогда, когда <tex>R</tex> принимает отрицательное значение.Например, в числе <tex>-2435e9</tex> * <tex>S</tex> <tex>=</tex> <tex>1</tex>* <tex>B</tex> <tex>=</tex> <tex>10</tex>* <tex>M</tex> <tex>=</tex> <tex>2435</tex>* <tex>E</tex> <tex>=</tex> <tex>9</tex>

Порядок также иногда называют '''экспонентой ''' или просто '''показателем степени'''.

~~{{Определение|definition='''Плавающая запятая''' — форма представления дробных~~ При этом лишь некоторые из вещественных чисел могут быть представлены в памяти компьютера точным значением, в то время как остальные числа представляются приближёнными значениями. Попробуйте, скажем, перевести число <tex>0.2</tex> в двоичную систему счисления - получится бесконечная запись <tex>0,(0011)</tex>

Более простым вариантом представления вещественных чисел является вариант с фиксированной точкой, когда целая и вещественная части хранятся отдельно. Например, на целую часть отводится всегда <tex>X</tex> бит и на дробную отводится всегда <tex>Y</tex> бит. Такой способ в архитектурах процессоров не присутствует. Отдаётся предпочтение числам с плавающей запятой, как компромиссу между диапазоном допустимых значений и точностью.

== Нормальная и ''нормализованная'' форма == '''Нормальной формой''' числа с плавающей запятой называется такая форма, в которой мантисса (без учёта знака) в десятичной системе находится на полуинтервале [0; 1). Такая форма записи имеет недостаток: некоторые числа записываются неоднозначно (например, 0,0001 можно записать в 4 формах — 0,0001×100, 0,001×10−1, 0,01×10−2, 0,1×10−3), поэтому распространена также другая форма записи — '''нормализованная''', в которой мантисса десятичного числа принимает значения от 1 (включительно) до 10 (не включительно), а мантисса двоичного числа принимает значения от 1 (включительно) до 2 (не включительно). То есть в мантиссе слева от запятой до применения порядка находится ровно один знак. В такой форме любое число (кроме 0) записывается единственным образом. Ноль же представить таким образом невозможно, поэтому стандарт предусматривает специальную последовательность битов для задания числа 0 (а заодно и некоторых других полезных чисел, таких как <tex>-\infty</tex> и <tex>+\infty</tex>).Так как старший двоичный разряд (целая часть) мантиссы двоичного числа в нормализованном виде всегда равен «1», то его можно не записывать, сэкономив таким образом один бит, что и используется в стандарте IEEE 754. В позиционных системах счисления с основанием большим, чем 2 (в троичной, четверичной и др.), этого замечательного свойства нет (ведь целая часть там может быть не только единицей).~~{|class="wikitable" style="border-collapse: collapse; border: none"~~|-~~!colspan=5 style="background-color: powderblue; border: thin solid black; border-bottom: none"|Знак~~|-~~!style="background-color: powderblue; border: thin solid black; border-top: none"|!colspan=5 style="background-color: lightgreen; border: thin solid black"|Порядок!colspan=11 style="background-color: lightcoral; border: thin solid black"|Мантисса|-style="text-align: right"!style="background-color: powderblue; border: thin solid black"|0!style="background-color: lightgreen; border: thin solid black"|0!style="background-color: lightgreen; border: thin solid black"|0!style="background-color: lightgreen; border: thin solid black"|0!style="background-color: lightgreen; border: thin solid black"|0!style="background-color: lightgreen; border: thin solid black"|0!style="border: none"|1,!style="background-color: lightcoral; border: thin solid black"|0!style="background-color: lightcoral; border: thin solid black"|0!style="background-color: lightcoral; border: thin solid black"|0!style="background-color: lightcoral; border: thin solid black"|0!style="background-color: lightcoral; border: thin solid black"|0!style="background-color: lightcoral; border: thin solid black"|0!style="background-color: lightcoral; border: thin solid black"|0!style="background-color: lightcoral; border: thin solid black"|0!style="background-color: lightcoral; border: thin solid black"|0!style="background-color: lightcoral; border: thin solid black"|0~~|-~~|style="border: none"|~~ ~~|colspan=2 style="border: none; border-left: 1px solid gray; text-align: left"|14|colspan=3 style="border: none; border-right: 1px solid gray; text-align: right"|10|style="border: none"|~~ ~~|colspan=5 style="border: none; border-left: 1px solid gray; text-align: left"|9|colspan=5 style="border: none; border-right: 1px solid gray; text-align: right"|0~~|}

'''Нормальной формой''' (англ. ''normal form'') числа с плавающей запятой называется такая форма, в которой мантисса (без учёта знака) в десятичной системе находится на полуинтервале <tex>[0; 1)</tex>. Такая форма записи имеет недостаток: некоторые числа записываются неоднозначно (например, <tex>0{,}0001</tex> можно записать в 4 формах — <tex>0{,}0001 \times 10</tex><tex>0</tex>, <tex>0{,}001 \times 10</tex><tex>−1</tex>, <tex>0{,}01 \times 10</tex><tex>−2</tex>, <tex>0{,}1 \times 10</tex><tex>−3</tex>), поэтому распространена также другая форма записи — '''нормализованная''' (англ. ''normalized''), в которой мантисса десятичного числа принимает значения от <tex>1</tex> (включительно) до <tex>10</tex> (не включительно), а мантисса двоичного числа принимает значения от <tex>1</tex> (включительно) до <tex>2</tex> (не включительно). То есть в мантиссе слева от запятой до применения порядка находится ровно один знак. В такой форме любое число (кроме <tex>0</tex>) записывается единственным образом. Ноль же представить таким образом невозможно, поэтому стандарт предусматривает специальную последовательность битов для задания числа <tex>0</tex> (а заодно и некоторых других [[#Особые значения чисел с плавающей точкой|полезных чисел]], таких как <tex>-\infty</tex> и <tex>+\infty</tex>).

Так как старший двоичный разряд (целая часть) мантиссы вещественного числа в нормализованном виде всегда равен «<tex>1</tex>», то его можно не записывать, сэкономив таким образом один бит, что и используется в стандарте IEEE 754. В позиционных системах счисления с основанием большим, чем <tex>2</tex> (в троичной, четверичной и др.), этого замечательного свойства нет (ведь целая часть там может быть не только единицей).

== Типы чисел с плавающей точкой (по IEEE 754) ==

=== Число половинной точности (''Binary16'', ''Half precision'') ===

'''Число́ полови́нной то́чности''' — компьютерный формат представления чисел, занимающий в памяти половину машинного слова (в случае 32-битного компьютера — <tex>16 </tex> бит или <tex>2 </tex> байта). В силу невысокой точности этот формат представления чисел с плавающей запятой обычно используется в видеокартах, где небольшой размер и высокая скорость работы важнее точности вычислений.

{|class="wikitable" style="border-collapse: collapse; border: none"

|colspan=4 style="border: none; border-right: 1px solid gray; text-align: right"|0

|}

Порядок записан [[Представление целых чисел: прямой код, код со сдвигом, дополнительный код|со сдвигом]] '''<tex>-15</tex>'''. ~~Это означает, что если дан порядок 01101~~То есть чтобы получить актуально значение порядка нужно вычесть из него сдвиг. Сдвиг можно получить по формуле <~~sub~~tex>2^{b-1}-1</~~sub~~tex> ~~то он на самом деле равен не 13~~, а где <tex>b</tex> {{--2 -}} число бит, отведенное на хранение порядка (~~потому как~~ в случае числа половинной точности <tex>~~13-15~~b=-25</tex>).

'''Ограничения точности'''

* Целые от нуля до <tex>2048 </tex> передаются как есть.* Целые от <tex>2049 </tex> до <tex>4096 </tex> округляются к ближайшему чётному целому.* Целые от <tex>4097 </tex> до <tex>8192 </tex> округляются до ближайшего целого, делящегося нацело на 4четыре.* Целые от <tex>8193 </tex> до <tex>16384 </tex> округляются до ближайшего целого, делящегося на 8восемь.* Целые от <tex>16385 </tex> до <tex>32768 </tex> округляются до ближайшего целого, делящегося на 16шестнадцать.* Целые от <tex>32769 </tex> до <tex>65535 </tex> округляются до ближайшего целого, делящегося на 32тридцать два.

=== Число одинарной точности (''Binary32'', ''Single precision'', ''float'') ===

'''Число́ одина́рной то́чности''' — компьютерный формат представления чисел, занимающий в памяти одно машинное слово (в случае 32-битного компьютера — <tex>32 </tex> бита или <tex>4 </tex> байта). Используется для работы с вещественными числами везде, где не нужна очень высокая точность.

{|class="wikitable" style="background-color: transparent; border-collapse: collapse; border: none"

!style="background-color: powderblue; border: thin solid black; border-top: none"|

!colspan=8 style="background-color: lightgreen; border: thin solid black"|Порядок (8 бит)

!colspan=24 style="background-color: lightcoral; border: thin solid black"|Мантисса (2423+1 бита)

|-style="text-align: right"

!style="background-color: powderblue; border: thin solid black"|0

|style="border: none"|

|colspan=4 style="border: none; border-left: 1px solid gray; text-align: left"|30

|colspan=4 style="border: none; border-right: 1px solid gray; text-align: right"|2423

|style="border: none"|

|colspan=20 style="border: none; border-left: 1px solid gray; text-align: left"|2322

|colspan=3 style="border: none; border-right: 1px solid gray; text-align: right"|0

|}

Порядок записан со сдвигом '''<tex>-127</tex>'''.

=== Число двойной точности (''Binary64'', ''Double precision'', ''double'') ===

'''Число́ двойно́й то́чности''' —

компьютерный формат представления чисел, занимающий в памяти два машинных слова (в случае 32-битного компьютера — <tex>64 </tex> бита или <tex>8 </tex> байт). Часто используется благодаря своей неплохой точности, даже ~~не смотря~~ несмотря на двойной расход памяти и сетевого трафика относительно чисел одинарной точности.

{|class="wikitable" style="border-collapse: collapse; border: none"

|colspan=4 style="border: none; border-right: 1px solid gray; text-align: right"|0

|}

Порядок записан со сдвигом '''<tex>-1023</tex>'''.

=== Число четверной точности (''Binary128'', ''Quadruple precision'') ===

'''Число́ четверно́й то́чности''' —

компьютерный формат представления чисел, занимающий в памяти четыре машинных слова (в случае 32-битного компьютера — <tex>128 </tex> бит или <tex>16 </tex> байт). Используется в случае необходимости крайне высокой точности.

{|class="wikitable" style="border-collapse: collapse; border: none"

|colspan=66 style="border: none; border-right: 1px solid gray; text-align: right"|0

|}

Порядок записан со сдвигом '''<tex>-16383</tex>'''.

Обычно этот формат реализуется программно, случаи аппаратной реализации крайне редки. Также не гарантируется поддержка этого типа в языках программирования, хотя кое-где она и реализована (например, компилятор gcc для архитектуры x86 позволяет использовать тип __float128, являющийся программной реализацией числа с четверной точностью).

В совокупности эти факторы делают Quadruple весьма экзотичным и редко встречающимся форматом чисел с плавающей запятой.

=== Диапазон значений чисел с плавающей запятой ===

Диапазон чисел, которые можно записать данным способом, зависит от количества бит, отведённых для представления мантиссы и показателя. Пара значений показателя (когда все разряды нули и когда все разряды единицы) зарезервирована для обеспечения возможности представления специальных чисел. К ним относятся ноль, значения NaN (Not a Number, "не число", получается как результат операций типа деления нуля на ноль) и <tex>\pm\infty</tex>.

Данная таблица только лишь примерно указывает границы допустимых значений, без учета возрастающей погрешности с ростом абсолютного значения и существования [[#Денормализованные числа|денормализованных чисел]].

{| class="wikitable"

!Название в IEEE 754|| Название типа переменной в Си || Диапазон значений || Бит в мантиссе || Бит на переменную

|-

|Half precision||-||6,10×10-5..65504||11||16

|-

|Single presicion||float||-3,4×1038..3,4×1038||23||32

|-

|Double precision||double||-1,7×10308..1,7×10308||53||64

|-

|Extended precision||На некоторых архитектурах (например в сопроцессоре Intel) long double||-3,4×104932..3,4×104932||65||80

|}

== Особые значения чисел с плавающей точкой ==

=== Ноль (со знаком) ===

Как уже было оговорено выше, в нормализованной форме числа с плавающей точкой невозможно представить ноль. Поэтому для его представления зарезервированы специальные значения мантиссы и порядка~~. Число~~ {{---}} число считается ~~нулевым~~нулём, если все его биты ~~порядка равны нулю и все биты мантиссы~~ , кроме знакового, равны нулю. При этом в зависимости от значения ~~одного~~ бита знака ноль может ~~быть~~ быть как положительным, так и отрицательным.

{|class="wikitable" style="border-collapse: collapse; border: none"

|colspan=5 style="border: none; border-right: 1px solid gray; text-align: right"|0

|}

~~'''Зачем нужен ноль со знаком?'''~~

~~ ~~

Знак у нуля был оставлен умышленно, хотя при сравнении согласно стандарту <tex>-0 = +0</tex>. Сделано это для того, чтобы получать всегда как можно более корректный результат, даже если считаемое значение выйдет за нижнюю или верхнюю границу точности (обернется в <tex>0</tex> или <tex>\infty</tex>). Кроме того, такой подход в некоторой мере отражает особенности, возникающие в математическом анализе, где, скажем, функция может стремиться к нулю "сверху" или "снизу". Также ноль со знаком находит применение в статистической механике и некоторых других дисциплинах.

'''Арифметика нуля со знаком'''

* <tex>\frac{\left|x\right|}{-0} = -\infty\,\!</tex> (если <tex>x\ne0</tex>)

=== Неопределенность (''NaN'') ==='''NaN ''' {{--- }} это аббревиатура от фразы "''not a number''". ~~Специальное представление~~NaN является результатом арифметических операций, этакое псевдочисло, придуманное для того, чтобы арифметическая операция могла всегда вернуть какое-то не бессмысленное значениеесли во время их выполнения произошла ошибка (примеры см. ниже). В IEEE 754 NaN представлен как число, в котором все двоичные разряды порядка {{--- }} единицы, а мантисса не нулевая.

{|class="wikitable" style="border-collapse: collapse; border: none"

* <tex>0\times\infty= NaN</tex>

* <tex>\frac{\pm0}{\pm0}=NaN</tex> * <tex>\frac{\pm\infty}{\pm\infty} = NaN</tex>

* <tex>\sqrt{x} = NaN</tex>, где <tex>x<0</tex>

Есть и другие способы ~~получить~~ получения NaN, подробности можно найти по ссылкам в [[#Ссылки|соответствующем разделе]].

По определению NaN ≠ NaN, поэтому, для проверки значения переменной нужно просто сравнить ее с собой.

=== Бесконечности ===

В число с плавающей запятой можно записать значение <tex>+\infty</tex> или <tex>-\infty</tex>. Как и нули со знаком, бесконечности позволяют получить хотя бы близкий к правильному результат вычисления в случае переполнения. Согласно стандарту IEEE 754 число с плавающей запятой считается равным бесконечности, если все двоичные разряды его порядка {{- --}} единицы, а мантисса равна нулю. Знак бесконечности определяется знаковым битом числа.

{|class="wikitable" style="border-collapse: collapse; border: none"

|}

Получить бесконечность можно при переполнении и при делении ненулевого числа на ноль. Бесконечность при делении разработчики определили исходя из существования пределов, когда делимое и делитель стремиться к какому-то числу. Соответственно, При этом <texdpi = "180">\frac{cx}{0}~~=\pm\infty~~</tex> ~~(например,~~ <tex>=\~~frac{7}~~begin{0cases}=+\infty~~</tex>~~, ~~а <tex>~~&\~~frac~~text{-7если $x>0$;}\\NaN,&\text{если $x=0$;}=\\-\infty~~</tex>)~~, ~~так как~~ &\text{если ~~делимое стремиться к константе, а делитель к нулю, предел равен бесконечности. При~~ $x<~~tex>\frac{~~0$.}\end{0cases} </tex> ~~предел не существует, поэтому результатом будет NaN.~~

=== Денормализованные числа ===

'''Денормализованные числа''' (англ. ''denormalized/subnormal numbers'') - это способ увеличить количество представимых числом с плавающей запятой значений около нуля, дабы повысить точность вычислений. Каждое значение денормализованного числа меньше самого маленького '''нормализованного''' ("обычного") значения числа с плавающей запятой.

Согласно стандарту, если порядок равен своему минимальному значению (все его биты {{---}} нули, а истинное значение порядка равно его сдвигу) и все биты мантиссы равны нулю, то это <tex>\pm0</tex>. Если же мантисса не равна нулю, то это число с порядком, на единицу большим минимального (все биты порядка, кроме младшего {{---}} нули) и данной мантиссой, '''целая часть которой считается равной нулю, а не единице'''.

~~== Диапазон значений чисел~~ То есть число с плавающей запятой ==~~Диапазон чисел~~, ~~которые~~ при учете вышесказанного, можно записать данным способом, зависит от количества бит, отведённых для представления мантиссы и показателя. Пара значений показателя задать следующим образом: * <tex>(~~когда все разряды нули и когда все разряды единицы~~-1) ~~зарезервирована для обеспечения возможности представления специальных чисел. К ним относятся ноль~~^s\times1, ~~значения NaN (Not a Number~~M\times2^E</tex>, ~~"не число", получается как результат операций типа деления нуля на ноль) и~~ если <tex>E_{min} \pmle E \~~infty~~le E_{max}</tex>.(''нормализованное число'')

* <!-tex>(- ~~TODO: Выкинуть нафиг эту бессмысленную таблицу~~1)^s\times0, ~~переписать весь раздел~~M\times2^{E_{min}}</tex>, ~~привести распределение значений и формулу для подсчета их количества -~~если <tex>E=E_{min}-1</tex>(''денормализованное число'')

Где <~~center~~tex>s</tex> {{---}} бит знака, <tex>M</tex> {{---}} последовательность битов мантиссы, <tex>E</tex> {{---}} значение порядка (с учетом сдвига), <tex>E_{min}</tex> {{---}} минимальное значение порядка, используемое для записи чисел (1 {{---}} ''сдвиг'') , <tex>E_{min}-1</tex> {{---}} минимальное значение порядка, которое он в принципе может принять (все биты нули, 0 {{---}} ''сдвиг'').

Хоть денормализованные числа и позволяют бороться с погрешностями и обрабатывать очень маленькие значения, за эти возможности приходится дорого платить. Ввиду сложности денормализованные числа крайне редко реализуют на аппаратном уровне - вместо этого используются программные реализации, работающие значительно медленнее. <~~table border=1 CellSpacing="0" CellPadding="2"~~br/>

В современных процессорах обработка денормализованных чисел происходит в десятки раз медленнее, чем обработка нормализованных чисел. Ниже приведена часть таблицы из статьи Isaac Dooley, Laxmikant Kale "Quantifying the Interference Caused by Subnormal Floating-Point Values"<trref>~~<th>Название (IEEE 754)<~~[http:/~~th><th>Тип (C)<~~/~~th><th>Диапазон<~~charm.cs.uiuc.edu/~~th><th>Биты мантиссы<~~papers/~~th><th>Биты</th>~~SubnormalOSIHPA06.pdf Статья Isaac Dooley, Laxmikant Kale "Quantifying the Interference Caused by Subnormal Floating-Point Values" ''(англ.)'']</trref>

~~<tr><td>Half precision</td><td>Нет</td><td>~~{| class="wikitable" !Производитель||Процессор||Замедление (разы) |- |IBM||PowerPC 970||2,4 |- |AMD||Athlon||6,~~10×10~~0 |- |Intel||Pentium 3||15,8 |- |AMD||Athlon 64||21,4 |- |AMD||Opteron64||23,8 |- |Intel||Core Duo||44,2 |-~~5..65504</td><td>10+1</td><td>16</td></tr>~~ |Intel||P4 Xeon||97,9 |- |Intel||Pentium 4||131,0 |- |Intel||Itanium 2||183,2 |- |Sun||UltraSPARC IV||520,0 |}

~~<tr><td>Single precision</td><td>float</td><td>3~~В таблице приведены наихудшие результаты тестирования среди всех использованных компиляторов (gcc,~~4×10-38~~icc, xlc) со всеми доступными флагами оптимизации.Исследователи утверждают, что различие среднего случая с худшим незначительно.~~3,4×1038</td><td>23+1</td><td>32</td></tr>~~

~~<tr><td>Double precision</td><td>double</td><td>1~~Поскольку в стандартных форматах (одинарной и двойной точности) денормализованные числа получаются действительно ''очень'' маленькими и практически никак не влияют на результат некоторых вычислений (при этом заметно замедляя их скорость), то иногда они просто игнорируются. При этом используются два простых механизма,~~7×10~~получивших называние ''Flush-to-zero'' (''FTZ'') и ''Denormals-are-~~308~~zero'' (''DAZ''). Первый механизм заставляет операции возвращать ноль, как только становится ясно, что результат будет денормализованным. Второй механизм заставляет операции рассматривать поступающие на вход денормализованные числа как нули. <br/~~sup~~>Ярким примером подобного "отсечения" денормализованных чисел могут послужить видеокарты, в которых резкое падение скорости вычислений в сотню раз недопустимо.Так же, например, в областях, связанных с обработкой звука, нет нужды в очень маленьких числах, поскольку они представляют столь тихий звук, что его не способно воспринять человеческое ухо.~~1,7×10308</td><td>52+1</td><td>64</td></tr>~~

~~<tr><td>Extended precision</td><td>Нет~~В версии стандарта IEEE 754-2008 денормализованные числа (''denormal'' или ''denormalized numbers'') были переименованы в ''subnormal numbers'', ~~иногда long double</td><td>3~~то есть в числа,~~4×10-4932~~меньшие "нормальных".Поэтому их иногда еще называют "'''субнормальными'''".~~3,4×104932</td><td>64+1</td><td>80</td></tr>~~

~~</table>~~

== Действия с числами с плавающей запятой ===== Умножение и деление ===Самыми простыми для восприятия арифметическими операциями над числами с плавающей запятой являются умножение и деление. Для того, чтобы умножить два вещественных числа в нормализованной форме необходимо перемножить их мантиссы, сложить порядки, округлить и нормализовать полученное число.<~~/center>~~!-- Пример:

e=<tex>3</tex>; m=<tex>4.734612</tex> (порядок и мантисса первого числа)

× e=<tex>5</tex>; m=<tex>5.417242</tex> (порядок и мантисса второго числа)

-----------------------

e=<tex>8</tex>; m=<tex>25.648538980104</tex> (произведение как оно есть)

e=<tex>8</tex>; m=<tex>25.64854</tex> (мантисса после округления)

e=<tex>9</tex>; m=<tex>2.564854</tex> (нормализованная форма)

-->

~~== Денормализованные числа ==~~Денормализованные числа (denormalized\subnormal numbers) - это способ увеличить количество представимых числом с плавающей запятой значений около нуляСоответственно, ~~дабы повысить точность вычислений~~чтобы произвести деление нужно разделить мантиссу делимого на мантиссу делителя и вычесть из порядка делимого порядок делителя. Каждое значение денормализованного числа меньше самого маленького нормализованного ("обычного") значения числа с плавающей запятойЗатем точно так же округлить мантиссу результата и привести его к нормализованной форме.~~Согласно стандарту~~

~~То есть число~~ === Сложение и вычитание ===Идея метода сложения и вычитания чисел с плавающей ~~запятой~~точкой заключается в приведении их к одному порядку. Сначала выбирается оптимальный порядок, ~~при учете вышесказанного~~затем мантиссы обоих чисел представляются в соответствии с новым порядком, ~~можно задать следующим образом:<br~~затем над ними производится сложение/>* <tex>(-1)^s\times1.M\times2^E</tex>вычитание, мантисса результата округляется и, если ~~<tex>E_{min} \le E \le E_{max}</tex> (нормализованное число)~~нужно, результат приводится к нормализированной форме. Пример:

* Выполним сложение чисел с плавающей точкой и смещенным порядком в 32-х разрядном формате <tex>-269</tex> <tex>7</tex><tex>/</tex><tex>32</tex> и <tex>405,875</tex>. Переведем <tex>(-~~1)^s\times0~~269</tex> <tex>7</tex><tex>/</tex><tex>32</tex> в машинный вид.~~M\times2^~~Для этого сначала переведем его в двоичную систему счисления. <tex>-269</tex> <tex>7</tex><tex>/</tex><tex>32</tex> <tex>=</tex> <tex>-269{E_,}21875</tex> <tex>-269{~~min}~~,}21875</tex><tex>10</tex>~~, если~~ <tex>E=E_</tex> <tex>-100001101{~~min~~,}-100111</tex><tex>2</tex> ~~(денормализованное число)~~

~~Где~~ Нормализуем полученное двоичное число по правилам машинной арифметики. <tex>s-100001101{,}00111</tex> ~~- бит знака,~~ <tex>M=</tex> <tex> - ~~последовательность битов мантиссы~~1{, }0000110100111</tex><tex>E\times</tex> ~~- значение порядка (с учетом сдвига),~~ <tex>~~E_{min}~~10</tex> ~~- минимальное значение порядка, используемое для записи чисел (1-''сдвиг'') ,~~ <tex>~~E_{min}-1~~8</tex> ~~- минимальное значение порядка, которое он в принципе может принять (все биты нули, 0-''сдвиг'').~~

<! Найдем смещенный порядок. Так как в условии говорится о 32-~~- Есть непроверенная информация~~разрядном представлении, ~~что денормализованные числа исключают ситуацию, при которой a~~то смещение порядка равно <tex>127</tex><tex>10</tex>. <tex>E</tex> <tex>=</tex> <tex>8</tex><tex>10</tex> <tex>+</tex> <tex>127</tex><tex>10</tex> <tex>=</tex> <tex>1000</tex><tex>2</tex> <tex>+b</tex> <tex>1111111</tex><tex>2</tex> <tex>=~~a, когда a и b - конечные числа отличные от нуля. Было бы неплохо сюда её добавить --~~</tex> <tex>10000111</tex><tex>Хоть денормализованные числа и позволяют бороться с погрешностями и обрабатывать очень маленькие значения, за эти возможности приходится дорого платить. Ввиду сложности денормализованные числа крайне редко реализуют на аппаратном уровне - вместо этого используются программные реализации, работающие значительно медленнее. 2<br/tex>Поскольку в стандартных форматах (одинарной и двойной точности) денормализованные числа получаются действительно ''очень'' маленькими и практически никак не влияют на результат некоторых вычислений (при этом заметно замедляя их скорость), то иногда они просто игнорируются. При этом используются два простых механизма, получивших называние Flush-to-zero (FTZ) и Denormals-are-zero (DAZ). Первый механизм заставляет операции возвращать ноль, как только становится ясно, что результат будет денормализованным. Второй механизм заставляет операции рассматривать поступающие на вход денормализованные числа как нули. <br/sub>Ярким примером подобного "отсечения" денормализованных чисел могут послужить видеокарты, в которых резкое падение скорости вычислений в сотню раз недопустимо. Так же, например, в областях, связанных с обработкой звука, нет нужды в очень маленьких числах, поскольку они представляют столь тихий звук, что его не способно воспринять человеческое ухо.

~~В версии стандарта IEEE 754-2008 денормализованные числа (denormal или denormalized numbers) были переименованы в subnormal number~~ Число отрицательное, следовательно, ~~то есть~~ в ~~числа, меньшие "нормальных". Поэтому их иногда еще называют "субнормальными"~~бите знака будет стоять единица.

Итак, первое число в машинном 32-разрядном представлении с плавающей точкой будет иметь вид:

<tex>1</tex>10000111<tex>00001101001110000000000</tex> (жирным шрифтом выделен порядок числа, длина мантиссы {{---}} 23 бита).

~~== Действия с числами с плавающей запятой ===== Умножение и деление ===~~Самыми простыми для восприятия арифметическими операциями над числами с плавающей запятой являются умножение и деление. Для того, чтобы умножить два вещественных числа Переведем второе число в ~~нормализованной форме мы умножаем их мантиссы друг на друга~~машинный вид, а порядки складываем. Затем округляем мантиссу, чтобы она поместилась в данное число бит и приводим результат к нормализованному видусовершая те же действия. ~~Вот простой пример:~~

~~e=3;~~ m<tex>405,87510</tex> =4<tex>110010101</tex>,<tex>111000000000011010</tex>.~~734612 (порядок и мантисса первого числа)~~ ~~× e~~..<tex>2</tex> <tex>=~~5; m=5~~</tex> <tex>1,10010101111000000000011010</tex>...~~417242 (порядок и мантисса второго числа)~~<tex>\times</tex> <tex>10</tex><tex>1000</tex> ~~-----------------------~~ ~~e=8; m=25~~В качестве мантиссы будут сохранены первые <tex>23</tex> бита после запятой т.е.~~648538980104 (произведение как оно есть)~~ ~~e=8; m=25~~<tex>10010101111000000000011</tex>.~~64854 (мантисса после округления)~~ ~~e=9;~~ ~~m=2~~Очевидно, что порядок со смещением у второго числа будет таким же, как и у первого.~~564854 (нормализованная форма)~~

~~Соответственно~~ Второе число положительное, чтобы произвести деление нужно разделить мантиссу делимого на мантиссу делителя и вычесть из порядка делимого порядок делителя. Затем точно так же округлить мантиссу результата и привести его к нормализованной форме.

Итак в машинном 32-разрядном представлении второе число будет иметь вид:

~~=== Сложение и вычитание ===~~ <tex>0</tex>10000111<tex>10010101111000000000011</tex>~~Идея метода сложения и вычитания чисел с плавающей точкой заключается~~ Далее в ~~приведении их к одному порядку. Сначала выбирается оптимальный порядок~~арифметических операциях будет использоваться число <tex>110010101</tex>, ~~затем мантиссы обоих чисел представляются в соответствии с новым порядком~~<tex>111</tex><tex>2</tex>=<tex>405{, ~~затем над ними производится сложение~~}875</tex><tex>10</~~вычитание~~tex>, ~~мантисса результата округляется и~~а не <tex>110010101{, ~~если нужно~~}111000000000011</tex><tex>2</tex>=<tex>405{, ~~результат приводится к нормализированной форме~~}87510</tex><tex>10</tex> видимо для упрощения(хотя это не совсем корректно). ~~Пример для десятичных чисел в экспоненциальной нормализированной форме:~~

~~<tex>123456~~ Порядки у слагаемых равны, поэтому пропускаем шаг выравнивания порядков и проводим вычитание мантисс по правилам двоичной арифметики.~~7 = 1.234567 \times 10^5</tex> ~~В ~~<tex>101.7654 = 1.017654 \times 10^2 = 0~~ компьютере этим занимается арифметический сопроцессор, встроенный в центральный процессор машины.~~001017654 \times 10^5</tex>~~

~~Отсюда:~~ <tex> ~~123456.7 + 101.7654 = (~~1~~.234567 \times 10^5) + (~~</tex>,<tex>1001010111100</tex><tex>2</tex> <tex>-</tex> <tex>1~~.017654 \times 10^~~{,}0000110100111</tex><tex>2) </tex> <tex>= ~~(1.234567 \times 10^5) + (~~</tex> <tex>0~~.001017654 \times 10^5)~~ ~~= (1.234567 + 0.001017654) \times 10^5~~ ~~= 1.235584654 × 10^5~~ {,}1000100010101</tex><tex>2</tex>

~~По шагам:~~ Приводим полученный результат к машинному виду. Для этого мы должны внести поправку в порядок {{---}} уменьшить его на единицу. Знак результата {{---}} положительный, следовательно, бит знака содержит ноль.

~~e=5;~~ ~~m=1.234567 (123456.7)~~ ~~+ e=2; m=1.017654 (101.7654)~~ ~~e=5; m=1.234567~~ ~~+ e=5; m=~~<tex>0~~.001017654 (Мантисса второго числа после сдвига)~~ ~~--------------------~~ ~~e=5; m=1.235584654~~ </tex>10000110<tex>00010001010100000000000</tex>

Это настоящий результат. Его придется округлить до семи знаков после запятой и нормализировать, если понадобится. ~~e=5;~~ ~~m=1~~Проверим правильность наших вычислений.~~235585 (Это наш~~ Переведем результат)в десятичное представление.

~~В этом примере видно, что последние три цифры~~ Найдем реальный порядок результата были утеряны после округления. Это называется ошибкой округления, и в предельном случае она может вызвать ситуацию, ~~когда сумма двух конечных ненулевых чисел равна одному~~ вычтя из ~~них:~~него значение смещения <tex>127</tex><tex>10</tex>.

~~e=5;~~ m<tex>E</tex> <tex>=~~1.234567~~ ~~+ e=−3; m=9.876543~~ ~~e=5; m~~</tex> <tex>10000110</tex><tex>2</tex> <tex>-</tex> <tex>1111111</tex><tex>2</tex> <tex>=~~1.234567~~ ~~+ e=5; m=0.00000009876543 (после сдвига)~~ ~~-------------~~</tex> <tex>134</tex><tex>10</tex> <tex>-~~--------~~ e</tex> <tex>127</tex><tex>10</tex> <tex>=~~5; m~~</tex> <tex>7</tex><tex>10</tex> <tex>=~~1.23456709876543 (настоящая сумма)~~ ~~e=5; m=1.234567 (после округления и нормализации - равна первому числу)~~</tex> <tex>111</tex><tex>2</tex>

~~Аналогичная ситуация возможна при вычитании чисел~~ Следовательно, поэтому к арифметическим операциям и сравнениям чисел с плавающей запятой нужно относиться очень осторожно. Проблема частично решаема с помощью [[#Денормализованные числа|денормализованных чисел]]число результата будет иметь вид: <tex>A</tex> <tex>=</tex> <tex>1{, ~~но у них есть свои недостатки.~~}000100010101</tex> <tex>\times</tex> <tex>10</tex><tex>111</tex> <tex>=</tex> <tex>10001000</tex>,<tex>10101</tex><tex>2</tex> <tex>=</tex> <tex>136{,}65625</tex><tex>10</tex>

Результат наших вычислений верен, так как <tex>405{,}875</tex> - <tex>269{,}21875</tex> <tex>=</tex> <tex>136{,}65625</tex>.

=== Алгоритм получения представления вещественного числа в памяти ЭВМ ===

памяти ЭВМ на примере величины типа Double.

Как видно из таблицы, величина ~~это~~ этого типа занимает в памяти <tex>8 </tex> байт. На

рисунке ниже показано, как здесь представлены поля мантиссы и порядка (нумерация битов осуществляется справа налево):

~~<center>~~{|class="wikitable" !Знак || Смещённый порядок || Мантисса |- |63 || 62..52 || 51..0 |}

~~<table border=1 CellSpacing="0" CellPadding="2">~~

~~<tr><td>S</td><td>Смещенный порядок</td><td>Мантисса</td></tr>~~

~~<tr><td>63</td><td>62..52</td><td>51..0</td></tr>~~

~~</table>~~

~~</center>~~

Можно заметить, что старший бит, отведенный под мантиссу, имеет номер

<tex>51</tex>, т.е. мантисса занимает младшие <tex>52 </tex> бита. Черта указывает здесь на

положение двоичной запятой. Перед запятой должен стоять бит целой части

мантиссы, но поскольку она всегда равна <tex>1</tex>, здесь данный бит не требуется и

соответствующий разряд отсутствует в памяти (но он подразумевается).

смещение. Смещение выбирается так, чтобы минимальному значению порядка

соответствовал нуль. Например, для типа Double порядок занимает <tex>11 </tex> бит и

имеет диапазон от <tex>2</tex><tex>-1023</tex> до <tex>2</tex><tex>1023</tex>, поэтому смещение равно <tex>1023</tex>(<tex>10</tex>) <tex> = </tex>

<tex>1111111111</tex>(<tex>2</tex>). Наконец, бит с номером <tex>63 </tex> указывает на знак числа.

Таким образом, из вышесказанного вытекает следующий алгоритм для

<LI>перевести модуль данного числа в двоичную систему счисления;</LI>

<LI>нормализовать двоичное число, т.е. записать в виде M~~ &~~<tex> \times~~; ~~</tex>2p, где M

мантисса (ее целая часть равна <tex>1</tex>(<tex>2</tex>)) и p  порядок, записанный в

десятичной системе счисления;</LI>

</OL>

Пример. Запишем код числа <tex>-312</tex>,<tex>3125</tex>.

<OL>

<LI>Двоичная запись модуля этого числа имеет вид <tex>100111000{,}0101</tex>.</LI>

<LI>Имеем <tex>100111000{,}0101 </tex> <tex>= </tex>

<tex>1{,}001110000101~~ &~~</tex><tex>\times~~; ~~</tex><tex>2</tex><tex>8</tex>.</LI>

<LI>Получаем смещенный порядок <tex>8 </tex> <tex>+ </tex> <tex>1023 </tex> <tex>= </tex> <tex>1031</tex>. Далее имеем

<LI>Окончательно

~~<center>~~{|class="wikitable" | 1 || 10000000111 || 0011100001010000000000000000000000000000000000000000 |- | 63 || 62..52 || 51..0 |}

~~<table border=1 CellSpacing="0" CellPadding="2">~~

~~<tr><td>1</td><td>10000000111</td><td>0011100001010000000000000000000000000000000000000000</td></tr>~~

~~<tr><td>63</td><td>62..52</td><td>51..0</td></tr>~~

~~</table>~~

~~</center>~~

</LI>

Пример. Пусть дан код 3FEC600000000000(16) или

<~~center~~OL>

~~<table border=1 CellSpacing~~{|class="wikitable" | 0 || 01111111110 || 1100011000000000000000000000000000000000000000000000 |- | 63 || 62..52 || 51..0~~" CellPadding="2">~~ |}

~~<tr><td>0</td><td>01111111110</td><td>1100011000000000000000000000000000000000000000000000</td></tr>~~

~~<tr><td>63</td><td>62..52</td><td>51..0</td></tr>~~

<~~/table~~LI>Прежде всего замечаем, что это код положительного числа, поскольку в

разряде с номером <tex>63</~~center~~tex>записан нуль. Получим порядок этого числа:

<LI>~~Прежде всего замечаем~~Число имеет вид <tex>1</tex>, ~~что это код положительного числа, поскольку в~~ <tex>1100011</tex><tex> \times </tex><tex>2</tex><tex>-1</tex> или

~~разряде с номером 63 записан нуль~~<tex>0</tex>,<tex>11100011</tex>. ~~Получим порядок этого числа:~~ </LI>

~~01111111110~~<~~sub~~LI>~~(2)~~Переводом в десятичную систему счисления получаем <tex>0</~~sub~~tex> ~~= 1022~~,<~~sub~~tex>~~(10)~~88671875</~~sub~~tex>~~; 1022 - 1023 = -1~~.</LI>

~~<LI>Число имеет вид 1,1100011 × 2-1 или~~

~~0,11100011.~~</LIOL>

~~<LI>Переводом в десятичную систему счисления получаем 0~~== См. также ==* [[Представление символов, таблицы кодировок]]* [[Представление целых чисел: прямой код, код со сдвигом,~~88671875.</LI>~~дополнительный код]]

== Примечания ==<references/OL>

== Ссылки ==

=== Использованные материалы ===

'''На русском'''* [http://ru.wikipedia.org/wiki/%D0%AD%D0%BA%D1%81%D0%BF%D0%BE%D0%BD%D0%B5%D0%BD%D1%86%D0%B8%D0%B0%D0%BB%D1%8C%D0%BD%D0%B0%D1%8F_%D0%B7%D0%B0%D0%BF%D0%B8%D1%81%D1%8C ~~http://ru.wikipedia.org/wiki/Экспоненциальная_запись~~Википедия {{---}} Экспоненциальная запись]* [http://ru.wikipedia.org/wiki/%D0%A7%D0%B8%D1%81%D0%BB%D0%BE_%D1%81_%D0%BF%D0%BB%D0%B0%D0%B2%D0%B0%D1%8E%D1%89%D0%B5%D0%B9_%D0%B7%D0%B0%D0%BF%D1%8F%D1%82%D0%BE%D0%B9 ~~http://ru.wikipedia.org/wiki/Число_с_плавающей_запятой~~Википедия {{---}} Число с плавающей запятой]* [http://ru.wikipedia.org/wiki/%D0%9E%D1%82%D1%80%D0%B8%D1%86%D0%B0%D1%82%D0%B5%D0%BB%D1%8C%D0%BD%D1%8B%D0%B9_%D0%B8_%D0%BF%D0%BE%D0%BB%D0%BE%D0%B6%D0%B8%D1%82%D0%B5%D0%BB%D1%8C%D0%BD%D1%8B%D0%B9_%D0%BD%D0%BE%D0%BB%D1%8C ~~http://ru.wikipedia.org/wiki/~~Википедия {{---}} Отрицательный и положительный ноль]*[http://ru.wikipedia.org/wiki/%D0%A7%D0%B8%D1%81%D0%BB%D0%BE_%D0%BF%D0%BE%D0%BB%D0%BE%D0%B2%D0%B8%D0%BD%D0%BD%D0%BE%D0%B9_%D1%82%D0%BE%D1%87%D0%BD%D0%BE%D1%81%D1%82%D0%B8 http://ru.wikipedia.org/wiki/Число_половинной_точности]*[http://ru.wikipedia.org/wiki/%D0%A7%D0%B8%D1%81%D0%BB%D0%BE_%D0%BE%D0%B4%D0%B8%D0%BD%D0%B0%D1%80%D0%BD%D0%BE%D0%B9_%D1%82%D0%BE%D1%87%D0%BD%D0%BE%D1%81%D1%82%D0%B8 http://ru.wikipedia.org/wiki/Число_одинарной_точности]*[http://ru.wikipedia.org/wiki/%D0%A7%D0%B8%D1%81%D0%BB%D0%BE_%D0%B4%D0%B2%D0%BE%D0%B9%D0%BD%D0%BE%D0%B9_%D1%82%D0%BE%D1%87%D0%BD%D0%BE%D1%81%D1%82%D0%B8 http://ru.wikipedia.org/wiki/Число_двойной_точности]*[http://habrahabr.ru/blogs/cpp/112953/ ~~http://habrahabr.ru/blogs/cpp/112953/~~Хабрахабр {{---}} статья пользователя Yruslan "Что нужно знать про арифметику с плавающей запятой"]*[http://ruwww.~~wikipedia~~sgu.~~org/wiki/%D0%A7%D0%B8%D1%81%D0%BB%D0%BE_%D1%87%D0%B5%D1%82%D0%B2%D0%B5%D1%80%D0%BD%D0%BE%D0%B9_%D1%82%D0%BE%D1%87%D0%BD%D0%BE%D1%81%D1%82%D0%B8 http://~~ru~~.wikipedia.org/wiki~~/~~Число_четверной_точности]~~*[http:prcnit/teach/~~comp-science~~3.~~narod~~php Статья Лапшевой Е.~~ru/Cod/cod~~Е.~~html http~~"Машинная арифметика с вещественными числами"] Статья удалена</~~/comp-science.narod.ru/Cod/cod.html]~~span>

'''На английском'''*[http://en.wikipedia.org/wiki/NaN ~~http://en.wikipedia.org/wiki/~~Wikipedia {{---}} NaN ~~''(англ.)''~~]*[http://en.wikipedia.org/wiki/Floating_point Wikipedia {{---}} Floating point]*[http://en.wikipedia.org/wiki/~~Floating_point ''(англ.)''~~IEEE_754-2008 Wikipedia {{---}} IEEE 754-2008]

=== Что стоит прочесть ===

* [http://grouper.ieee.org/groups/754 Материалы по стандарту IEEE 754 ''(англ.)'']

* [http://softelectro.ru/ieee754.html Русский перевод стандарта IEEE 754]

[[Категория: Дискретная математика и алгоритмы]]

[[Категория: Представление информации]]

Анонимный участник

213.171.40.106

Изменения

Представление вещественных чисел

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты