Math 计算机科学中的浮点算法 介绍

Math 计算机科学中的浮点算法 介绍,math,floating-point,pointer-arithmetic,Math,Floating Point,Pointer Arithmetic,您好,我目前正在试图了解浮点运算如何在计算机科学中工作 宣言 我了解计算机科学中的浮点运算,但不了解其背后的力学 如果有人能给我一些关于浮点的子字段的定义,我将非常高兴 您好,由于浮点运算的定义非常复杂,我将定义一些子区域,帮助您探索浮点运算的其他子区域 定义 舍入误差 要将无限个实数压缩成有限个位,需要一个近似表示。 尽管整数的数量是无限的,但在大多数程序中,整数计算的结果可以存储在32位中 相比之下,对于固定数量的位,大多数实数计算会产生无法用那么多位精确表示的量。 由于这个原因,浮点

您好,我目前正在试图了解浮点运算如何在计算机科学中工作


宣言 我了解计算机科学中的浮点运算,但不了解其背后的力学

如果有人能给我一些关于浮点子字段的定义,我将非常高兴 您好,由于浮点运算的定义非常复杂,我将定义一些子区域,帮助您探索浮点运算的其他子区域


定义

舍入误差 要将无限个实数压缩成有限个位,需要一个近似表示。 尽管整数的数量是无限的,但在大多数程序中,整数计算的结果可以存储在32位中


相比之下,对于固定数量的位,大多数实数计算会产生无法用那么多位精确表示的量。 由于这个原因,浮点计算的结果通常必须四舍五入以适应其有限表示形式。这种舍入误差是浮点计算的特征

相对误差与Ulps 由于舍入误差是浮点计算中固有的,因此有必要找到一种计算此误差的方法。 例如,考虑浮点格式有“代码> B=10 < /代码>和<代码> p=3 < /COD>在本节中使用。


如果在无限精度计算中,浮点计算的结果是
3.12×10-2
,而答案是
0.0314
,则很明显,最后一位数字中有2个单位的误差。 类似地,如果实数
.0314159
表示为
3.14×10-2
,则最后一位中的
.159
单位是错误的


一般来说,如果使用浮点数
d.d…d×e
表示
z
,则最后的
d.d…d-(z/e)p-1
单位是错误的。 术语ulps用作
“最后一位的单位”
的缩写


如果计算结果是最接近正确结果的浮点数,则仍可能存在误差,误差最大可达
0.5 ulp
。 测量浮点数与其近似实数之差的另一种方法是相对误差,即两个数之差除以实数。例如,用3.14×100近似
3.14159的相对误差为
.00159/3.14159.0005

您好,由于浮点运算的定义非常复杂,我将定义一些子区域,帮助您探索浮点运算的其他子区域


定义

舍入误差 要将无限个实数压缩成有限个位,需要一个近似表示。 尽管整数的数量是无限的,但在大多数程序中,整数计算的结果可以存储在32位中


相比之下,对于固定数量的位,大多数实数计算会产生无法用那么多位精确表示的量。 由于这个原因,浮点计算的结果通常必须四舍五入以适应其有限表示形式。这种舍入误差是浮点计算的特征

相对误差与Ulps 由于舍入误差是浮点计算中固有的,因此有必要找到一种计算此误差的方法。 例如,考虑浮点格式有“代码> B=10 < /代码>和<代码> p=3 < /COD>在本节中使用。


如果在无限精度计算中,浮点计算的结果是
3.12×10-2
,而答案是
0.0314
,则很明显,最后一位数字中有2个单位的误差。 类似地,如果实数
.0314159
表示为
3.14×10-2
,则最后一位中的
.159
单位是错误的


一般来说,如果使用浮点数
d.d…d×e
表示
z
,则最后的
d.d…d-(z/e)p-1
单位是错误的。 术语ulps用作
“最后一位的单位”
的缩写


如果计算结果是最接近正确结果的浮点数,则仍可能存在误差,误差最大可达
0.5 ulp
。 测量浮点数与其近似实数之差的另一种方法是相对误差,即两个数之差除以实数。例如,用3.14×100近似
3.14159的相对误差为
.00159/3.14159.0005

,并有一些有趣的介绍。还有一些有趣的介绍。