Math 计算机科学中的浮点算法 介绍
您好,我目前正在试图了解浮点运算如何在计算机科学中工作Math 计算机科学中的浮点算法 介绍,math,floating-point,pointer-arithmetic,Math,Floating Point,Pointer Arithmetic,您好,我目前正在试图了解浮点运算如何在计算机科学中工作 宣言 我了解计算机科学中的浮点运算,但不了解其背后的力学 如果有人能给我一些关于浮点的子字段的定义,我将非常高兴 您好,由于浮点运算的定义非常复杂,我将定义一些子区域,帮助您探索浮点运算的其他子区域 定义 舍入误差 要将无限个实数压缩成有限个位,需要一个近似表示。 尽管整数的数量是无限的,但在大多数程序中,整数计算的结果可以存储在32位中 相比之下,对于固定数量的位,大多数实数计算会产生无法用那么多位精确表示的量。 由于这个原因,浮点
宣言 我了解计算机科学中的浮点运算,但不了解其背后的力学 如果有人能给我一些关于浮点的子字段的定义,我将非常高兴 您好,由于浮点运算的定义非常复杂,我将定义一些子区域,帮助您探索浮点运算的其他子区域
定义 舍入误差 要将无限个实数压缩成有限个位,需要一个近似表示。 尽管整数的数量是无限的,但在大多数程序中,整数计算的结果可以存储在32位中
相比之下,对于固定数量的位,大多数实数计算会产生无法用那么多位精确表示的量。 由于这个原因,浮点计算的结果通常必须四舍五入以适应其有限表示形式。这种舍入误差是浮点计算的特征 相对误差与Ulps 由于舍入误差是浮点计算中固有的,因此有必要找到一种计算此误差的方法。 例如,考虑浮点格式有“代码> B=10 < /代码>和<代码> p=3 < /COD>在本节中使用。
如果在无限精度计算中,浮点计算的结果是
3.12×10-2
,而答案是0.0314
,则很明显,最后一位数字中有2个单位的误差。
类似地,如果实数.0314159
表示为3.14×10-2
,则最后一位中的.159
单位是错误的
一般来说,如果使用浮点数
d.d…d×e
表示z
,则最后的d.d…d-(z/e)p-1
单位是错误的。
术语ulps用作“最后一位的单位”
的缩写
如果计算结果是最接近正确结果的浮点数,则仍可能存在误差,误差最大可达
0.5 ulp
。
测量浮点数与其近似实数之差的另一种方法是相对误差,即两个数之差除以实数。例如,用3.14×100近似3.14159的相对误差为.00159/3.14159.0005
您好,由于浮点运算的定义非常复杂,我将定义一些子区域,帮助您探索浮点运算的其他子区域
定义
舍入误差
要将无限个实数压缩成有限个位,需要一个近似表示。
尽管整数的数量是无限的,但在大多数程序中,整数计算的结果可以存储在32位中
相比之下,对于固定数量的位,大多数实数计算会产生无法用那么多位精确表示的量。
由于这个原因,浮点计算的结果通常必须四舍五入以适应其有限表示形式。这种舍入误差是浮点计算的特征
相对误差与Ulps
由于舍入误差是浮点计算中固有的,因此有必要找到一种计算此误差的方法。
例如,考虑浮点格式有“代码> B=10 < /代码>和<代码> p=3 < /COD>在本节中使用。
如果在无限精度计算中,浮点计算的结果是3.12×10-2
,而答案是0.0314
,则很明显,最后一位数字中有2个单位的误差。
类似地,如果实数.0314159
表示为3.14×10-2
,则最后一位中的.159
单位是错误的
一般来说,如果使用浮点数d.d…d×e
表示z
,则最后的d.d…d-(z/e)p-1
单位是错误的。
术语ulps用作“最后一位的单位”
的缩写
如果计算结果是最接近正确结果的浮点数,则仍可能存在误差,误差最大可达0.5 ulp
。
测量浮点数与其近似实数之差的另一种方法是相对误差,即两个数之差除以实数。例如,用3.14×100近似3.14159的相对误差为.00159/3.14159.0005
,并有一些有趣的介绍。还有一些有趣的介绍。