Math 计算机科学中的浮点算法介绍_Math_Floating Point_Pointer Arithmetic

Math 计算机科学中的浮点算法介绍

math floating-point

Math 计算机科学中的浮点算法介绍,math,floating-point,pointer-arithmetic,Math,Floating Point,Pointer Arithmetic,您好，我目前正在试图了解浮点运算如何在计算机科学中工作宣言我了解计算机科学中的浮点运算，但不了解其背后的力学如果有人能给我一些关于浮点的子字段的定义，我将非常高兴您好，由于浮点运算的定义非常复杂，我将定义一些子区域，帮助您探索浮点运算的其他子区域定义舍入误差要将无限个实数压缩成有限个位，需要一个近似表示。尽管整数的数量是无限的，但在大多数程序中，整数计算的结果可以存储在32位中相比之下，对于固定数量的位，大多数实数计算会产生无法用那么多位精确表示的量。由于这个原因，浮点

您好，我目前正在试图了解浮点运算如何在计算机科学中工作

宣言我了解计算机科学中的浮点运算，但不了解其背后的力学
如果有人能给我一些关于浮点的子字段的定义，我将非常高兴您好，由于浮点运算的定义非常复杂，我将定义一些子区域，帮助您探索浮点运算的其他子区域

定义
舍入误差要将无限个实数压缩成有限个位，需要一个近似表示。尽管整数的数量是无限的，但在大多数程序中，整数计算的结果可以存储在32位中

相比之下，对于固定数量的位，大多数实数计算会产生无法用那么多位精确表示的量。由于这个原因，浮点计算的结果通常必须四舍五入以适应其有限表示形式。这种舍入误差是浮点计算的特征
相对误差与Ulps 由于舍入误差是浮点计算中固有的，因此有必要找到一种计算此误差的方法。例如，考虑浮点格式有“代码> B＝10 < /代码>和<代码> p＝3 < /COD>在本节中使用。

如果在无限精度计算中，浮点计算的结果是
3.12×10-2
，而答案是
0.0314
，则很明显，最后一位数字中有2个单位的误差。类似地，如果实数
.0314159
表示为
3.14×10-2
，则最后一位中的
.159
单位是错误的

一般来说，如果使用浮点数
d.d…d×e
表示
z
，则最后的
d.d…d-（z/e）p-1
单位是错误的。术语ulps用作
“最后一位的单位”
的缩写

如果计算结果是最接近正确结果的浮点数，则仍可能存在误差，误差最大可达
0.5 ulp
。测量浮点数与其近似实数之差的另一种方法是相对误差，即两个数之差除以实数。例如，用3.14×100近似
3.14159的相对误差为.00159/3.14159.0005 您好，由于浮点运算的定义非常复杂，我将定义一些子区域，帮助您探索浮点运算的其他子区域定义舍入误差要将无限个实数压缩成有限个位，需要一个近似表示。尽管整数的数量是无限的，但在大多数程序中，整数计算的结果可以存储在32位中相比之下，对于固定数量的位，大多数实数计算会产生无法用那么多位精确表示的量。由于这个原因，浮点计算的结果通常必须四舍五入以适应其有限表示形式。这种舍入误差是浮点计算的特征相对误差与Ulps 由于舍入误差是浮点计算中固有的，因此有必要找到一种计算此误差的方法。例如，考虑浮点格式有“代码> B＝10 < /代码>和<代码> p＝3 < /COD>在本节中使用。如果在无限精度计算中，浮点计算的结果是3.12×10-2 ，而答案是0.0314，则很明显，最后一位数字中有2个单位的误差。类似地，如果实数.0314159 表示为3.14×10-2 ，则最后一位中的.159 单位是错误的一般来说，如果使用浮点数d.d…d×e 表示z ，则最后的d.d…d-（z/e）p-1单位是错误的。术语ulps用作“最后一位的单位” 的缩写如果计算结果是最接近正确结果的浮点数，则仍可能存在误差，误差最大可达0.5 ulp。测量浮点数与其近似实数之差的另一种方法是相对误差，即两个数之差除以实数。例如，用3.14×100近似3.14159的相对误差为.00159/3.14159.0005 ，并有一些有趣的介绍。还有一些有趣的介绍。