浮点数

定点数的局限性：定点数可表示的数字范围有限，又不能无限制地增加数据的长度。

浮点数的表示

一个浮点数由阶码与尾数组成，阶码反映了数值大小，尾数反映了精度。

规格化浮点数：规定尾数的最高数值位必须是一个有效值，且阶码字段十进制值介于[1，254]

左归：尾数算数左移1位，阶码-1

右归：尾数出现溢出(双符号位为01或10)时，尾数算数右移1位，阶码+1

采用双符号位，当溢出发生时，可以挽救。更高的符号位是正确的符号位。

补码的算术左移，低位补0;补码算数右移，高位补1

移码：补码的基础上将符号位取反。只能用于表示整数

移码=真值+偏置值(8位移码的偏置值=128D=10000000B)，即2^n-1^

但偏置值可以取其他值，在IEEE 754标准中，阶码由移码表示，其偏置值取了2^n-1^-1

最小绝对值：尾数全0，阶码真值最小-126，对应移码机器数0000 0001，此时整体的真值为1.0x2^-126

最大绝对值：尾数全1，阶码真值最大值为127，对应移码机器数1111 1110 此时整体的真值为(1.1111…11)₂x2¹²⁷

以上皆基于单精度浮点数进行讨论，双精度浮点数同理

例如int与float类型转换，由于int类型4字节32位表示，float类型尾数部分只有23位表示，

故当int类型的数据无法用23位表示完全时会导致精度丢失

但double类型尾数部分有52位，所以int转换为double就可以精确表示

加减运算的步骤：

或者四舍五入

或者直接舍弃