当前位置:首页 > 公众号精选 > C语言与CPP编程
[导读]我们在学习C语言时,通常认为浮点数和小数是等价的,并没有严格区分它们的概念,这也并没有影响到我们的学习,原因就是浮点数和小数是绑定在一起的,只有小数才使用浮点格式来存储。其实,整数和小数可以都使用定点格式来存储,也可以都使用浮点格式来存储,但实际情况却是,C语言使用定点格式存储整数,使用浮点格式存储小数,这是在 “数值范围” 和 “数值精度” 两项重要指标之间追求平衡的结果。



1 前言

我们在学习 C 语言时,通常认为浮点数和小数是等价的,并没有严格区分它们的概念,这也并没有影响到我们的学习,原因就是浮点数和小数是绑定在一起的,只有小数才使用浮点格式来存储。

其实,整数和小数可以都使用定点格式来存储,也可以都使用浮点格式来存储,但实际情况却是,C 语言使用定点格式存储整数,使用浮点格式存储小数,这是在 “数值范围” 和 “数值精度” 两项重要指标之间追求平衡的结果。

2 什么是浮点数?

浮点型简单讲就是实数的意思。浮点数在计算机中用以近似表示任意某个实数。具体的说,这个实数由一个整数或定点数(即尾数)乘以某个基数(计算机中通常是 2)的整数次幂得到,这种表示方法类似于基数为 10 的科学记数法。

3 浮点数在内存中的存储

首先明确一点,无论是整型、浮点型还是字符等等数据类型在计算机底层都是以二进制的方式存储的。

浮点数在内存中的存储和整数不同,因为整数都可以转换为一一对应的二进制数据。而浮点数的存储是由符号位 (sign) + 指数位 (exponent) + 小数位 (fraction) 组成。

类型 符号位 指数 尾数
Float 1位(第31位) 8位(第23~30位) 23位(第0~22位)
Double 1位(第63位) 11位(第52~62位) 52位(第0~51位)

int 和 float 同样占据四个字节的内存,但是 float 所能表示的最大值比 int 大得多,其根本原因是浮点数在内存中是以指数的方式存储

浮点数转换到内存中存储的步骤分为如下三步:

  • 将浮点数转换成二进制
  • 用科学计数法表示二进制浮点数
  • 计算指数偏移后的值

对于第3点:计算指数时需要加上偏移量(后面有介绍为什么使用偏移量),而偏移量的值与浮点数的类型有关( float 偏移量值为 127 ,double 偏移量值为 1023)。比方对于指数 6,float 与 double 类型偏移后的值分别为:

  • float : 127 + 6 = 133
  • double:1023 + 6 = 1029

4 实例

浮点数19.625用float是如何存储的:

  • 将浮点数转换成二进制:10011.101(将 19.625 整数部分采用除 2 取余,小数部分采用乘 2 取整法);
  • 用科学计数法表示二进制浮点数: 1.0011101*2^4
  • 计算指数偏移后的值:127 + 4 = 131  (10000011);
  • 拼接综上所述,float 类型的 19.625 在内存中的值为:0 - 10000011 - 001 1101 0000 0000 0000 0000。

5 float与double范围和精度

范围

floatdouble的范围是由指数的位数来决定的。(因为表示的时候都是1.x * 2^Y的形式,所以忽略了1.x的效果,直接取指数表示浮点数的范围)

  • float:

1bit(符号位) 8bits(指数位) 23bits(尾数位)

  • double:

1bit(符号位) 11bits(指数位) 52bits(尾数位)

于是,float的指数范围为-127~+128,而double的指数范围为-1023~+1024,并且指数位是按补码的形式来划分的。

其中负指数决定了浮点数所能表达的绝对值最小的非零数;而正指数决定了浮点数所能表达的绝对值最大的数,也即决定了浮点数的取值范围。

float的范围为-2^128 ~ +2^128,也即-3.40E+38 ~ +3.40E+38

double的范围为-2^1024 ~ +2^1024,也即-1.79E+308 ~ +1.79E+308

精度

floatdouble的精度是由尾数的位数来决定的,尾数越多能表示的小数点后面有效数字就越多,因此精度就越高。浮点数在内存中是按科学计数法来存储的,其整数部分始终是一个隐含着的“1”,由于它是不变的,故不能对精度造成影响。

float:2^23 = 8388608,一共七位,这意味着最多能有 7 位有效数字,但绝对能保证的为 6 位,也即float的精度为 6~7 位有效数字;

double:2^52 = 4503599627370496,一共 16 位,同理,double的精度为 15~16 位。

6 解剖:为什么要用偏移量的方式来计算指数?

如果不采用偏移量的方式:

8 位 2 进制数表示的有符号数范围有两个区间:0000 0000~0111 11111000 0000~1111 1111,分别为0~+127-127~0

大家看到这里的问题了吧,有两个 0 ,一个正 0 和一个负 0。

如果采用偏移量的方式:

127 转化为二进制是:0111 1111

那么

  • 当我们要表示 -127,则有 127-1270111 1111 - 0111 1111 = 0000 0000
  • 当我们要表示 -126,则有 127-1260111 1111 - 0111 1110 = 0000 0001
  • 当我们要表示 -2,则有 127-20111 1111 - 0000 0010 = 0111 1101
  • 当我们要表示 -1,则有 127-10111 1111 - 0000 0001 = 0111 1110
  • 当我们要表示 0,则有 0+1270000 0000 + 0111 1111 = 0111 1111
  • 当我们要表示 1,则有 1+1270000 0001 + 0111 1111 = 1000 0000
  • 当我们要表示 2,则有 1+1270000 0010 + 0111 1111 = 1000 0001

当我们要表示128,则有128+127即1000 0000 + 0111 1111 = 1111 1111

由上面的例子,我们可以得出规律,采用移位存储技术,我们可以使用 8 位二进制来表示从-127~+128共计 127 个负数+零(0)+ 128 个正数总共 256 个数,看来使用移位存储既没有 +0 和 -0 的问题,又能充分使用新生成的8位二进制数最大限度的表示单精度浮点数的幂指数,是非常合理的。

欢迎小伙伴们四连走起:点赞、在看、留言、分享。你的四连是我更文的动力。

免责声明:本文内容由21ic获得授权后发布,版权归原作者所有,本平台仅提供信息存储服务。文章仅代表作者个人观点,不代表本平台立场,如有问题,请联系我们,谢谢!

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

空中下载技术(Over-the-Air Technology, OTA)是通过移动通信的空中接口实现对移动终端设备及SIM卡数据进行远程管理的技术。本文采用了swupdate的方式进行ota升级,swupdate是一个基...

关键字: 核心板 嵌入式 Linux平台

新增 IEEE®1588 标准配置文件,满足电源和 5G专用网络同步要求

关键字: 嵌入式 5G 电源

加利福尼亚州圣克拉拉市—2024年4月30日―AMD(NASDAQ: AMD)今日公布2024年第一季度营业额达55亿美元,毛利率为47%,经营收入3600万美元,净收入1.23亿美元,摊薄后每股收益为0.07美元。基于...

关键字: 嵌入式 PC 人工智能

这款全新的中端MCU系列为设计人员提供了更高水平的安全性和灵活性

关键字: 嵌入式 单片机

2024年4月11日,中国——意法半导体的ST25R100近距离通信(NFC)读取器芯片独步业界,集先进的技术功能、稳定可靠的通信连接和低廉的成本价格于一身,在大规模制造的消费电子和工控设备内,可以提高非接触式互动功能的...

关键字: 嵌入式 数据读取器 芯片

单片机是一种嵌入式系统,它是一块集成电路芯片,内部包含了处理器、存储器和输入输出接口等功能。

关键字: 单片机 编写程序 嵌入式

深圳2024年4月23日 /美通社/ -- 全球AI解决方案与工业级存储领导品牌宜鼎国际 (Innodisk)持续深化边缘AI布局,今(23)日发表全球首创"MIPI over Type-C"独家技术,让旗下嵌入式相机模...

关键字: AI 嵌入式 相机

为增进大家对嵌入式主板的认识,本文将对嵌入式主板以及嵌入式主板常见问题及其解决方法予以介绍。

关键字: 嵌入式 指数 主板

为增进大家对嵌入式系统的认识,本文将对嵌入式系统、嵌入式系统的特点予以介绍。

关键字: 嵌入式 指数 嵌入式系统

为增进大家对嵌入式的认识,本文将对嵌入式、嵌入式工作相关的内容予以介绍。

关键字: 嵌入式 指数 嵌入式技术
关闭
关闭