首页 > 应用 > 智能硬件
[导读]对于c编译器,想必大家也有所了解,3款主流c编译器也是活跃在不同人群的PC上。网络上很多文章都止步于对c编译器的介绍,并未探索c编译器更加深层次的内容。而在本文中,将涉及c编译器的高级部分——c编译器及其优化。所以,本文的讲解需要大家具备一定的c编译器基础,以及一定的c语言代码编写能力。

对于c编译器,想必大家也有所了解,3款主流c编译器也是活跃在不同人群的PC上。网络上很多文章都止步于对c编译器的介绍,并未探索c编译器更加深层次的内容。而在本文中,将涉及c编译器的高级部分——c编译器及其优化。所以,本文的讲解需要大家具备一定的c编译器基础,以及一定的c语言代码编写能力。

此外,本文的内容的开发环境基于ARM处理器,相关技术同样可在RISC处理器上实现,所以同样需要读者具备最基础的处理器知识。

1.jpg

本文主要讲解C编译器在代码优化时遇到的一些问题。要编写高效的C语言源代码,必须了解C编译器对什么形式的代码有所改动,编译器涉及的处理器结构的限制,以及一些特殊的C编译器的限制。

1.为编译器选择处理器结构

在编译C源文件时,必须为编译器指定正确的处理器类型。这样可以使编译的代码最大限度地利用处理器的硬件结构,如对半字加载(Halfword Load)、存储指令(Store InstrucTIons)和指令调度(InstrucTIon Scheduling)的支持。所以编译程序时,应该尽量准确地告诉编译器该代码是运行在什么类型的处理器上。有些处理器类型编译器是不能直接支持,如SA-1100,这时可以使用与该类型处理器为同一指令集的基本处理器,比如对于SA-100,可以使用StrongARM。

注意指定目标处理器可能使代码与其他ARM处理器不兼容。例如,编译时指定了ARMv6体系结构的代码,可能不能运行在ARM920T的处理器上(如果代码中使用了ARMv6体系结构中特有的指令)。

选择处理器类型可以使用--cpu name编译选项。该选项生成用于特定ARM处理器或体系结构的代码。

如果name是处理器名称。

· 输入名称必须和ARM数据表中所示严格一致,例如ARM7TDMI。该选项不接受通配符字符。有效值是任何 ARM6 或更高版本的 ARM 处理器。

· 选择处理器操作会选择适当的体系结构、浮点单元 (FPU)以及存储结构。

· 某些--cpu选择暗含--fpu选择。例如,当使用--arm选项编译时,--cpu ARM1136JF-S暗含--fpu vfpv2。隐式FPU只覆盖命令行上出现在--cpu选项前面的显式--fpu选项。如果没有指定--fpu选项和--cpu选项,则使用--fpu softvfp。

2.调试选项

如果在编译C源程序时,设置了调试选项,这将很大程度地影响最终代码的大小和执行效率。因为带调试信息的代码映像,为了能够在调试程序时正确地显示变量或设置断点,包含很多冗余的代码和数据。所以如果想最大限度地提供程序执行效率、减少代码尺寸,就要在编译源文件时,去除编译器的调试选项。

以下选项指定调试表生成方法。

· -g (--debug):该选项启用生成当前编译的调试表。无论是否使用-g选项,编译器都生成的代码是相同的。惟一差别是调试表的存在与否。编译器是否对代码进行优化是由-O选项指定调的。默认情况下,使用-g选项等价于使用:-g -dwarf2 --debug_macros。

注意编译程序时,只使用-g选项而没有使用优化选项,编译器会提示警告信息。

· --no_debug:该选项禁止生成当前编译的调试表。这是默认选项。

· --no_debug_macros:当与-g一起使用时,该选项禁止生成预处理程序宏定义的调试表条目(Entry)。这会减小调试映像的大小。-gt-p是-gtp的同义字。

--debug_macros 当与 -g 一起使用时,该选项启用生成预处理程序宏定义的调试表条目。这是默认选项,会增加调试映像的大小。一些调试程序忽略预处理程序条目。

3.优化选项

使用-Onum选择编译器的优化级别。优化级别分别为。

· -O0:除一些简单的代码编号之外,关闭所有优化。使用该编译选项可以提供最直接的优化信息。

· -O1:关闭严重影响调试效果的优化功能。使用该编译选项,编译器会移除程序中未使用到的内联函数和静态函数。如果与 --debug 一起使用,该选项可以在较好的代码密度下,给出最佳调试视图。

· -O2:生成充分优化代码。如果与 --debug 一起使用,调试效果可能不令人满意,因为目标代码到源代码的映射可能因为代码优化而发生变化。

如果不生成调试表,这是默认优化级别。

· -O3:最高优化级别。使用该优化级别,使生成的代码在时间和空间上寻求平衡。该选项常和-Ospace和-OTIme配合使用。

· -O3 –OTIme:使用该选项编译的代码比-O2 –Otime选项编译的代码,在执行速度上要快,但占用的空间也更大。

· -O3 -Ospace:产生的代码比使用-O2 -Ospace选项产生的代码尺寸小,但执行效率可能会差。

如果要使编译的代码更侧重于代码的尺寸或执行效率(两者往往不可兼得),可以使用下面的编译选项。

· -Ospace:指示编译程序执行优化,以延长执行时间为代价减小映像大小。例如,由外部函数调用代替内联函数。如果代码大小比性能更重要,则使用该选项。这是编译器的默认设置。

· -Otime:指示编译程序执行优化,以增大映像大小为代价缩短执行时间。如果执行时间比代码大小更重要,则使用该选项。例如,它编译:

while (expression) body;

为:

if (expression) {

do body;

while (expression);

}

如果既不指定-Otime也不指定-Ospace,则编译器默认使用-Ospace。可使用-Otime编译代码中对时间要求严格的部分,使用-Ospace编译其余部分。但不能在同一编译程序调用中同时指定-Otime和-Ospace。

4.AAPCS选项

ARM结构过程调用标准AAPCS(Procedure Call Standard for the ARM Architecture)是ARM体系结构二进制接口ABI(Application Binary Interface for the ARM Architecture【BSABI】)标准的一部分。使用该标准可以很方便的执行C和汇编语言的相互调用。

编译程序时,使用--apcs选项可以指定所使用得AAPCS标准的版本。如果没有指定--apcs或--cpu选项,则编译器使用下面默认编译选项。

--apcs /noswst/nointer/noropi/norwpi --cpu ARM7TDMI --fpu softvfp

有关AAPCS的详细信息,请参加ARM相关文档。

5.编译选项对代码生成影响示例

本节举例说明编译器的优化选项如何影响代码生成。

(1)使用-O0选项

下面的例子显示了即使使用-O0编译选项对代码进行编译时,有些冗余代码还是会被编译器自动清除。

int f(int *p)

{

return (*p = = *p);

}

使用armcc -c -O0对源程序进行编译,生成的汇编代码如下所示。

f

MOV r1, r0

MOV r0, #1

MOV pc, lr

通过上面的例子可以看到,编译出的最终代码中没有加载(Load)指针P的值,变量*p被编译器优化掉了。如果不想让编译器对变量*p做优化,可以使用“volatile”对变量进行声明。下面的例子,显示了将变量声明为“volatile”类型后,使用armcc编译(-O2的优化级别)后的结果。

f

LDR r1,[r0]

LDR r0,[r0]

CMP r1,r0

MOVNE r0,#0

MOVEQ r0,#1

MOV pc,lr

另外,编译的代码中的“MOV r1, r0”并没有实际意义,只是为了方便调试程序时设置断点使用。

(2)冗余代码的清除

下面例子显示了一段急待优化的代码。

int dummy()

{

int a=10, b=20;

int c;

c=a+b;

return 0;

}

当使用arm –c –O0进行编译时,产生的汇编码如下所示。

dummy:

0000807C E3A0100A MOV r1,#0xa

》》》 REDUNDANT\#3 int a=10,b=20;

00008080 E3A02014 MOV r2,#0x14

》》》 REDUNDANT\#5 c=a+b;

00008084 E0813002 ADD r3,r1,r2

》》》 REDUNDANT\#6 return 0;

00008088 E3A00000 MOV r0,#0

》》》 REDUNDANT\#7 }

0000808C E12FFF1E BX r14

从上面的汇编输出可以看到,编译器并没有对程序中的冗余变量做任何工作。但上面这段代码在编译时,编译器会给出警告,警告信息如下所示。

Warning : #550-D: variable “c” was set but never used

Redundant.c line 4 int c;

但如果将编译器的优化级别提高,如使用arm –c –O1命令,则编译器输出的汇编代码如下所示。

dummy:

0000807C E3A00000 MOV r0,#0

》》》 REDUNDANT\#7 }

00008080 E12FFF1E BX r14

从上面的例子看出,当优化级别提高到-O1时,程序中的冗余变量就会被清除。

2.jpg

(3)指令重排

当指定编译器对程序代码进行优化时,编译器会对程序中排列不合理的汇编指令序列进行重排(只有在-O1及其以上的优化级别中才有),重排的目的是为了减少指令互锁(interload)。所谓互锁就是指如果一条指令需要前一条指令的执行结果,而这时结果还没有出来,那么处理器就会等待。这被称为流水线冒险(pipeline hazard),也被称为流水线互锁。

下面例子显示了对同一程序使用代码重排和不使用代码重排所产生的汇编码的区别。÷

程序的源代码如下所示。

int f(int *p, int x)

{ return *p + x * 3; }

使用-O0选项对代码进行编译(无代码重排),产生的结果如下所示。

ADD r1,r1,r1,LSL #1

LDR r0,[r0,#0]

ADD r0,r0,r1 ; ARM9上产生互锁

MOV pc,lr

使用-O1选项对代码进行编译(存在代码重排),产生的结果如下所示。

ADD r1,r1,r1,LSL #1

ADD r0,r0,r1

MOV pc,lr

指令重排发生在寄存器定位和代码产生阶段。代码重排只对ARM9及其以后的处理器版本产生作用。当使用代码重排时,代码的执行速度平均提供4%。可以使用-zpno_optimize_

scheduling编译选项关闭代码重排。

(4)内嵌函数

通常情况下,如果不指定编译选项,编译器会将一些代码量小且调用次数少的函数内嵌进调用函数中。如果某段子程序在其他模块中没有被调用,请使用Static关键字将其标识。

编译选项的--autoinline和--no_autoinline可以作为内嵌函数的使能开关。--no_autoinline选项为-O0和-O1选项的默认选项,但如果指定-O2或-O3的优化选项,编译器将默认使用--autoinline选项。

有关内嵌函数的详细信息,请参见本书内嵌函数一节。

下面的例子显示了同一段程序,使用内嵌功能和不使用内嵌功能编译出的不同结果。

要编译的源文件如下。

int bar(int a)

{

a=a+5;

return a;

}

int foo(int i)

{

i=bar(i);

i=i-2;

i=bar(i);

i++;

return i;

}

下面的汇编程序为不使用内嵌功能时编译出的结果。

bar

ADD r0,r0,#5

MOV pc,lr

foo

STR lr,[sp,#-4]!

BL bar

SUB r0,r0,#2

BL bar

ADD r0,r0,#1

LDR pc,[sp],#4

下面的汇编码是使用内嵌功能时编译出的结果。

foo

ADD r0,r0,#5

SUB r0,r0,#2

ADD r0,r0,#5

ADD r0,r0,#1

MOV pc,lr

从上面的例子可以看出在使用内嵌功能时,函数间的相互调用减少了数据的压栈和出栈,节省了程序的执行时间,但如果内嵌函数被调用多次会造成空间的浪费。

以上内容便是小编此次带来的与c编译器相关的所有内容,如果你对本文比较满意,不妨在后期持续关注本网站的相关文章哦。

换一批

延伸阅读

[嵌入式] 芯片设计实战篇,射频识别芯片设计的实现与优化

芯片设计实战篇,射频识别芯片设计的实现与优化

芯片设计是每个国家的发展重点之一,而壮大中国芯片设计行业将有利于降低我国对国外芯片的依赖程度。再往期文章中,小编曾对芯片设计的正反向流程、芯片设计前景等内容进行过相关介绍。本文中,小编将为大家介绍带来芯片设计实战篇——射频识别芯片设计中的时......

关键字:芯片设计 射频识别芯片 优化

[通信技术] 浙江移动完成首例基于华为鲲鹏处理器的CRM及BOSS系统大规模商用

浙江移动完成首例基于华为鲲鹏处理器的CRM及BOSS系统大规模商用

本次商用过程中,浙江移动将自研的大中台架构和华为TaiShan服务器成功融合,新构建出鲲鹏容器云平面,基于鲲鹏处理器和通用CPU的双平面容器云承载全部CRM中心和BOSS解码模块服务,实现业务流量在两个平面间均衡负载,充分保障业务安全。......

关键字:IT CT 鲲鹏处理器

[单片机应用] IAR单片机编程软件高级篇,IAR单片机编程软件编译优化过程

IAR单片机编程软件高级篇,IAR单片机编程软件编译优化过程

单片机编程软件是单片机开发不可缺少的工具之一,目前市场流通的单片机编程软件主要为IAR单片机编程软件和KEIL单片机编程软件。本文中,将为大家讲解IAR单片机编程软件编译优化问题,一起来了解下吧。......

关键字:IAR 单片机编程软件 编译优化

[智能硬件] c编译器前篇,不一样的gcc c编译器介绍

c编译器前篇,不一样的gcc c编译器介绍

c编译器是c程序成功运行的必要组件之一,c编译器的用处在于对c程序予以编译,以便电脑解读。那么哪款c编译器是市场宠儿呢?小编个人偏向gcc c编译器。在本文中,你可从多个方面了解gcc c编译器。阅读完本文,如果你爱上了这款c编译器,不妨尝......

关键字:c编译器 gcc 执行过程

[智能硬件] Gcc c编译器很难?击破gcc c编译器参数

Gcc c编译器很难?击破gcc c编译器参数

c编译器是解析c程序不可缺少的部件之一,针对linux系统而言,gcc c编译器无疑是热度最高的c编译器之一。对于gcc c编译器,很多朋友反馈其操作存在一定难度。为帮助大家更加流畅使用gcc c编译器,本文特对gcc c编译器各大参数予以......

关键字:c编译器 linux 参数

[智能硬件] c编译器起步,搞定linux安装gcc c编译器过程

c编译器起步,搞定linux安装gcc c编译器过程

c编译器和c编辑器是大家经常混淆的两大概念,事实上c编译器、c编辑器二者存在极大区别。目前,c编译器存在3大主流分支,gcc便是其中之一。本文中,将讲解gcc c编译器在linux系统的安装过程,为大家后期使用c编译器夯实基础。......

关键字:c编译器 gcc linux

[半导体] 总被网友喷,龙芯到底出货了多少产品?

总被网友喷,龙芯到底出货了多少产品?

前两天龙芯处理器又上了头条了,在某篇与龙芯不相关的新闻中被网友喷,惹得中科院官方微博也无奈了。对于龙芯,许多喷子的观点就是这款处理器吹了这么久,什么时候商用了?这种“我没见过=没有”的逻辑当然......

关键字:龙芯 芯片 处理器

[半导体] 劲爆 !高通骁龙735曝光:台积电7nm工艺制造+5G基带集成

劲爆 !高通骁龙735曝光:台积电7nm工艺制造+5G基带集成

高通在今年4月发布了骁龙730和730G处理器,10月26日,其下一代的产品被曝光命名为骁龙735,最大的提升为采用台积电7nm工艺制造。......

关键字:高通 高通处理器 骁龙735

[智能硬件] AMD携手Redmi推出RedmiBook14锐龙版高性能金属轻薄本

AMD携手Redmi推出RedmiBook14锐龙版高性能金属轻薄本

RedmiBook14锐龙版高性能金属轻薄本,除了充分释放的强劲性能,极致的性价比,高颜值的外观设计等特性,还将首次支持小米互传,实现小米笔记本与小米手机之间不限文件格式和大小的互传创新使用体验。......

关键字:处理器 电子产品

[通信技术] 华为鲲鹏920处理器获第六届世界互联网大会领先科技成果奖

华为鲲鹏920处理器获第六届世界互联网大会领先科技成果奖

这是继华为麒麟960、昇腾310 AI处理器获奖之后,华为再一次捧得领先科技成果奖奖杯。......

关键字:芯片 处理器

[测试测量] RedmiBook 14锐龙版处理器性能测评

RedmiBook 14锐龙版处理器性能测评

在“智能硬件”栏目里,小编对RedmiBook 14锐龙版从硬件方面进行过详细介绍,想必大家对这款笔记本也有了一定的了解。此次,小编将对它的处理器性能加以测评,一起来了解下吧。......

关键字:RedmiBook 14锐龙版 处理器性能 RedmiBook

[半导体] 突破!我国科研人员基于国产“凌久芯”成功研发5款显卡

突破!我国科研人员基于国产“凌久芯”成功研发5款显卡

这五款显卡支持主流国产处理器和国产操作系统,可以满足国产电子平台对2D/3D图形显示与处理的需求,能够适应各种恶劣环境。......

关键字:芯片 显卡 处理器

[智能硬件] 中兴再现江湖——Blade A7s

中兴再现江湖——Blade A7s

这篇文章中,小编将为大家介绍一款中兴旗下手机——Blade A7s,一起来看看吧。......

关键字:Blade A7s 中兴 处理器

[智能硬件] realme X2 Pro,海神+月神

realme X2 Pro,海神+月神

这篇文章中,小编将为大家介绍一款realme旗下最新款手机——realme X2 Pro。它的具体情况如何呢?一起来看看吧。......

关键字:realme X2 Pro realme 骁龙855 Plus处理器

[传感器] 小米CC9 Pro将搭载1亿像素传感器本月发布?

小米CC9 Pro将搭载1亿像素传感器本月发布?

有分析显示,小米CC9 Pro有望成为搭载1.08亿像素传感器的小米新机,该机将于10月24日发布,配备骁龙730G处理器。现阶段,上述消息仅为爆料,尚不能代表官方意志,在没有明确消息之前,仅做参考。......

关键字:像素传感器 小米 730G处理器

我 要 评 论

网友评论

技术子站

更多

项目外包

更多

推荐博客