当前位置:首页 > 公众号精选 > 嵌入式案例Show
[导读]使用过Keil MDK (Arm Compiler 6)编译器V6版本的读者应该发现了一个问题,V6版本速度比V5版本编译速度快很多。

使用过Keil MDK (Arm Compiler 6)编译器V6版本的读者应该发现了一个问题,V6版本速度比V5版本编译速度快很多。

(说明:是V6版本编译器,不是V6版本MDK)

那你发现了Arm Compiler V6和V5有什么区别吗? 集成在MDK中的优化选项又有哪些区别?

01

关于Arm Compiler 6

安装包

Arm Compiler 6(简称AC6)是用于Arm处理器的编译工具链,目前最新版本:Arm Compiler  V6.14。

用于编译Coterx-M处理器的编译器很多,Arm Compiler就是其中一个,常用于Keil MDK、 Arm Development Studio(DS-5)中,还可用作独立工具链安装。

当然,除了Arm Compiler,针对Coterx-M的编译器还有很多,比如:GNU Compiler、IAR Compiler、CCS Compiler等。

Arm Compiler 6工具链包括:

armclang:基于LLVM和Clang技术的编译器和集成汇编器。

armasm:armasm语法汇编代码的旧版汇编程序。将armclang集成汇编程序用于所有新的汇编文件。

armar:使ELF目标文件集可以一起收集。

armlink:将对象和库组合在一起以生成可执行文件的链接器。

fromelf:镜像转换程序和反汇编程序。

Arm C libraries:嵌入式系统的运行时支持库。

Arm C ++libraries:基于LLVM libc++项目的库。

使用过Keil MDK (Arm Compiler 6)编译器V6版本的读者应该发现了一个问题,V6版本速度比V5版本编译速度快很多。

更多参考内容和地址:

编译器Clang会代替GCC吗?
http://www2.keil.com/mdk5/compiler/6/
https://developer.arm.com/tools-and-software/embedded/arm-compiler/downloads/version-6

02

AC5和AC6

Arm Compiler 5(AC5)算是用的比较多的一代编译器,在Keil MDK V4版本及V5早期的版本都是使用AC5。

在2015年的时候,AC6发布了,并在随后新版本的MDK中集成了AC6,直到现在最新版本的MDK集成了AC6.13(可以修改版本):

AC6相比AC5优势

AC6相比之前版本的编译器做了很多改动,大家最为直观的感受就是编译速度提高了很多,还有代码大小。

当然除了速度和大小,还有其他很多优势,比如:支持C ++ 14标准、使用TrustZone for Armv8-M为设备创建安全和非安全代码、兼容基于GCC创建的源代码,也就是GCC可以编译的源码它也能编译。

这是官方提供的代码大小对比:

AC5升级到AC6

AC5和AC6是不同的编译器,兼容性方面还是有差异,需要迁移。这个迁移过程官方提供有文档:

https://developer.arm.com/docs/100068/0614/migrating-from-arm-compiler-5-to-arm-compiler-6

当然,也可以参看文章:

MDK-ARM编译器从V5升级到V6需要做哪些工作?

03

Keil MDK 优化选项

在Keil MDK中,相比AC5,使用AC6会增加几个优化选项:代码大小、速度、平衡等。

优化选项包含:

优化级别-O0

-O0禁用所有优化。此优化级别是默认设置。使用-O0 结果可以加快编译和构建时间,但比其他优化级别生成的代码要慢。与-O0其他优化级别相比,代码大小和堆栈使用率明显更高 。生成的代码与源代码紧密相关,但是生成的代码量更大,包括无用的代码。

优化级别-O1

-O1在编译器中启用核心优化。此优化级别提供了良好的调试体验,并具有比-O0更好的代码质量,堆栈使用率也提高了。Arm建议使用此选项以获得良好的调试体验。

-O1-O0相比,使用时的区别是:

  • 启用优化,这可能会降低调试信息的完整度。

  • 启用了内联和尾调用,这意味着回溯可能无法提供打开功能激活的堆栈。

  • 不会调用没有使用,或没有预期调用的函数,代码量更小。

  • 变量的值在不使用后可能在其范围内不可用。例如,它们的堆栈位置可能已被重用。

优化级别-O2

-O2-O1相比,有更高的性能优化。增加了一些新的优化,并更改了优化的启发式方法。这是编译器可能生成矢量指令的第一个优化级别。它还会降低调试体验。

-O2-O1相比使用时的差异是:

  • 编译器认为内联调用站点可获利的阈值可能会增加。

  • 执行的循环展开数量可能会增加。

  • 可以为简单循环和独立标量运算的相关序列生成矢量指令。

可以使用armclang命令行选项禁止创建矢量指令-fno-vectorize。

优化级别-O3

-O3-O2相比,有更高的性能优化。此优化级别允许进行需要大量编译时分析和资源的优化,并且与-O2相比更改了优化的启发式方法。-O3指示编译器针对生成的代码的性能进行优化,而忽略生成的代码的大小,这可能会导致代码大小增加。

-O3-O2相比使用时的差异是:

  • 编译器认为内联调用站点是有利可图的阈值增加。

  • 执行的循环展开量增加。

  • 在编译器管道中启用更积极的指令优化。

优化级别-Os

-Os目的是在不显着增加代码大小的情况下提供高性能。根据你的应用程序,提供的性能可能类似于-O2-O3

-Os-O3相比,可减少代码大小。但会降低调试体验。

-Os-O3相比使用时的差异是:

  • 降低编译器认为内联调用站点可获利的阈值。

  • 显着降低了执行的循环展开量。

优化级别-Oz

-Oz目的是提供尽可能小的代码量。Arm 建议使用此选项以获得最佳代码大小。此优化级别会降低调试体验。

-Oz-Os相比使用时的差异是:

  • 编译器仅针对代码大小进行优化,而忽略性能优化,这可能会导致代码变慢。

  • 未禁用功能内联。在某些情况下,内联可能会整体上减少代码大小,例如,如果一个函数仅被调用一次。仅当预期代码大小会减小时,才将内联启发式方法调整为内联式。

  • 禁用可能会增加代码大小的优化,例如循环展开和循环矢量化。

  • 循环是作为while循环而不是do-while循环生成的。

优化级别-Ofast

-Ofast从级别执行优化,包括使用-ffast-math armclang选项执行的优化。

该级别还执行其他进一步的优化,可能会违反严格遵守语言标准的要求。

-O3相比,该级别会降低调试体验,并可能导致代码大小增加。

优化级别-Omax

-Omax是最大程度的优化,并专门针对性能优化。它支持从级别进行的所有优化,以及链接时间优化(LTO)。

在此优化级别上,Arm Compiler可能会违反严格遵守语言标准的规定。使用此优化级别可获得最快的性能。

-Ofast相比,该级别会降低调试体验,并可能导致代码大小增加。

如果你使用-Omax进行编译,并具有单独的编译和链接步骤,你还必须在armlink命令行中包括-Omax

以上是关于编译器的相关内容和比较,希望对大家有帮助。更多关于Keil的内容,可以在后台回复“Keil系列教程”。



免责声明:本文内容由21ic获得授权后发布,版权归原作者所有,本平台仅提供信息存储服务。文章仅代表作者个人观点,不代表本平台立场,如有问题,请联系我们,谢谢!

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

电路分析计算是电子科技领域中的一项重要技术,它涉及电流、电压、功率等物理量的分析和计算,为电路的设计、优化和故障排除提供了理论支持。本文将详细介绍电路分析计算的基本概念、常用方法以及科技应用,帮助读者更深入地了解这一领域...

关键字: 电路分析 支路电流法

业内消息,近日Alphabet旗下谷歌公司发言人表示为控制成本正在进行最新裁员,但具体人数不详。该发言人表示,裁员并非全公司范围,受影响的员工将能够申请内部职位,但没有具体说明受影响的员工人数或涉及的团队。

关键字: 谷歌 裁员

几天前,以南印度组织零售商协会(ORA)为代表的20多家零售连锁店和4300家商店宣布将从5月1日起停止销售一加设备。4月17日,全印度移动零售商协会(AIMRA)代表印度15万多家线下智能手机零售商通知一加,其成员正在...

关键字: 印度 一加 小米 Poco

业内消息,近日光刻机制造商阿斯麦(ASML)公布了2024年第一季度业绩,财报显示,该公司当季总净销售额53亿欧元,环比下降27%;毛利率51.0%,上季度为51.4%;净利润12亿欧元(当前约92.4亿元人民币),环比...

关键字: 光刻机 ASML

近日有韩媒称,由于薪资谈判破裂,劳资双方未能缩小对涨薪的意见分歧,三星电子全国工会(NSEU)即日起将发起公司成立以来首次集体行动,工会当天在华城市(Hwaseong)京畿道华城园区的组件研究大楼(DSR)前举行文化活动...

关键字: 三星

昨天上午,华为终端官微宣布全新重磅新机开售,约一分钟线上即告售罄,线下门店排起长队,气势丝毫不输苹果,和 Mate 60 Pro 一样没有发布会,这次官方同样推出了 “HUAWEI Pura 70 系列 先锋计划”,可以...

关键字: 麒麟芯片 华为

针对光伏优化器(MPPT)的非隔离DC-DC升压电路,推荐瑞森半导体低压MOS-SGT系列。极低导通电阻,低损耗,高雪崩耐量,高效率,非常适合高频应用。

关键字: 光伏优化器 MPPT

业内消息,近日东芝正在计划在日本裁员5000名员工,相当于日本员工总数的7%左右,这是其加速重组的最新举措。据知情人士透露,裁员的主要对象是总部的后勤部门,同时该公司将寻求员工自愿退休。

关键字: 裁员 东芝

昨天海能达发布公告,称针对产品禁售等判令提起的上诉结果已出:法院决定暂停执行一审法院对公司颁布的产品禁售令及罚款等,公司将与全球合作伙伴紧密合作,即刻恢复正常的商业活动并启动相关产品的销售。

关键字: 禁售令 海能达

业内消息,华为Pura 70第一批现货已到总代,部分经销商也已完成打款,等待华为打响开售“发令枪”。

关键字: 华为Pura 70 华为
关闭
关闭