当前位置:首页 > 嵌入式 > 嵌入式教程
[导读]循环体是程序设计与优化的重点考虑对象。本节将着重讲解在ARM上处理for和while循环最有效的方法。

14.5C循环结构

循环体是程序设计与优化的重点考虑对象。本节将着重讲解在ARM上处理for和while循环最有效的方法。

14.5.1循环中止

首先来看下面的例子,两个不同的循环退出条件,产生的不同汇编代码。

C源程序如下所示。

intfact1(intn)

{

inti,fact=1;

for(i=1;i<=n;i++)

fact*=i;

return(fact);

}

intfact2(intn)

{

inti,fact=1;

for(i=n;i!=0;i--)

fact*=i;

return(fact);

}

产生的汇编代码如下所示。

fact1

MOVa3,#1

MOVa2,#1

CMPa1,#1

BLT|L000020.J5.fact1|

|L000010.J4.fact1|

MULa3,a2,a3

ADDa2,a2,#1

CMPa2,a1

BLE|L000010.J4.fact1|

|L000020.J5.fact1|

MOVa1,a3

MOVpc,lr

fact2

MOVSa2,a1

MOVa1,#1

MOVEQpc,lr

|L000034.J4.fact2|

MULa1,a2,a1

SUBSa2,a2,#1

BNE|L000034.J4.fact2|

MOVpc,lr

从产生的汇编代码中,可以看出两个函数虽然实现的功能相同,但产生的代码效率却不尽相同。这里的关键是,循环的中止条件应为计数减到零(countdowntozero),而不是计数增加到某个值。由于减计数结果已存储在条件标志里,与零比较的指令就可以省略。同时也可以少用一个寄存器来存储循环中止值。

注意

上面的例子使用了-O2–Otime的编译选项,如果使用-Ospace选项,编译结果会有不同。

对循环计数值i来说,如果i是无符号的,则循环继续的条件既可以是i!=0,也可以是i>0。由于i不可能是负数,所以这两个条件是等价的。而对一个有符号的循环计数值来说,最好不要用条件i>0作为循环继续执行的条件。如果使用i>0作为循环继续执行的条件,编译器将生成下面的代码。

SUBa2,a2,#1

CMPr1,#0

BGT|L000034.J4.fact2|

这时,编译器多增加了一条CMP指令,主要是为了防止有符号数i=−0x8000000。总之,无论对于有符号还是无符号的循环计数值,都应该使用i!=0作为循环的结束条件。对于有符号数i,这比使用i>0少了一条指令。

14.5.2循环展开

在14.5.1节中可以发现,每次循环需要在循环体外加两条指令:一条减法指令来减少循环计数值和一条条件分支指令。通常这些指令称为循环开销(LoopOverhead)。在ARM7或ARM9处理器上,加法指令需要1个周期,条件分支指令需要3个周期,这样每个循环就需要4个周期的开销。

可以通过展开循环体(LoopUnrolling),即重复循环主体多次,同时按同样的比例减少循环次数来降低循环开销。

下面的例子通过将循环体展开4次,来达到减少循环开销的目的。

intcountbit1(uintn)

{intbits=0;

while(n!=0)

{

if(n&1)bits++;

n>>=1;

}

returnbits;

}

将循环主体展开。

intcountbit2(uintn)

{intbits=0;

while(n!=0)

{

if(n&1)bits++;

if(n&2)bits++;

if(n&4)bits++;

if(n&8)bits++;

n>>=4;

}

returnbits;

}

这里减少了4N的循环开销(N=4,即循环体执行的次数)。如果循环体中存在耗时的Store/Load指令,则代码执行效率的提高将更明显。

ARM编译器不会自动将循环体展开,只有用户自己判断何时将循环体展开,到底应该展开多少次,如果循环的次数不是循环展开的倍数该怎么办?下面就将详细讨论,用户编写自己的循环展开程序时,需要注意的问题。

①只有当循环展开对提高应用程序的整体性能非常重要时,才进行循环展开;否则反而会增加代码尺寸。

②应设法使循环的次数是循环展开的倍数。如果难以实现,那么就要增加额外的代码来处理数组的剩余元素。这将增加少许代码量,但可以保持较好的性能。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

Arm CPU正在从根本上推动AI变革,并造福地球。Arm架构是未来AI计算的基石。​

关键字: ARM AI

近日,Arm推出了Arm® Ethos™-U85神经网络处理器(NPU)和Arm Corstone™-320物联网参考设计平台,旨在满足海量的数据处理和大规模计算,加速推进边缘AI的发展进程。

关键字: ARM

为了赶超云计算市场上的竞争对手,谷歌正试图通过定制的Arm服务器芯片降低云计算服务成本。

关键字: 谷歌 ARM 定制芯片

嵌入式开发作为一个融合了计算机软硬件和系统工程的综合性领域,其成功与否往往取决于三个核心要素的有效整合与协调。这三个要素分别是:硬件平台的选择与设计、软件开发及其优化、以及系统级的设计与集成。深入理解并熟练掌握这三个方面...

关键字: 嵌入式开发 ARM

随着汽车软件数量爆发式的增长,整个行业都需要重新思考汽车产品的开发流程。为此,Arm推出了丰富的硬件IP、新的系统IP,以及全新的汽车计算与计算子系统产品路线图,旨在为各种汽车应用实现性能、功能安全、可扩展等方面的支持。

关键字: ARM 汽车电子

知名移动芯片设计公司ARM最近迈出重要一步,它正式推出汽车芯片设计。ARM推出的芯片设计方案名叫Neoverse,随同芯片一起推出的还有面向汽车制造商、汽车供应商的新系统。

关键字: ARM 汽车芯片 芯片

随着通用人工智能的发展,数据中心的计算需求逐步提高。针对多模态数据、大模型的推理和训练需要更高的算力支持,而随着算力提升与之而来的还需更关注在功耗方面的优化。对于头部云计算和服务厂商而言,针对专门用例提高每瓦性能变得至关...

关键字: ARM 服务器 AI Neoverse CSS

一直以来,riscv架构都是大家的关注焦点之一。因此针对大家的兴趣点所在,小编将为大家带来riscv架构的相关介绍,详细内容请看下文。

关键字: riscv ARM riscv架构

最新消息报道,知情人士透露Arm近日裁掉了中国70多名软件工程师,并会将部分职位转移到中国以外的地区。Arm通过“全球服务”部门已经将支持其中国客户的工作外包给安谋科技,该部门曾经拥有约200名员工。

关键字: ARM 裁员

凭借着在个人计算机领域的广泛应用打下的坚实基础,X86自始至终统治着整个服务器生态。而这并不是业界希望看到的,因此Arm服务器被给予厚望。业界期盼Arm能够带来新的服务器CPU替代:打破一个同质化的数据中心架构,实现更高...

关键字: ARM 服务器 AI
关闭
关闭