当前位置:首页 > 嵌入式 > 嵌入式教程
[导读]函数设计的基本原则是使其函数体尽量的小。这样编译器可以对函数做更多的优化。

14.9函数调用

函数设计的基本原则是使其函数体尽量的小。这样编译器可以对函数做更多的优化。

14.9.1减少函数调用开销

ARM上的函数调用开销比非RISC体系结构上的调用开销小:

·调用返回指令“BL”或“MOVpc,lr”一般只需要6个指令周期(ARM7上)。

·在函数的入口和出口使用多寄存器加载/存储指令LDM和STM(Thumb指令使用PUSH和POP)提高函数体的执行效率。

ARM体系结构过程调用标准AAPCS定义了如何通过寄存器传递参数和返回值。函数中的前4个整型参数是通过ARM的前4个寄存器r0、r1、r2和r3来传递的。传递参数可以是与整型兼容的数据类型,如字符类型char、半字类型short等。

注意

如果是双字类型,如longlong型,只能通过寄存器传递两个参数。

不能通过寄存器传递的参数,通过函数堆栈来传递。这样不论是函数的调用者还是被调用者都必须通过访问堆栈来访问参数,使程序的执行效率下降。

下面的例子显示了函数调用是传递4个参数和多于4个参数的区别。

传递4个参数的函数调用源文件如下。

intfunc1(inta,intb,intc,intd)

{

returna+b+c+d;

}

intcaller1(void)

{

returnfunc1(1,2,3,4);

}

编译的结果如下。

func1

ADDr0,r0,r1

ADDr0,r0,r2

ADDr0,r0,r3

MOVpc,lr

caller1

MOVr3,#4

MOVr2,#3

MOVr1,#2

MOVr0,#1

Bfunc1

如果程序需要传递6个参数,变为如下形式。

intfunc2(inta,intb,intc,intd,inte,intf)

{

returna+b+c+d+e+f;

}

intcaller2(void)

{

returnfunc1(1,2,3,4,5,6);

}

则编译后的汇编文件如下。

func2

STRlr,[sp,#-4]!

ADDr0,r0,r1

ADDr0,r0,r2

ADDr0,r0,r3

LDMIBsp,{r12,r14}

ADDr0,r0,r12

ADDr0,r0,r14

LDRpc,{sp},#4

caller2

STMFDsp!,{r2,r3,lr}

MOVr3,#6

MOVr2,#5

STMIAsp,{r2,r3}

MOVr3,#4

MOVr2,#3

MOVr1,#2

MOVr0,#1

BLfunc2

LDMFDsp!,{r2,r3,pc}

综上所述,为了在程序中高效的调用函数,最好遵循以下规则。

·尽量限制函数的参数,不要超过4个,这样函数调用的效率会更高。

·当传递的参数超过4个时,要将多个相关参数组织在一个结构体中,用传递结构体指针来代替多个参数。

·避免将传递的参数定义为longlong型,因为传递一个longlong型的数据将会占用两个32位寄存器。

·函数中存在浮点运算时,避免使用double型参数。

14.9.2使用__value_in_regs返回结构体

编译选项__value_in_regs指示编译器在整数寄存器中返回4个整数字的结构或者在浮点寄存器中返回4个浮点型或双精度型值,而不使用存储器。

下面的例子显示了__value_in_regs选项的用法。

typedefstruct{inthi;uintlo;}int64;//注意该结构中,高位为有符号整数,低位为无符号整数

__value_in_regsint64add64(int64x,int64y)

{int64res;

res.lo=x.lo+y.lo;

res.hi=x.hi+y.hi;

if(res.lo<y.lo)res.hi++;//carryfromlowword

returnres;

}

voidtest(void)

{int64a,b,c,sum;

a.hi=0x00000000;a.lo=0xF0000000;

b.hi=0x00000001;b.lo=0x10000001;

sum=add64(a,b);

c.hi=0x00000002;c.lo=0xFFFFFFFF;

sum=add64(sum,c);

}

编译后的结果如下所示。

add64

ADDSa2,a2,a4

ADCa1,a3,a1

MOVpc,lr

test

STMDBsp!,{lr}

MOVa1,#0

MOVa2,#&f0000000

MOVa3,#1

MOVa4,#&10000001

BLadd64

MOVa3,#2

MVNa4,#0

LDMIAsp!,{lr}

Badd64

当使用__value_in_regs定义结构体时,编译的代码大小为52字节,如果不使用__value_in_regs选项,则编译出的结果为160字节(本书中没有列出未使用__value_in_regs时的编译结果,读者有兴趣可以自己上机试验)。

14.9.3叶子函数

所谓叶子函数(leaffunction)就是在其函数体内不存在对其他函数调用,它也常被称为终级函数。因为叶子函数不需要调用其他函数,所有没有保存/恢复寄存器的操作,因此执行效率比一般函数要高。

当函数中必须对一些寄存器进行保存时,可以使用高效率的多寄存器存储指令STM,对需要保存的寄存器内存一次性存储。

正是由于叶子函数执行的高效性,所以在编程时,尽量将子程序编写为叶子函数,这样即使程序中多次调用也不会影响代码性能。

为了高效的调用函数,可以遵循下面函数调用原则。

·避免在被频繁调用的函数中调用其他函数,以保证被频繁调用的函数被编译器编译为叶子函数。

·把比较小的被调用函数和调用函数放在同一个源文件中,并且要先定义后调用,编译器就可以优化函数调用或内联较小的函数。

·对性能影响较大的重要函数可使用关键字_inline进行内联。

14.9.4嵌套优化

注意

嵌套优化(Tail-Calloptimization)只适用于armcc。编译时如果使用-g或-debug选项,编译器自动关闭该功能。

一个函数如果在其结束时调用了另一个函数,则编译器使用B指令调转到被调用函数,而非BL指令。这样就避免了一级不必要的函数返回。图14.3显示了嵌套优化的调用过程。

图14.3嵌套优化函数调用过程

当编译时使用-O1或-O2选项时,编译器都执行这种嵌套优化。需要注意的是,当函数中引用了局部变量地址,由于指针别名问题的影响,即使函数在返回时调用了其他函数,编译器也不会使用嵌套优化。

下面通过一个例子来分析嵌套优化是如何提高代码执行效率的。

externintfunc2(int);

intfunc1(inta,intb)

{if(a>b)

return(func2(a-b));

else

return(func2(b-a));

}

编译后的代码如下所示。

func1

CMPa1,a2

SUBLEa1,a2,a1

SUBGTa1,a1,a2

Bfunc2

首先,func1中使用B指令代替BL指令,不用担心lr寄存器被破坏,减少了对寄存器压栈保护操作。另外,程序直接从func2返回到调用func1的函数,减少一次函数返回。如果说正常的指令调用过程为:

BL+BL+MOVpc,lr+MOVpc,lr

那么经过嵌套优化的函数调用过程就可以表示为:

BL+BL+MOVpc,lr

这样,总的开销将减少25%。

14.9.5单纯子函数

所谓单纯子函数(PureFunctions)是指那些函数返回值只和调用参数有关。换句话说,就是如果调用函数的参数相同,那么函数的返回结果也相同。如果程序中存在这样的函数,可以在函数定义时使用_pure进行声明,这样在程序编译时编译器会根据函数的调用情况对其进行优化。

下面的例子显示了当函数用_pure声明时,编译器对其所做的优化。

程序源码文件如下。

intsquare(intx)

{

returnx*x;

}

intf(intn)

{

returnsquare(n)+square(n)

}

编译后的结果如下。

square

MOVa2,a1

MULa1,a2,a2

MOVpc,lr

f

STMDBsp!,{lr}

MOVa3,a1

BLsquare

MOVa4,a1

MOVa1,a3

BLsquare

ADDa1,a4,a1

LDMIAsp!,{pc}

上面的程序中,square函数为“单纯子函数”,当使用_pure声明该函数时编译器在调用该函数时,将对程序进行优化。

声明的方法和编译后的结果如下所示。

__pureintsquare(intx)

{

returnx*x;

}

f

STMDBsp!,{lr}

BLsquare

MOVa1,a1,LSL#1

LDMIAsp!,{pc}

从编译后的代码中可以看到,用_pure声明的函数在f函数中只调用了一次。

虽然“单纯子函数”可以提高代码执行效率,但同时也会带来一些负面影响。比如,在“单纯子函数”中,不能直接或间接访问内存地址。所以在程序中使用“单纯子函数”时要特别小心。

另外,还可以使用#pragma声明“单纯子函数”,下面的代码显示了它的声明过程。

#pragmano_side_effects

/*functiondefinition*/

#pragmaside_effects

14.9.6内嵌函数

ARM编译器支持函数内嵌功能。使用关键字“_inline”声明函数,可以使函数内嵌。下面的例子显示了如何使用函数内嵌功能。

程序源文件如下。

__inlineintsquare(intx)

{

returnx*x;

}

#include<math.h>

doublelength(intx,inty)

{

returnsqrt(square(x)+square(y));

}

编译结果如下所示。

length

STMDBsp!,{lr}

MULa3,a1,a1

MLAa1,a2,a2,a3

BL_dflt

LDMIAsp!,{lr}

Bsqrt

使用函数内嵌有以下好处:

·减少了函数调用开销(如寄存器的压栈保护);

·减少了参数传递开销;

·进一步提高了编译器对代码优化的可能性(如编译器可将ADD和MUL指令合并为一条MLA指令)。

但使用函数内嵌将增加代码尺寸。也正是处于这种原因,armcc和tcc都没有提供函数自动内嵌的编译选项。

一般来说,只有对性能影响较大的重要函数才使用关键字_inline进行内嵌。

14.9.7函数定义

使用函数时要先定义后调用是ARM编程的基本规则之一。在函数调用之前定义函数,编译器可以检查被调用函数的寄存器使用情况,从而对其进行进一步的优化。

首先来看下面的例子。

intsquare(intx);

intsumsquares1(intx,inty)

{

returnsquare(x)+square(y);

}

/*square函数可以在本文件中定义,也可以在其他源文件中定义*/

intsquare(intx)

{

returnx*x;

}

intsumsquares2(intx,inty)

{

returnsquare(x)+square(y);

}

编译的结果如下所示。

sumsquares1

STMDBsp!,{v1,v2,lr}

MOVv1,a2

BLsquare

MOVv2,a1

MOVa1,v1

BLsquare

ADDa1,v2,a1

LDMIAsp!,{v1,v2,pc}

square

MOVa2,a1

MULa1,a2,a2

MOVpc,lr

sumsquares2

STMDBsp!,{lr}

MOVa3,a2

BLsquare

MOVa4,a1

MOVa1,a3

BLsquare

ADDa1,a4,a1

LDMIAsp!,{pc}

从编译的结果可以看出,将square函数定义放在sumsquares函数前,编译器可以判断寄存器a3和a4并未使用,所有在调用函数入口处并未将其压栈。这样,减少了内存访问,提高了代码执行效率。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

LED驱动电源的输入包括高压工频交流(即市电)、低压直流、高压直流、低压高频交流(如电子变压器的输出)等。

关键字: 驱动电源

在工业自动化蓬勃发展的当下,工业电机作为核心动力设备,其驱动电源的性能直接关系到整个系统的稳定性和可靠性。其中,反电动势抑制与过流保护是驱动电源设计中至关重要的两个环节,集成化方案的设计成为提升电机驱动性能的关键。

关键字: 工业电机 驱动电源

LED 驱动电源作为 LED 照明系统的 “心脏”,其稳定性直接决定了整个照明设备的使用寿命。然而,在实际应用中,LED 驱动电源易损坏的问题却十分常见,不仅增加了维护成本,还影响了用户体验。要解决这一问题,需从设计、生...

关键字: 驱动电源 照明系统 散热

根据LED驱动电源的公式,电感内电流波动大小和电感值成反比,输出纹波和输出电容值成反比。所以加大电感值和输出电容值可以减小纹波。

关键字: LED 设计 驱动电源

电动汽车(EV)作为新能源汽车的重要代表,正逐渐成为全球汽车产业的重要发展方向。电动汽车的核心技术之一是电机驱动控制系统,而绝缘栅双极型晶体管(IGBT)作为电机驱动系统中的关键元件,其性能直接影响到电动汽车的动力性能和...

关键字: 电动汽车 新能源 驱动电源

在现代城市建设中,街道及停车场照明作为基础设施的重要组成部分,其质量和效率直接关系到城市的公共安全、居民生活质量和能源利用效率。随着科技的进步,高亮度白光发光二极管(LED)因其独特的优势逐渐取代传统光源,成为大功率区域...

关键字: 发光二极管 驱动电源 LED

LED通用照明设计工程师会遇到许多挑战,如功率密度、功率因数校正(PFC)、空间受限和可靠性等。

关键字: LED 驱动电源 功率因数校正

在LED照明技术日益普及的今天,LED驱动电源的电磁干扰(EMI)问题成为了一个不可忽视的挑战。电磁干扰不仅会影响LED灯具的正常工作,还可能对周围电子设备造成不利影响,甚至引发系统故障。因此,采取有效的硬件措施来解决L...

关键字: LED照明技术 电磁干扰 驱动电源

开关电源具有效率高的特性,而且开关电源的变压器体积比串联稳压型电源的要小得多,电源电路比较整洁,整机重量也有所下降,所以,现在的LED驱动电源

关键字: LED 驱动电源 开关电源

LED驱动电源是把电源供应转换为特定的电压电流以驱动LED发光的电压转换器,通常情况下:LED驱动电源的输入包括高压工频交流(即市电)、低压直流、高压直流、低压高频交流(如电子变压器的输出)等。

关键字: LED 隧道灯 驱动电源
关闭