当前位置:首页 > 嵌入式 > 嵌入式教程
[导读]因为ARM体系结构本身并不包含除法运算硬件,所以在ARM上实现除法是十分耗时的。ARM指令集中没有直接提供除法汇编指令,当代码中出现除法运算时,ARM编译器会调用C库函数(有符合除法调用_rt_sdiv,无符合除法调用_rt_udiv),来实现除法操作。根据除数和被除数的不同,32bit的除法运算一般要占有20-140个指令周期。

14.2除法运算

因为ARM体系结构本身并不包含除法运算硬件,所以在ARM上实现除法是十分耗时的。ARM指令集中没有直接提供除法汇编指令,当代码中出现除法运算时,ARM编译器会调用C库函数(有符合除法调用_rt_sdiv,无符合除法调用_rt_udiv),来实现除法操作。根据除数和被除数的不同,32bit的除法运算一般要占有20-140个指令周期。除法运算占用的指令周期,由下面公式计算。

Time(除数n/被除数d)

=C0+C1*log2(除数n/被除数d)=

=C0+C1*(log2(除数)-log2(被除数)).

为了避免在程序中出现除法操作,编程时尽量使用其他运算来代替除法操作。如,使用x>(z×y)来代替(x/y)>z。

另外,在无法避免的除法运算中,尽量使用无符合除法代替有符号除法。这是因为在ARM库函数中,无符合除法的运算速度要快于有符合除法。

下面章节将详细讨论如何在代码中提高除法运算的执行效率。

14.2.1合并除法和求余运算

ARM的除法运算库函数能同时返回运算的商和余数。

在一些同时需要商和余数的情况下,编译器将调用一次除法运算函数同时存储运算的商和余数。

下面是一个编译器调用除法库,同时存储运算的商和余数的例子。

源程序如下。

intcombined_div_mod(inta,intb)

{

return(a/b)+(a%b);

}

下面是编译器编译出的汇编代码。

combined_div_mod

STMDBsp!,{lr}

MOVa3,a2

MOVa2,a1

MOVa1,a3

BL__rt_sdiv

ADDa1,a1,a2

LDMIAsp!,{pc}

从上面的例子可以看出,调用一次除法运算,同时返回了商和余数。

14.2.2使用2的整数次幂做除数

当2的整数次幂做除数时,编译器会自动将除法运算转换成移位运算。所以在编写程序算法时,尽量使用2的整数次幂做除数。

下面的例子显示了编译器对除法运算的自动优化。

源程序如下。

typedefunsignedintuint;

uintdiv16u(uinta)

{returna/16;

}

intdiv16s(inta)

{returna/16;

}

编译器的编译结果如下。

div16u

MOVa1,a1,LSR#4

MOVpc,lr

div16s

CMPa1,#0

ADDLTa1,a1,#&f

MOVa1,a1,ASR#4

MOVpc,lr

从上面的例子可以看出,无符号除法的运算速度快于有符号除法。

14.2.3求余运算

为了避免在程序中使用除法运算,可以将一些典型的求余运算进行转换。下面的例子提供一种转换方法。

uintcounter1(uintcount)

{return(++count%60);

}

转换成,

uintcounter2(uintcount)

{if(++count>=60)

count=0;

return(count);

}

下面是两个功能函数编译后的汇编代码。

counter1

STMDBsp!,{lr}

ADDa2,a1,#1

MOVa1,#&3c

BL__rt_udiv

MOVa1,a2

LDMIAsp!,{pc}

counter2

ADDa1,a1,#1

CMPa1,#&3c

MOVCSa1,#0

MOVpc,lr

上面的例子清晰的显示了使用if语句代替除法运算后,代码的执行效率有很大提高。

14.2.4除数是常数的除法

因为除法和模运算执行起来比较慢,所以应该尽可能地避免使用。但是除数是常数的除法运算和用同一个除数的重复除法,执行效率会比较高。在ARM的除法库中,存在除数为10的除法运算库,其中包括有符号除法和无符号除法。如果除数是10以外的其他常数,用户可以编写自己的功能函数。ARM的开发工具集中,提供了关于除数是常数的示例程序和算法分析,以供用户编写自己的代码时参考。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

据《日经新闻》报道,软银旗下英国芯片制造商Arm计划到2025年销售AI芯片。该公司专门成立一个AI芯片部门,并将在2025年春季之前制造出原型产品,并于秋季开始大规模生产。

关键字: 软银 AGI ARM AI芯片

业内消息,近日日本软件银行集团(SoftBank Group)旗下安谋国际科技公司(Arm)计划研发人工智能(AI)芯片,先成立一个AI芯片部门,目标是明年春季建立AI芯片原型产品,然后将量产工作交由代工厂制造,预估20...

关键字: ARM AI芯片

Arm CPU正在从根本上推动AI变革,并造福地球。Arm架构是未来AI计算的基石。​

关键字: ARM AI

近日,Arm推出了Arm® Ethos™-U85神经网络处理器(NPU)和Arm Corstone™-320物联网参考设计平台,旨在满足海量的数据处理和大规模计算,加速推进边缘AI的发展进程。

关键字: ARM

为了赶超云计算市场上的竞争对手,谷歌正试图通过定制的Arm服务器芯片降低云计算服务成本。

关键字: 谷歌 ARM 定制芯片

嵌入式开发作为一个融合了计算机软硬件和系统工程的综合性领域,其成功与否往往取决于三个核心要素的有效整合与协调。这三个要素分别是:硬件平台的选择与设计、软件开发及其优化、以及系统级的设计与集成。深入理解并熟练掌握这三个方面...

关键字: 嵌入式开发 ARM

随着汽车软件数量爆发式的增长,整个行业都需要重新思考汽车产品的开发流程。为此,Arm推出了丰富的硬件IP、新的系统IP,以及全新的汽车计算与计算子系统产品路线图,旨在为各种汽车应用实现性能、功能安全、可扩展等方面的支持。

关键字: ARM 汽车电子

知名移动芯片设计公司ARM最近迈出重要一步,它正式推出汽车芯片设计。ARM推出的芯片设计方案名叫Neoverse,随同芯片一起推出的还有面向汽车制造商、汽车供应商的新系统。

关键字: ARM 汽车芯片 芯片

随着通用人工智能的发展,数据中心的计算需求逐步提高。针对多模态数据、大模型的推理和训练需要更高的算力支持,而随着算力提升与之而来的还需更关注在功耗方面的优化。对于头部云计算和服务厂商而言,针对专门用例提高每瓦性能变得至关...

关键字: ARM 服务器 AI Neoverse CSS

一直以来,riscv架构都是大家的关注焦点之一。因此针对大家的兴趣点所在,小编将为大家带来riscv架构的相关介绍,详细内容请看下文。

关键字: riscv ARM riscv架构
关闭
关闭