当前位置:首页 > 嵌入式 > 嵌入式教程
[导读]MLA(Multiply Accumulate)32位乘累加指令将Rm和Rs中的值相乘,再将乘积加上第3个操作数,结果的最低32位保存到Rd中。

ARM乘法指令完成两个数据的乘法。两个32位二进制数相乘的结果是64位的积。在有些ARM的处理器版本中,将乘积的结果保存到两个独立的寄存器中。另外一些版本只将最低有效32位存放到一个寄存器中。

无论是哪种版本的处理器,都有乘-累加的变型指令,将乘积连续累加得到总和。而且有符号数和无符号数都能使用。对于有符号数和无符号数,结果的最低有效位是一样的。因此,对于只保留32位结果的乘法指令,不需要区分有符号数和无符号数两种情况。

乘法指令的二进制编码格式如图7.1所示。

图7.1乘法指令的二进制编码

表7.1显示了各种形式乘法指令的功能。

表7.1 各种形式乘法指令

操作码[23:21]

助记符

意义

操作

000

MUL

乘(保留32位结果)

Rd:=(Rm×Rs)[31∶0]

001

MLA

乘-累加(32位结果)

Rd:=(Rm×Rs+Rn)[31∶0]

100

UMULL

无符号数长乘

RdHi:RdLo:=Rm×Rs

101

UMLAL

无符号长乘-累加

RdHi:RdLo:+=Rm×Rs

110

SMULL

有符号数长乘

RdHi:RdLo:=Rm×Rs

111

SMLAL

有符号数长乘-累加

RdHi:RdLo:+=Rm×Rs

其中:

①“RdHi:RdLo”是由RdHi(最高有效32位)和RdLo(最低有效32位)链接形成的64位数,“[31:0]”只选取结果的最低有效32位。

②简单的赋值由“:=”表示。

③累加(将右边加到左边)是由“+=”表示。

同其他数据处理指令一样,位S控制条件码的设置。当在指令中设置了位S时,则有以下结果。

①对于产生32位结果的指令形式,将标志位N设置为Rd的第31位的值;对于产生长结果的指令形式,将其设置为RdHi的第31位的值。

②对于产生32位结果的指令形式,如果Rd等于零,则标志位Z置位;对于产生长结果的指令形式,RdHi和RdLo同时为零时,标志位Z置位。

③将标志位C设置成无意义的值。

④标志位V不变。

注意

乘法指令不能对第二操作数使用立即数或被移位的寄存器。

7.1MUL乘法指令

1.指令编码格式

MUL(Multiply)32位乘法指令将Rm和Rs中的值相乘,结果的最低32位保存到Rd中。

指令的编码格式如图7.2所示。

图7.2MUL指令的编码格式

2.指令的语法格式

MUL{<cond>}{S}<Rd>,<Rm>,<Rs>

①<cond>

为指令编码中的条件域。它指示指令在什么条件下执行。当<cond>忽略时,指令为无条件执行(cond=AL(Alway))。

②S

S位(bit[20])决定指令的操作是否影响CPSR中的条件标志位N位和Z位的值。当S=1时,更新CPSR中的条件标志位的值;当S=0时,指令不更新CPSR中的条件标志位。

③<Rd>

寄存器位目标寄存器。

④<Rm>

第一个乘数所在寄存器。

⑤<Rs>

第二乘数所在寄存器。

3.指令操作的伪代码

指令操作的伪代码如下面程序段所示。

IfConditionPassed{cond}then

Rd={Rm*Rs}[31:0]

IfS==1then

Nflag=Rd[31]

Zflag=ifRd==0then1else0

Cflag=unaffected

Vflag=unaffected

注意

当程序计数器r15被用作<Rd>、<Rm>、<Rs>时,指令的执行结果不可预知;当目的寄存器<Rd>和<Rm>一样时,指令的执行结果不可预知;在ARM版本v5以后的体系中,在MULS指令执行结束后,标志位C保持不变,在v5以前的版本中,MULS指令执行后,标志位C结果不可预知。

4.指令举例

(1)R1=R2×R3

MULR1,R2,R3

(2)R0=R3×R7,同时设置CPSR中N位和Z位。

MULSR0,R3,R7

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

双核心,出色安全性功能、内部堆栈DRAM、丰富的外围

关键字: 微处理器 DRAM 工业物联网

Arm CPU正在从根本上推动AI变革,并造福地球。Arm架构是未来AI计算的基石。​

关键字: ARM AI

近日,Arm推出了Arm® Ethos™-U85神经网络处理器(NPU)和Arm Corstone™-320物联网参考设计平台,旨在满足海量的数据处理和大规模计算,加速推进边缘AI的发展进程。

关键字: ARM

为了赶超云计算市场上的竞争对手,谷歌正试图通过定制的Arm服务器芯片降低云计算服务成本。

关键字: 谷歌 ARM 定制芯片

嵌入式开发作为一个融合了计算机软硬件和系统工程的综合性领域,其成功与否往往取决于三个核心要素的有效整合与协调。这三个要素分别是:硬件平台的选择与设计、软件开发及其优化、以及系统级的设计与集成。深入理解并熟练掌握这三个方面...

关键字: 嵌入式开发 ARM

随着汽车软件数量爆发式的增长,整个行业都需要重新思考汽车产品的开发流程。为此,Arm推出了丰富的硬件IP、新的系统IP,以及全新的汽车计算与计算子系统产品路线图,旨在为各种汽车应用实现性能、功能安全、可扩展等方面的支持。

关键字: ARM 汽车电子

知名移动芯片设计公司ARM最近迈出重要一步,它正式推出汽车芯片设计。ARM推出的芯片设计方案名叫Neoverse,随同芯片一起推出的还有面向汽车制造商、汽车供应商的新系统。

关键字: ARM 汽车芯片 芯片

双核心 Arm Cortex-A35、图形加速、高速连接能力,及内建硬件安全功能

关键字: 微处理器 电动车充电站 智能家居

2024年3月12日,中国 -- 服务多重电子应用领域、全球排名前列的半导体公司意法半导体(STMicroelectronics,简称ST;纽约证券交易所代码:STM)发布了新一代的STM32MP2系列工业级微处理器 (...

关键字: 微处理器 智能工厂 CPU

随着通用人工智能的发展,数据中心的计算需求逐步提高。针对多模态数据、大模型的推理和训练需要更高的算力支持,而随着算力提升与之而来的还需更关注在功耗方面的优化。对于头部云计算和服务厂商而言,针对专门用例提高每瓦性能变得至关...

关键字: ARM 服务器 AI Neoverse CSS
关闭
关闭