MLA(Multiply Accumulate)32位乘累加指令将Rm和Rs中的值相乘,再将乘积加上第3个操作数,结果的最低32位保存到Rd中。
UMLAL(Unsigned Multiply Accumulate Long)为64位无符号长乘-累加指令。指令将Rm和Rs中的值做无符号数相乘,64位乘积与RdHi,RdLo相加,结果的低32位保存到RsLo中,而高32位保存到RdHi中。
SMULL(Signed Multiply Long)64位有符号长乘法指令。指令将Rm和Rs中的值做有符号数相乘,结果的低32位保存到RsLo中,而高32位保存到RdHi中。
SMLAL(Signed Multiply Accumulate Long)为64位有符号长乘法指令。指令将Rm和Rs中的值做有符号数相乘,64位乘积与RdHi,RdLo相加,结果的低32位保存到RsLo中,而高32位保存到RdHi中。
跳转指令B使程序跳转到指定的地址执行程序。带连接的跳转指令BL将下一条指令的地址拷贝到r14(即返回地址连接寄存器LR)寄存器中,然后跳转到指定地址运行程序。需要注意的是,这两条指令和目标地址处的指令都要属于ARM指令集。两条指令都可以根据CPSR中的条件标志位的值决定指令是否执行。
带状态切换的跳转指令BX使程序跳转到指令中指定的参数Rm指定的地址执行程序,Rm的第0位拷贝到CPSR中T位,位[31∶1]移入PC。若Rm的bit[0]为1,则跳转时自动将CPSR中的标志位T置位,即把目标地址的代码解释为Thumb代码;若Rm的位bit[0]为0,则跳转时自动将CPSR中的标志位T复位,即把目标地址代码解释为ARM代码
带连接和状态切换的跳转指令BLX(Branch with Link Exchange)使用标号,用于使程序跳转到Thumb状态或从Thumb状态返回。该指令为无条件执行指令,并用分支寄存器的最低位来更新CPSR中的T位,将返回地址写入到连接寄存器LR中。
带连接和状态切换的跳转指令BLX(Branch with Link Exchange)使用一个寄存器中的绝对地址,用于使程序跳转到Thumb状态或从Thumb状态返回。该指令用分支寄存器的最低位来更新CPSR中的T位,将返回地址写入到连接寄存器LR中。
ARM体系结构允许通过增加协处理器来扩展指令集。最常用的协处理器是用于控制片上功能的系统协处理器。例如控制Cache和存储管理单元的CP15寄存器。此外,还有用于浮点运算的浮点ARM协处理器,各生产商还可以根据需要开发自己的专用协处理器。
ARM指令集提供了两条指令,可直接控制程序状态寄存器psr。MRS指令用于把cpsr或者spsr的值传送到一个寄存器;MSR与之相反,它将一个寄存器的内容传送到cpsr或者spsr。这两条指令结合,可用于对cpsr和spsr进行读/写操作。
ARMv5及其以上版本提供了一条新的指令——零计数指令CLZ(Count Leading Zeros)。该指令用于计算最高符号位与第一个1之间的0的个数。当一些操作数需要规范化(使其最高位为1)时,该指令用于计算操作数需要左移的位数。
交换指令是load/Store指令的一种特殊形式。该指令将一个存储器单元内容与指定的寄存器内容相交换。交换指令为进程间同步提供了一种方便的解决途径。该指令产生一对原子Load/Store操作,该操作发生在一个连续的总线操作中,在操作期间阻止其他任何指令对该存储单元的读/写。
ARM指令集中提供了两条产生异常的指令,通过这两条指令可以用软件的方法实现异常。表9.4总结了ARM异常产生指令。
Thumb指令集支持寄存器的装载和存储,即LDR和STR指令。8和类型的Load/Store指令在Thumb指令集中可用。这些指令使用两种寻址模式:寄存器偏移和立即数偏移。指令所能存取的数据包括字、半字和字节,同时半字和字节可以为有符号数或无符号数。
Thumb中有两个分支跳转指令的变体,第一个变体与ARM版本指令相似,可条件执行,跳转被限制在有符号8位立即数所表示的范围内,或者是±256B。第二个变体不可条件执行(没有条件码部分),但扩展了有效跳转范围,跳转范围为有符号11位立即数表示的范围,即±2048B。
ARM汇编器支持ARM伪指令,这些伪指令在汇编阶段被翻译成ARM或者Thumb(或Thumb-2)指令(或指令序列)。ARM伪指令包含ADR、ADRL、MOV32和LDR。
程序符号。通常为地址标号(label)。在指令和伪指令中通常为标号;在一些伪操作中符号可能是变量或常数。详见ARM伪操作一节。
armasm是ARM汇编语言的交叉编译器,本节将详细介绍它的使用方法。
Thumb指令集把32位ARM指令集的一个子集编码为一个16位的指令集。在16位外部数据总线宽度下,ARM处理器上使用Thumb指令的性能要比使用ARM指令的性能更好。
所有的Thumb指令都是16位的。它们都是ARM指令重新编码得到的,所以继承了ARM指令集的许多特点。