当前位置:首页 > 嵌入式 > 嵌入式硬件
[导读]近年来,从软件到软硬件联合攻击给嵌入式系统造成严峻的安全威胁。安全性已成为嵌入式系统设计中必不可少的一部分,同时这又是一个折衷的过程,不能单靠软件来保证,而全硬

近年来,从软件到软硬件联合攻击给嵌入式系统造成严峻的安全威胁。安全性已成为嵌入式系统设计中必不可少的一部分,同时这又是一个折衷的过程,不能单靠软件来保证,而全硬件的解决方式很昂贵且不具有弹性[1]。很多产品开始从设计之初就从系统架构上考虑了安全性,如ARM公司的Trust Zone技术开辟了一片可信代码区,通过一个S比特来区分系统的安全状态,IBM的PowerPC中使用了多核单元宽带引擎(BE)进行安全引导和物理隔离。

需要注意的是目前使用的很多嵌入式系统都是基于没有特别设计安全机制的硬件平台。本文以原ARM处理器平台为例,通过增加1块安全协处理器,就可以实现低成本、有实效的安全保护,并且能够抵御两类比较宽泛的攻击:一类是在系统的启动过程中的攻击,如果系统启动过程中没有安全保护措施,很可能被非法用户使用非授权的软件。另一类是外部存储器及总线攻击,当程序代码保存在外部非易失存储器上时,可以轻易被黑客拷贝。另外,片外存储器与片上系统 (SoC)之间的总线传输也容易受到攻击。

1 硬件结构

本方案的硬件结构如图1所示。处理器平台采用三星公司的S3C2442,内核为ARM920T,外置1块2 MB的NorFlash用以存放密文数据,ARM通过总线方式对NorFlash进行访问,该硬件结构中最重要的部分是添加了1块安全协处理器:福华公司的嵌入式系统软件保护芯片FS8826。该芯片可通过I2C或SPI总线与SOC连接,这里使用I2C方式。PC机能够对硬件平台中的每个芯片进行编程控制:通过JTAG端口、串口及网口与ARM进行通信,通过专门的烧录器对FS8826的硬件密钥和安全存储区进行写入。

 

2 软件实现

软件设计从两个主要方面考虑,一是代码加密,二是版权认证。前者主要通过AES(Advanced Encryptiong Standard)加解密算法实现,其算法密钥的管理以及版权认证将依靠FS8826来实现,最终达到安全启动嵌入式操作系统以及保护运行时的版权目的。安全启动方案基于Bootloader+Image的加载机制,也是ARM处理器通用的引导机制。首先采用AES加解密算法在PC机端将编译完成 Image加密,利用FS8826安全存储区存放AES算法密钥,密文存储在片外存储器中,ARM启动时将密文加载入内存。然后在Bootloader启动过程时加入与FS8826的认证操作,认证通过则在该过程中使用AES解密算法解密Image,并用明文将原内存中的密文覆盖,系统正常运行中加入与 FS8826的实时通信监测,确保在授权目标机上运行程序。软件实现流程如图2所示,相应的方案实现框图如图3所示。

 

 

2.1 AES算法

AES是美国国家标准和技术研究所(NIST)选定的高级加密标准,是目前对称加密领域内的主流算法。其数据分组固定为128 bit,密钥分组可支持128 bit/192 bit/256 bit。核心过程为数据块矩阵的Nr(10/12/14)次轮操作。每一次轮操作都由S盒代换(SubBytes)、行移位(ShiftRows)、列混淆(MixColumns)和轮密钥加(AddRoundKey)4个函数组成,第Nr次轮操作不包含MixColumns 函数。密钥扩展为每一轮变换提供轮密钥[2]。本方案中加密在PC机端离线完成,没有时间和运行效率的特别要求,但是解密在ARM9处理器中完成,其运行时间将作为系统启动的一部分,所以下面针对解密部分的算法程序结合其实现平台进行优化设计。

直接的解密算法是将加密过程的每一步求逆并倒置次序得到,然而这样并不利于优化。算法的创始人提出了一种等价解密过程,在解密的轮变换中交换逆行移位和逆S盒代换,轮密钥加和逆列混淆的顺序,只需要调整密钥的编排方案即可。在实现中等价解密过程可以将解密轮变换中的前3个步骤综合生成1张4 KB的T表用于查询,即可快速准确地完成解密[2]。具体流程如图4所示。

 

加解密过程使用电码本模式(ECB)运行,即将消息段逐个分别加解密。实现采用移植性较好的标准C编程。针对ARM处理器的特点,C语言具有以下优化的实现方式[3]:

(1) 数据类型设置:ARM处理器内部是32 bit寄存器,如果变量长度与ARM内部寄存器长度不一致,将会使得变量的存取都需要附加其他指令[3]。AES算法中密钥及数据都是以字节为单位运算,优化时调整为32 bit,仅在输入输出时进行位数变换,可以带来很大的速度改进。

(2) 循环展开:ARM处理器中每一次循环最少有4个周期的循环开销[3]。解密轮变换涉及4个子函数调用,循环执行Nr-1次。在等价解密算法融合了3个子函数形成T表查询,于是可以把轮变换展开,在不增加太多代码量的基础上,每一个数据分组解密减少4(Nr-1)个周期。当密钥位长、密文数据量大时节省的循环开销就比较可观。

(3) 控制变量数:为了高效执行1个函数,应尽量限制函数内部循环所用局部变量的数目,最多不超过12个,确保最重要的和经常用到的变量都被分配在寄存器里[3]。

(4) 宏定义函数实现:有些简单函数可以通过宏定义的方式实现,如域内乘法等。此种方式可以减少函数调用开销。

2.2 FS8826功能实现

FS8826芯片自带24 B硬件密钥,具有不可回读、不可在总线上传输的特点,主要用于芯片内部的认证模块运算(HASH&3DES)和安全数据传输。芯片内部开辟了1块安全存储区(96 B EEPROM),读写都受硬件密钥的保护,且具有CRC校验功能。在本方案中该芯片主要实现两方面功能: SoC版权确认和AES密钥管理。前者通过认证实现,具体流程如图5 所示。总线上发送的数据为硬件密钥与用户设置的认证区数据通过HASH运算得出的数组,并加入了8 B随机数,能够有效地防止重放攻击(reply attack)。该项功能能够提供代码完整性验证[4],在一定程度上抵抗反汇编攻击。后者通过将AES密钥烧入FS8826的安全存储区,由其硬件密钥进行保护实现,认证通过后发送加密的读取命令,算法密钥以密文形式在总线上传递[4]。

 

2.3 Vxworks启动、运行

以上所述的加解密和认证过程将运行在嵌入式实时操作系统的启动和监测上,实现上以Vxworks为例,该系统为风河系统公司(Wind River System)在业界最早推出的一款嵌入式实时多任务操作系统,开发环境为Tornado。

VxWorks操作系统的映像包括两大类:VxWorks类型和Boorom类型[5]。本文对RAM中运行的VxWorks映像在PC机端进行AES加密。选择执行格式的未压缩Bootrom映像——bootrom_uncmp作为启动映像,并在其调用的初始化文件 (bootConfig.c)中加入与FS8826的安全认证、密钥传输以及解密运算。bootrom_uncmp由仿真器烧入到目标板的 norflash中,上电后,bootrom_uncmp把自身拷贝到RAM_HIGH_ADRS地址上运行引导程序。之后,把VxWorks映像装入到起始地址为RAM_LOW_ ADRS的RAM 中,接着跳转到VxWorks映像装入点运行[5]。如果认证通过,引导程序将从FS8826的安全存储区获取AES算法密钥,进行解密,否则在 RAM_LOW_ADRS处的VxWorks映像将仍然为密文,无法正常启动。如图6所示。[!--empirenews.page--]

 

在系统安全启动后,加载的明文映像开始运行,同时,隐藏在映像中认证程序也将开始运行,并定时与FS8826通信,确保持有正确硬件密钥的芯片运行正常,以防黑客移植代码非法使用。

3 实现结果及分析

按照ARM平台下的优化原则,AES解密算法通过直接解密和等价解密2种形式进行实现,并通过ADS的Debugger Internals工具从速度和内存占用量两方面衡量实现效率[2]。如表1所示为在ARM9处理器中2种算法所耗的汇编指令数和指令周期数。表 2为两者占用的内存资源对比。

 

 

从表中结果可以看出,采用查表运算的等价解密过程具有速度上的优势,且随着密钥位的增加其改进越明显。然而,速度与内存占用是相互矛盾的两方面,运行速度越快的算法必然会以占用一部分资源占用为代价。等价解密算法中使用了T表,且将循环展开造成了代码量的增加。所以在实际使用时,对内存资源的要求高于速度要求时建议采用直接解密算法,反之则可采用等价解密算法。这里所用的ARM9有足够的内存空间,所以采用128 bit密钥的等价解密算法,以1 MB的Vxworks密文映像为对象进行启动测试。

正常启动中先由NorFlash建立文件系统,然后通过NandFlash加载文件。实际测试中对1 MB密文的读取耗时1.4 s。可以对密文读取方式进行优化,将密文烧入片外NorFlash中,系统上电后,内存从NorFlash中获取密文的读取方式,时间为0.03 s。这种差别的原因主要有2点:(1)文件系统访问方式下用fopen和fread函数打开密文,解密后的数据还需写回到文件中重新读取,且会受时钟频率及总线速度的限制。而后者属于内存直接读取,解密后直接从内存启动;(2)NorFlash的读取速度本身就比NandFlash要快。

 

需要注意的是,在启动过程中只开启了指令cache,且没有MMU的支持,所以解密的执行速度较之系统启动后要慢很多。经测试,在系统加载起来后1 MB的密文解密操作只需1.7 s。对启动速度有特殊要求的应用可以对MMU和cache的使用进行进一步的调整设计。

系统启动后进行的定时认证,可以监测与FS8826的正常通信,保证主映像运行在授权目标机上。认证过程中的运算都在FS8826芯片内进行,不会对主映像的运行速度造成影响,经过测试每次认证耗时0.16 s,如果安全级别要求不是很高,也可以选择采用复位芯片的方式进行监测,每次仅耗时0.01 s。

本文的主要创新点是基于ARM9处理器平台,针对其软件安全提出了一套可行的解决方案。本方案可以抵御两类攻击:(1)本文构建的安全启动过程,如果脱离了FS8826的支持,将无法获取密钥,无法通过认证。并且可以设置不止一次的认证操作隐藏在启动过程中,将其中的一部分用作FS8826的验证区数据,即使黑客通过反汇编的手段,找到认证代码并予以忽略,也会因为篡改使其他部分的认证无法通过,从而达到防止软件盗版的目的;(2)关键的代码一开始就是以加密状态存放在NorFlash中,密钥则存储在FS8826的安全存储区内,合法用户运行时将获取密钥,把密文解密到内存中,掉电数据丢失。同时,FS8826与SOC之间的总线通信已经过加密,能够防止黑客从总线窃取。该方案成本低,效果好,其成果具有一定的推广性。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

在嵌入式系统开发、调试和测试过程中,J-Link作为一种高效的调试工具,为开发者提供了极大的便利。然而,要想充分发挥J-Link的功能,首先需要正确安装其驱动程序。本文将详细介绍J-Link驱动的安装过程,并深入解析其中...

关键字: jlink 嵌入式系统 嵌入式开发

与谷歌的合作使 Nordic 能够在 nRF Connect SDK 中嵌入开发人员软件,以构建与安卓移动设备兼容的谷歌Find My Device和未知跟踪器警报服务

关键字: 谷歌 SoC 嵌入式开发

嵌入式开发作为当今电子工程和信息技术领域的核心分支,涵盖了广泛的软硬件技术和系统集成方法,用于构建高性能、低成本、低功耗、体积小巧且功能专一的嵌入式系统。这些系统无处不在,从微型传感器节点到复杂的工业控制设备,从日常使用...

关键字: 嵌入式开发 Python

嵌入式开发是当今信息技术领域不可或缺的一部分,它融合了硬件设计、软件开发和系统集成等多个学科,专门用于创建那些被嵌入到特定设备或系统中的专用计算机系统。嵌入式开发的主要过程包括利用分立元件或集成器件进行电路设计、结构设计...

关键字: 嵌入式开发 硬件设计 软件开发

嵌入式开发作为一种专业且技术密集型的领域,涵盖了从硬件底层驱动、中间件到应用层软件开发等多个层面的工作,其所需的工具种类繁多,各有针对性,旨在提升开发效率、保证代码质量以及简化调试过程。

关键字: 嵌入式开发 keil

嵌入式开发作为信息技术领域的重要分支,其涉及的语言种类繁多,各具特色。这些语言的选择取决于目标平台的特性、性能需求、开发者的熟练程度以及项目的具体要求。本文将详细介绍几种常见的嵌入式开发语言,包括C语言、C++、汇编语言...

关键字: 嵌入式开发 C语言

嵌入式开发是一项综合了硬件设计、软件编程以及系统整合的技术活动,其目的是为了创造出能够在特定环境中高效、稳定运行的嵌入式系统。这一流程涵盖了多个紧密关联且不可或缺的阶段,从最初的客户需求分析到最终的产品测试和交付,每个环...

关键字: 嵌入式开发 硬件设计

嵌入式开发作为一个融合了计算机软硬件和系统工程的综合性领域,其成功与否往往取决于三个核心要素的有效整合与协调。这三个要素分别是:硬件平台的选择与设计、软件开发及其优化、以及系统级的设计与集成。深入理解并熟练掌握这三个方面...

关键字: 嵌入式开发 ARM

嵌入式开发作为信息技术的关键支柱,在全球数字化转型浪潮中扮演着无可替代的角色。从传统的嵌入式微控制器到如今先进的片上系统(SoC),再到与云计算、人工智能深度融合的智能终端,嵌入式系统的演进与发展始终紧跟时代脉搏。本文将...

关键字: 嵌入式开发 智能应用

嵌入式开发是一种专门针对特定硬件平台设计和实现软件系统的工程实践,它涵盖了从需求分析、系统设计、编程实现、调试测试直到产品部署及维护的全过程。本文将深入探讨嵌入式开发的主要阶段,分解其流程并阐述每个步骤的关键要点,以便于...

关键字: 嵌入式开发 嵌入式软件
关闭
关闭