当前位置:首页 > 计算平台
  • 边缘计算人工智能,加速智能制造,如何搭建一套高效的AI计算平台?

    2016年,一场风风火火的人机大战,谷歌旗下DeepMind的围棋程序AlphaGo以5局4胜的大比分赢得胜利,掀起了全世界人民,尤其是中国老百姓,对于AI前所未有的热潮,深度学习的概念也从实验室、教科书首次进入了普通大众的视野。不少人通过互联网,第一次了解到AI的魅力。但是,AI的应用远不止互联网企业这么简单,它已经渗透到安防、公安ISV、研究机构、金融、医疗等各行各业。 纵观整个2017年,互联网圈里提到最多的一个词一定是“人工智能”,而且这个“人工智能”已经不仅是2016年那个很会下棋的AlphaGo,它成了无所不能的助手管家,能和你对话(智能音响),能帮公安抓人(人脸识别),也开始抢老司机的活儿(无人驾驶)。如今的人工智能早已不再是70多年前的那个“它”了。 中国制造2025——智能制造工程 中国制造2025战略中,智能制造是一个非常关键的奋斗目标。到2020年,制造业重点领域智能化水平显著提升,试点示范项目运营成本降低30%,产品生产周期缩短30%,不良品率降低30%。到2025年,制造业重点领域全面实现智能化,试点示范项目运营成本降低50%,产品生产周期缩短50%,不良品率降低50%。 智能制造工程推动制造业智能转型,推进产业迈向中高端;高端装备创新工程以突破一批重大装备的产业化应用为重点,为各行业升级提供先进的生产工具。重点聚焦“五三五十”重点任务,即:攻克五类关键技术装备,夯实智能制造三大基础,培育推广五种智能制造新模式,推进十大重点领域智能制造成套装备集成应用。 那么,如何加速智能制造的发展进度?尽快实现广泛的行业领域应用呢? 容错服务器专家的观点认为,以边缘计算引领人工智能的发展,将有力的推动制造智能化进程,并且让人工智能更加“聪明”。 目前,受过训练的人工智能系统,在特定领域的表现已可超越人类,而相关软件技术迅速发展的背后,边缘计算解决方法的运用让人工智能变得更加强大。物联网(IoT)将可望进化成AIoT(AI+IoT)。 智能机器人的遍地开花可能还只是个开端,人工智能终端的边缘运算能力,其所将带来的价值更让人引颈期盼。 容错边缘计算团队认为,基于边缘计算解决方案的人工智能终端,将在各行各业带来变革,从而改变未来的走向。传统人工智能运算的硬件架构,主要包括中央处理器(CPU)、图型处理器(GPU)、现场可编程数组(FPGA)等。 特定领域的专用人工智能系统,由于应用背景需求明确、深厚之领域知识、模型建立计算简单可行,在单项测试之智能水平,目前已可超越人类智能,在许多领域取得具体成效。如今的技术挑战在于,如何发展低功耗、高准确率的认知计算,包括新型运算架构电路设计、算法等。 未来人工智能将由特定的算法加速器,来加速包括卷积神经网络(ConvoluTIon Neutral Network)、递归神经网络(Recursive Neutral Network)在内的各种神经网络算法。边缘计算推动人工智能实现变革性发展,这是实现智能制造必须跨过的一步。 虽然目前人工智能领域的主流研究是在服务器上的人工智能运算,但有越来越多应用产品须在终端上进行实时运算,此种技术便是边缘运算的运用。这个发展趋势将改变整体人工智能运算系统架构的设计与技术需求。 容错专家认为,人工智能在边缘侧的不断扩展,是驾驭数据洪流的关键环节之一,也是物联网未来发展的重要趋势。随着人工智能如火如荼的发展,海量数据需要快速有效地分析和提取洞察,这也大大加强了对于边缘计算的需求。 两个问题值得思考,首先是边缘侧趋向负载整合。以前的数据很多都是结构化数据,可以通过Excel表格或者简单的关系型数据库对其进行维护和管理。但今后会有越来越多的非结构化数据需要进行处理并借此发现内在关联,这时就需要边缘计算和人工智能技术。 其次,构建边缘协同的端到端系统。在一个边缘协同的端到端系统中,由于不同网源的功耗、计算性能和所能承担的成本各不相同,因此在选取硬件架构时往往会有特定要求。要根据用户需求提供不同架构的解决方案,涵盖至强处理器、至强融核处理器、Movidius/Nervana神经网络处理器和FPGA、网络以及存储技术等硬件平台,以及多种软件工具及函数库,优化开源框架,来让他们进行自主选择。 容错服务器及容错软件,具有ftServer 的Lock Step和 everRun Check Point技术, 在实时性,可靠性,安全私密性上有独特的优势,在已经有广泛的工业自动化 (IA) 客户应用的基础之上, 助力边缘计算产业创新技术的落地。 容错服务器,在中国制造2025的奋斗目标下,协助边缘计算产业联盟建立开放与创新的平台、行业践行与示范的平台。携手人工智能技术,加速中国制造2025实现进程。

    时间:2020-07-23 关键词: 人工智能 计算平台

  • Simple Machines选用UltraSoC的嵌入式分析技术来支持新一代计算平台

    UltraSoC日前宣布,其嵌入式分析技术已被Simple Machines,Inc(SMI)选用于其创新的可组合计算平台(Composable Computing Platform)之中。UltraSoC的技术将使SMI及其客户对该公司产品的硬件和软件行为有一个深入的了解,这些产品针对的是各种要求苛刻的应用,诸如安全应用、视觉认知、语言理解和网络级个性化 。 SMI的解决方案采用了一种全新的、已获专利的处理器架构,该架构被设计为可完全定制,以实现对片上资源的最大利用,从而使其适用于从边缘人工智能(AI)到网络级且高性能计算的广泛应用。UltraSoC的嵌入式分析技术将被设计到SMI的系统级芯片(SoC)半导体产品中,从而可以对内部总线事务、处理器执行以及设备内的其它系统级行为进行监测。 UltraSoC首席技术官Gajinder Panesar评论道:“Simple Machines的可组合计算概念对于新兴的、由数据驱动的应用来说,是真正的游戏规则改变者。他们试图解决的问题在传统上被视为需要一种硬连接解决方案——这种解决方案通常意味着需要价格高昂且耗时的ASIC开发;而其他智能化的全新硬件架构也常常忽略了软件开发人员是如何使用、调试或理解该架构。因此,我们很高兴有机会与SMI合作,以支持其团队去为可以说是世界上最棘手的一些计算问题提供解决方案。” Simple Machines首席执行官Karu Sankaralingam补充道:“UltraSoC是唯一一家能够对我们芯片的运行提供详尽可视性的公司——这对于我们去实现自己的架构至关重要。UltraSoC的技术所提供的嵌入式洞察力对于客户开发解决方案来说尤为关键,即使设备已经部署在现场,它也将逐渐成为一种必备的功能。在我们的芯片中使用UltraSoC的技术可以满足对系统级性能的需求,使得软件开发和硬件集成更加高效。” Simple Machines(SMI)满足了市场的迫切需求,因为纯硬件(芯片)解决方案无法跟上技术的快速变化;而且价格高昂,开发和部署时间也过长。公司的突破性设计将复杂的工作负载简化为四种基本行为,然后在运行过程中将其组合并编译到硅片上,从而创建了一种面向未来的处理器,该处理器能够应对人工智能、虚拟现实、机器学习、机器人技术和大数据等应用日益增长的需求。组合式计算平台是一种全新的、以软件为中心的方案,使程序员能够轻松的优化硬件,并通过支持数百种不同用例的平台来获得定制芯片的性能。

    时间:2020-07-17 关键词: 嵌入式 ultrasoc 计算平台

  • 计算平台的三大发展阶段解析

    在过往百年的信息技术发展过程中,人类一直在追求计算和算力的发展,终极追求始终朝向智能化的方向在演进。随着人类社会全数字化时代的即将到来,数据的地位和重要性正在不断上升。 在计算平台发展方面,也开始逐步从以计算为中心转变为数据及其隐私安全为中心,在这个趋势下,未来的下一代计算平台会呈现出怎样的特征? 1. 计算平台三大阶段 回顾计算机的发展历史,计算需求的变化导致计算性能的变革,每次变革都是一次突破,新一代的计算平台也随之出现,而新的计算平台又构建了新的操作系统与生态体系,最终引领一次新的计算革命。 计算平台的发展历史经历了三大阶段 计算平台是计算机系统硬件与软件的设计和开发的基础,具有一定的标准性和公开性,同时也决定了该计算机系统的硬件与软件的性能。 硬件的基础是硬件处理器,软件的基础是操作系统。 总体来说,计算平台经历了几个阶段,PC+互联网阶段,移动互联网阶段,人工智能阶段。 从早期的X86+ Windows和Linux, 到以ARM为主的移动计算平台Android+IOS,再到现在的人工智能,涌现了很多人工智能加速硬件平台和软件平台,如TPU、Cambrican、NV、Tensorflow、PyTorch等。 Intel率先在1978年推出x86指令集及8086 CPU芯片,解决了通用计算的需求,随后Intel CPU成为PC标准配置,X86随之成为PC标准平台,也成为历来最成功的计算平台架构。 同时代的AMD也紧跟X86的大船成为通用处理器市场老二。但是当年的Intel/AMD们忽视了低功耗处理器的技术,导致其错过了捞金如潮的移动互联网时代。 ARM最早在1990年设计出基于RISC的指令集,解决了低功耗计算的需求,随着移动互联网的快速发展,ARM终于等到了辉煌的移动互联网时代机遇,处理器业务也得到了飞速的发展和丰厚的回报。 近年来随着深度学习为代表的人工智能技术逐渐成熟并在大量业务场景中的使用落地,谷歌等企业发布了TPU为代表的专用加速硬件,以海量数据计算为代表的人工智能时代到来。 中科院背景的寒武纪也近期推出了强大的智能加速芯片,阿里华为等互联网巨头也自然不会错过这个巨大的机会,相继推出智能加速芯片。 2. 数据管理的迫切需求 同时近年来区块链、物联网、量子计算等技术快速的发展,让世界各国同时对数据全性和隐私性的重视提高到了前所未有的高度,这都对数据安全及数据隐私保护都提出了更多更高的要求。 我们不禁要问,现有的计算平台是否完全适用于新的要求? 说一个我身边的真实故事,我的一个朋友早些年在某大型国家电信企业工作。 服务器是该企业的重要核心生存资料,有一段时间老板指派他每天上报机房的空调温度。 有一天报告后,老板奇怪地问,我们楼顶那两台空调不都已经坏了吗?怎么还有温度呢? 这足以说明在现有的技术机制下,数据的有效性是处于动态变化中的,需要耗费大量时间精力来进行管理。 近期肆虐全中国的新冠病毒,也暴露大量的数据管理问题,如抗疫物资管理的透明度,疫情数据实时协同等,这些问题随着大量的物联网设备的广泛采用,和社会的快速发展将会越发严峻。 近期国家强调区块链在技术上的战略意义,区块链跟物联网的结合也必将成为一个极具潜力的方向。 通过将物联网与区块链的技术进行整合,可以有效地对数据进行管理,并杜绝数据的篡改 ,改善提高共享协同效率,同时保证数据的可靠性和真实性。 3. 来自量子计算的威胁 近年来量子计算快速发展,使大家对传统加密技术的安全性产生了非常大的质疑。比如基于质因子分解RSA在量子计算机面前面临着巨大的安全风险。 量子计算对密码算法的安全威胁一览 目前量子计算对密码算法的攻击主要有Shor算法和Grover算法。 Shor算法主要针对公钥密码算法进行,简单说就是可以通过公钥可以求私钥,对公钥算法的威胁很大; Grover算法针对的是对称密码算法,可以减少穷举攻击的复杂度,但是对称密码将密钥加倍后在量子计算条件下仍然是安全的。 密码学界很早就在研究可以抵抗量子计算机攻击的密码算法,最早可以追溯到上世纪70年代年的 McEliece 加密、Merkle 哈希等。 但是当时量子计算威胁并不明显,而近年来威胁显著提升之后密码学界才提出了后量子概念。 美国国家标准技术研究所 (NIST)早在 2012 年启动了后量子密码的研究工作。 实现后量子密码算法主要有以下4种: 第一,基于哈希; 第二,基于编码,主要用于构造加密算法; 第三,基于多变量,主要用于构造数字签名、加密、密钥交换等; 第四,基于格,主要用于构造加密、数字签名、密钥交换,以及众多高级密码学应用。 其中格计算又称为密码学的圣杯,其潜力是非常巨大。 但是格计算的计算复杂度超高,相关标准还在制定中,目前在工业界并未广泛采用。 另外,在保障数据隐私安全的技术方面,INTEL提出硬件安全屋方案SGX,但是目前已有多种有效的攻击方法针对该方案,所以并不能达到后量子加密算法一样安全可靠。 1. LatticeX计算平台应运而生 针对上述三方面要求,我们提出了我们自己的解决方案和计算平台。 万物智能隐私计算时代到来,我们将物联网技术、人工智能技术、密码学技术、区块链技术紧密的结合,形成新一代的计算平台LatticeX。 LatTIceX 平台将更多地沿着格计算后量子技术路径发展演进,同时结合硬件加速技术。 LatTIceX将满足万物互联在去中心化环境中,进行抗量子攻击,保障隐私的超大算力/超大带宽要求的海量大数据计算以及人工智能计算。 同时我们也在致力于开发相应的分布式异构的硬件加速器产品LatTIceX PPU(Privacy Process Unit)。 在PPU中我们将创新性地支持多种后量子密码算法,并使其与深度学习紧密整合,实现在全密文下的深度学习推理和训练,彻底杜绝安全屋方案存在的各种安全威胁。 同时我们支持千G级别的光接口,实现对大通讯量的实时安全多方计算的支持。 LatTIceX将见证万物智能隐私计算时代的到来,通过软硬件系统的深度整合及优化,将为业界提供一个满足未来超大算力超大带宽,支持海量物联网设备连接计算,同时抗量子攻击,保障全程数据隐私安全的分布式去中心化的智能计算平台。 LatticeX不仅可用于对隐私安全要求严格的行业如金融,电商,医疗保健,安防等,也适用于自动驾驶,能源,交通,航天等各个大数据行业。

    时间:2020-05-06 关键词: 区块链 加密算法 计算平台

  • 计算平台的发展可以反映出什么现象

    在过往百年的信息技术发展过程中,人类一直在追求计算和算力的发展,终极追求始终朝向智能化的方向在演进。随着人类社会全数字化时代的即将到来,数据的地位和重要性正在不断上升。 在计算平台发展方面,也开始逐步从以计算为中心转变为数据及其隐私安全为中心,在这个趋势下,未来的下一代计算平台会呈现出怎样的特征? 1. 计算平台三大阶段   回顾计算机的发展历史,计算需求的变化导致计算性能的变革,每次变革都是一次突破,新一代的计算平台也随之出现,而新的计算平台又构建了新的操作系统与生态体系,最终引领一次新的计算革命。 计算平台的发展历史经历了三大阶段 计算平台是计算机系统硬件与软件的设计和开发的基础,具有一定的标准性和公开性,同时也决定了该计算机系统的硬件与软件的性能。 硬件的基础是硬件处理器,软件的基础是操作系统。 总体来说,计算平台经历了几个阶段,PC+互联网阶段,移动互联网阶段,人工智能阶段。 从早期的X86+ Windows和Linux, 到以ARM为主的移动计算平台Android+IOS,再到现在的人工智能,涌现了很多人工智能加速硬件平台和软件平台,如TPU、Cambrican、NV、Tensorflow、PyTorch等。 Intel率先在1978年推出x86指令集及8086 CPU芯片,解决了通用计算的需求,随后Intel CPU成为PC标准配置,X86随之成为PC标准平台,也成为历来最成功的计算平台架构。 同时代的AMD也紧跟X86的大船成为通用处理器市场老二。但是当年的Intel/AMD们忽视了低功耗处理器的技术,导致其错过了捞金如潮的移动互联网时代。 ARM最早在1990年设计出基于RISC的指令集,解决了低功耗计算的需求,随着移动互联网的快速发展,ARM终于等到了辉煌的移动互联网时代机遇,处理器业务也得到了飞速的发展和丰厚的回报。 近年来随着深度学习为代表的人工智能技术逐渐成熟并在大量业务场景中的使用落地,谷歌等企业发布了TPU为代表的专用加速硬件,以海量数据计算为代表的人工智能时代到来。 中科院背景的寒武纪也近期推出了强大的智能加速芯片,阿里华为等互联网巨头也自然不会错过这个巨大的机会,相继推出智能加速芯片。 2. 数据管理的迫切需求 同时近年来区块链、物联网、量子计算等技术快速的发展,让世界各国同时对数据全性和隐私性的重视提高到了前所未有的高度,这都对数据安全及数据隐私保护都提出了更多更高的要求。 我们不禁要问,现有的计算平台是否完全适用于新的要求? 说一个我身边的真实故事,我的一个朋友早些年在某大型国家电信企业工作。 服务器是该企业的重要核心生存资料,有一段时间老板指派他每天上报机房的空调温度。 有一天报告后,老板奇怪地问,我们楼顶那两台空调不都已经坏了吗?怎么还有温度呢? 这足以说明在现有的技术机制下,数据的有效性是处于动态变化中的,需要耗费大量时间精力来进行管理。 近期肆虐全中国的新冠病毒,也暴露大量的数据管理问题,如抗疫物资管理的透明度,疫情数据实时协同等,这些问题随着大量的物联网设备的广泛采用,和社会的快速发展将会越发严峻。 近期国家强调区块链在技术上的战略意义,区块链跟物联网的结合也必将成为一个极具潜力的方向。 通过将物联网与区块链的技术进行整合,可以有效地对数据进行管理,并杜绝数据的篡改 ,改善提高共享协同效率,同时保证数据的可靠性和真实性。 3. 来自量子计算的威胁   近年来量子计算快速发展,使大家对传统加密技术的安全性产生了非常大的质疑。比如基于质因子分解RSA在量子计算机面前面临着巨大的安全风险。 量子计算对密码算法的安全威胁一览 目前量子计算对密码算法的攻击主要有Shor算法和Grover算法。 Shor算法主要针对公钥密码算法进行,简单说就是可以通过公钥可以求私钥,对公钥算法的威胁很大; Grover算法针对的是对称密码算法,可以减少穷举攻击的复杂度,但是对称密码将密钥加倍后在量子计算条件下仍然是安全的。 密码学界很早就在研究可以抵抗量子计算机攻击的密码算法,最早可以追溯到上世纪70年代年的 McEliece 加密、Merkle 哈希等。 但是当时量子计算威胁并不明显,而近年来威胁显著提升之后密码学界才提出了后量子概念。 美国国家标准技术研究所 (NIST)早在 2012 年启动了后量子密码的研究工作。 实现后量子密码算法主要有以下4种: 第一,基于哈希; 第二,基于编码,主要用于构造加密算法; 第三,基于多变量,主要用于构造数字签名、加密、密钥交换等; 第四,基于格,主要用于构造加密、数字签名、密钥交换,以及众多高级密码学应用。 其中格计算又称为密码学的圣杯,其潜力是非常巨大。 但是格计算的计算复杂度超高,相关标准还在制定中,目前在工业界并未广泛采用。 另外,在保障数据隐私安全的技术方面,INTEL提出硬件安全屋方案SGX,但是目前已有多种有效的攻击方法针对该方案,所以并不能达到后量子加密算法一样安全可靠。 1. LatticeX计算平台应运而生 针对上述三方面要求,我们提出了我们自己的解决方案和计算平台。 万物智能隐私计算时代到来,我们将物联网技术、人工智能技术、密码学技术、区块链技术紧密的结合,形成新一代的计算平台LatticeX。 LatTIceX 平台将更多地沿着格计算后量子技术路径发展演进,同时结合硬件加速技术。 LatTIceX将满足万物互联在去中心化环境中,进行抗量子攻击,保障隐私的超大算力/超大带宽要求的海量大数据计算以及人工智能计算。 同时我们也在致力于开发相应的分布式异构的硬件加速器产品LatTIceX PPU(Privacy Process Unit)。 在PPU中我们将创新性地支持多种后量子密码算法,并使其与深度学习紧密整合,实现在全密文下的深度学习推理和训练,彻底杜绝安全屋方案存在的各种安全威胁。 同时我们支持千G级别的光接口,实现对大通讯量的实时安全多方计算的支持。 LatTIceX将见证万物智能隐私计算时代的到来,通过软硬件系统的深度整合及优化,将为业界提供一个满足未来超大算力超大带宽,支持海量物联网设备连接计算,同时抗量子攻击,保障全程数据隐私安全的分布式去中心化的智能计算平台。 LatticeX不仅可用于对隐私安全要求严格的行业如金融,电商,医疗保健,安防等,也适用于自动驾驶,能源,交通,航天等各个大数据行业。

    时间:2020-05-06 关键词: 量子计算 计算平台

  • 阿里飞天大数据平台正式亮相:国内最大计算平台

    7月26日,昨日,阿里云飞天大数据平台在阿里云峰会上海站上正式亮相。据悉,这是中国唯一自主研发的大数据计 算引擎,单一引擎可将10万台服务器合为一体,也是全球集群规模最大的计算平台。 飞天大数据平台是当前国内规模最大的计算平台,可扩展至10万台计算集群,曾创下四项海量数据排序世界纪录。在阿里巴巴经济体中支撑了全局数据存储和计算,单日数据处理量超过600PB。 飞天大数据平台支撑海量数据存储和计算。在民生服务领域,飞天大数据平台已经“最多跑一次”、城市大脑等场景中,协助政府优化服务模式,实现更智能便捷的服务能力,保障信息安全。 数据显示,目前飞天大数据平台可扩展至10万台计算集群,集群规模全球第一。单日数据处理量从2015年100PB、2016年180PB、2017年320PB,到2018年超过600PB,仅用三年时间提升5倍。

    时间:2019-08-01 关键词: 阿里 飞天大数据平台 计算平台

  • 开源ISA拥抱开放的未来,RISC-V将成为新一代运算平台的首选

    RISC-V最近曝光度极高,可以看到其广口性,不论是独立的小公司还是全球性的大IC设计公司,都纷纷加入了RISC-V基金会。铺天盖地的媒体报道中,常常会将其放在Arm和Intel的对立面,但在笔者最近与RISC-V基金会执行董事Rick O'Connor的交流中,他并不喜欢这种看法:“RISC-V并不是要对抗Arm或者对抗Intel,这两者对于目前的科技进步做出了无比巨大的贡献。”但是因为同为ISA,所以总会让人放在一起比较。Rick自己打趣到:“如果你已经有了一把锤子(ISA),并且用的很顺手,那么但我拿着一把新的锤子出现,你为什么会选择新的锤子呢?” 图:RISC-V基金会执行董事Rick O'Connor(来源:Charbax) 为什么需要一把新锤子(ISA)? RISC-V是一种精简指令集,与Arm的RISC精简指令集、Intel的X86指令集本质上是一种类型的东西——指令集体系结构(Instruction-Set Architecture, ISA)。Rick曾多次提到,ISA是硬件与软件的接口,这是计算系统中最为重要的接口。我们也都知道,Arm一直在移动计算和嵌入式的领域占据主导地位,Intel则一直在PC和服务器端占据主导地位,两者都曾多次尝试想要进入对方的领域,但是均未获得可为人称道的成果。这是为什么呢?据Rick先生介绍,一旦某种应用选择了一种ISA,那么就决定了其上层的软件层面和下层的硬件层。PC、手机、服务器等领域,软件都已经非常成熟,所以选择另一种ISA,也很难对于上层的软件实现适配。因此,很难获得成功。对于这些领域,RISC-V当然也可以进入,不过RISC-V的意义更在于对于全新应用领域的探索。全新领域的硬件平台和软件平台都没有成型,比方说AI等领域,目前大家都在摸索,但是Arm和Intel的ISA已经被写死,用户并不能对其进行任意的修改和添加。所以,对于未来的全新应用领域,需要一种全新计算平台,所以需要一种全新的ISA来支持。 图:RISC-V基金会成员(来源:网络) 那么RISC-V都有哪些好处呢?Rick总结了三点:第一就是其简单高效的核心。RISC-V的指令集非常的精简。第二点是其具有模块化的可扩充性。用户可以将ISA进行修改,添加一些自己需要的指令进去,提高特定应用效率。第三点是其开放性。因为RISC-V是免费开源的,所以当你选择了RISC-V,并不意味着你被局限在了一种计算框架内。你仍然可以选择适合自己的硬件和软件平台,而不会局限在现有的框架内。 开源的ISA拥抱开放的未来,给所有人机会和可能 在此次访谈中,刚刚被任命为RISC-V基金会中国顾问委员会主席的方之熙先生也参与了交流。方之熙认为,RISC-V美丽的地方在于它给了所有人可能。 图:MODEL FOR ISA(来源:RISC-V基金会中国顾问委员会主席方之熙) 上图是方之熙先生给笔者用来讲解ISA生意模式的一个简图,可以看到在Arm是一个证书提供商,选择了Arm就意味着选择了特定的应用和设计。Intel则是更为大包大揽,它完全掌控了ISA,芯片设计,芯片制造。ISA基金会则仅仅会专注于ISA的维护层面,也就是上图中第一行。并不会提供证书,更不会提供产品。而RISC-V的用户呢?它们可以存在于这个象限的任意位置!你可以将RISC-V拿来,开发一种架构,像Arm一样将这个架构证书卖钱,也可以选择加入开源。你也可以选择基于RISC-V开发一种架构,然后在此架构上开发IC芯片出来,直接卖IC赚钱。所有的商业模式都可以在这里实现。所有人都参与起来,才能创造出更多的可能性,满足未来应用的需求。在PC和手机等既定的应用领域,已经固化了一种商业模式,而在未来许多应用场景中,需要新的创新,新的需求。RISC-V的开放性将会是更为适合的一种ISA选择。 Rick表示,就像是Linux对于桌面操作系统的贡献一样。RISC-V的出现是一场革命。当Linux刚出现的时候,微软觉得那是一团糟。而现在微软已经成为了Linux最大的用户和捐助者。因为微软比任何人都更清楚的明白Linux开源对于每个人技术发展的好处所在。而RISC-V也是一样的,RISC-V的开源,对于整个行业而言,也是益处颇多。据不完全统计,目前全球已经有超过120个大学使用RISC-V来进行教学。目前不论是半导体巨头三星华为等,还是谷歌等IT巨头,还是无数的独立公司,还是个人开发者,都已经开始加入基金会。这场革命,全人类都会参与其中。 --- 在此次访谈中,Rick提到,业界曾经非常的懒,习惯了用现在的锤子,受困于一种既定的商业模型里。现在新的锤子出现了,借助RISC-V的力量,未来将会有更多可能。 “There is nothing wrong with Intel architechture, there is nothing wrong with Arm architechture. There is something you can do better if you start it over, which RISC-V is done.” ——Rick O'Connor

    时间:2018-11-14 关键词: 英特尔 ARM 高端访谈 risc-v 指令集 计算平台

  • 全计算平台领域Linux份额两倍于Windows

    根据NetApplications的数据,目前Linux在桌面OS领域仅占有1%的市场份额而Windows占据近92%。但如果考虑包括手机在内的所有计算平台,那Widnows就只有20%的份额,而Linux占到42%。当然,其中Linux的实现形式大多数是谷歌的Android系统。 Goldman Sachs公司最近发布了一份图表,展示了微软如何从2004年高达95%计算平台市场份额跌落到去年的20%。图表还预测微软的份额到2016年有望提高到26%,而Android将跌至39%,苹果iOS和MacOS X则将从今天的24%增长到2016年的29%。 这一预测的前提是微软有能力用Windows Phone和Windows RT/Pro对抗Android和iOS。

    时间:2013-01-22 关键词: Windows Linux 计算平台

  • 汽车嵌入式计算平台的设计

    电子设备在汽车中的广泛应用被认为是汽车技术发展进程中的一次革命。随着汽车电子技术的发展和汽车控制单元的增加,汽车电子技术正朝着集中化、智能化、网络化和模块化方向发展。车内CAN/LIN总线网络的使用使得车内各个控制单元的数据可以共享,从而使在汽车嵌入式计算平台上采用多变量多目标的综合协调控制成为可能。另一方面,网络化拓展了汽车的服务领域,为汽车的移动通信、移动办公、娱乐、导航定位和远程诊断与维修提供了技术基础,逐步形成了汽车、家庭、社会一体化的互动体系。汽车嵌入式计算平台在该一体化体系中担当重要角色。 本文介绍了车载嵌入式计算平台,它为完成汽车辅助驾驶和安全监控、远程诊断和维修、在线/离线导航定位、娱乐、与家庭互动等各项功能提供了很好的软硬件平台。下面将从汽车/家庭/社会一体化体系结构、计算平台的硬件体系、软件体系三个方面进行说明。 1 汽车/家庭/社会一体化体系结构 汽车嵌入式计算平台为实现各种功能服务提供了良好的软硬件平台。车外网络和车内网络结合构成了汽车/家庭/社会一体化的互动体系结构。该体系结构示意图见图1,车内计算网络示意图见图2。         在图1中,交通管理中心、汽车服务中心、互联网服务中心和娱乐服务中心等共同组成汽车远程服务平台,家庭/办公室和汽车组成汽车/家庭互动平台体系。其主要提供三类服务: (1)汽车集成服务。主要指汽车远程诊断服务和汽车最优控制方案服务。汽车计算平台通过CAN/LIN总线读取电子控制模块(ECM)诊断产生的故障代码,然后通过汽车网关利用无线通信技术发送至最近的汽车服务中心。汽车服务中心分析故障代码形成诊断方案并以服务的形式发送到汽车嵌入式网关,经过协议解析后再发送到汽车嵌入式计算平台,最后通过人机接口显示给驾驶员。汽车制造商同时向汽车提供下载最佳汽车控制方案的服务,以适合汽车在不同的行驶条件下运行。这些服务主要由汽车远程服务平台或汽车制造商提供。 (2)导航定位服务。运行在车载嵌入式平台上的应用层软件接收GPS接收仪发送的数据,借助车载的地理信息系统(电子地图)实现导航。此外应用层软件还可以把GPS接收的数据发送到远程汽车服务平台或第三方服务提供商,再由他们把导航信息以服务的形式发送给汽车嵌入式平台。这些服务对准确性和及时性要求比较高。如何准确高效地传递这些信息成为决定这类服务质量的关键。 (3) 个人/娱乐信息服务。汽车/家庭互动平台体系使人们可以在驾驶汽车的过程中了解家中的情况,将汽车-家庭连为一体。车载信息处理(Telematics) 系统的地位日益突出。它通过无线通信技术将安全保密信息或娱乐信息以服务(Service)的方式传递至汽车。 2 汽车嵌入式计算平台的硬件体系结构 硬件平台的设计必须根据其要完成的功能来确定。本项目是将汽车嵌入式网关集成到计算平台中,因此,计算平台要完成的功能主要为:与远程服务中心的无线通信功能;导航功能;音视频播放的功能;通过CAN/LIN总线访问车内电子控制模块的功能等。基于32位ARM内核的EP9315处理器具有良好的计算能力和丰富的外围接口,在对其做了适当的外围扩展后设计出如图3所示的汽车嵌入式计算平台。     EP9315是高度集成的片上系统处理器。它拥有200MHz ARM920T处理器及支持Linux、Windows CE和其他许多嵌入式操作系统的存储器管理单元(MMU)。EP9315内置一个高性能1/10/100 Mbps以太网媒体存取控制器(MAC)及外部接口,可连接SPI、I2S音频、Raster/LCD、IDE存储外设、小键盘和触摸屏等。该器件还集成了运行速度为12Mbps的三端口USB 2.0全速主机和3个UART。PCMCIA接口的无线网卡提供远程网络的访问功能,可以实现对远程服务中心网络服务器的访问。IDE接口的电子硬盘用来存放地理信息系统,为导航软件提供电子地图。GPS接收仪通过串口与EP9315处理器相连,提供实时的车辆地理位置信息。触摸屏是人机输入界面,用来完成各种用户信息的设置。LCD显示屏和扬声器是人机输出界面,可以播放MPEG4视频或提示语音报警信息。CAN/LIN总线接口可以挂接汽车内的 CAN/LIN总线,提供对车内CAN/LIN总线的访问。基于上述硬件平台所设计的软件能很好地完成计算平台所要完成的各项功能。 3 汽车嵌入式计算平台的软件体系结构 软件平台采用嵌入式Linux设计。上文已对软件部分要实现的功能进行了一定的描述。其中导航任务是一个实时任务,而Linux不具有实时功能,因此需要改进Linux,使其支持实时任务。基于实时Linux的软件体系结构如图4所示。     系统上电后,首先启动LINux操作系统,然后启动QT引擎,再启动 QT主程序。在LCD显示屏上显示各个应用程序的选择按钮,通过触摸屏按下相应的按钮,即会启动相应的应用程序。下面介绍主要应用程序的执行流程。 (1)导航应用程序。导航程序启动后,用户通过触摸屏输入旅程的起始地点和目的地点。导航软件把该起始地点和目的地点发送到导航服务中心(本项目中为无线局域网中一台计算机),并且每隔一定时间调用导航API从串口1接收GPS接收仪发送的当前车辆的实时地理位置数据,再调用通信API,通过无线网卡把该地理位置数据发送到导航服务中心。导航服务中心根据接收到的旅程起始地点和目的地点计算出最优行使路径,并且每接收到车辆位置信息时,都计算出当前车辆所在的位置,把包含当前车辆位置和应该行使路径的小范围的位置图像发送到车辆。车上的导航软件把接收到的图像在LCD上显示出来,通过该图像司机就可以了解车辆当前的位置和下一步要行使的路线。 (2)诊断应用软件。诊断服务软件启动后,该软件调用诊断API读取连接在CAN/LIN总线上的各个ECU的故障代码,然后再调用通信API把这些代码发送到汽车服务中心(本项目中是与导航服务中心相同的计算机)。汽车服务中心分析故障代码,确定出汽车的具体故障情况,把最终结果通过无线网发送到汽车嵌入式平台。汽车嵌入式平台通过无线网卡接收这些数据,诊断服务软件读取该数据,并在LCD上显示。 (3)汽车/家庭互动应用软件。当在汽车嵌入式平台上运行家庭/汽车互动系统软件时,该软件在LCD上显示家庭中的各个电器及其状态。当用户通过触摸屏发出改变某个电器状态的命令时,汽车/家庭互动软件调用家庭API函数把该命令发送到家庭网关(由社会第三方服务公司提供)。在家庭网关上运行着实现 OSGI协议的软件,该软件可以完成所接收到的命令,并把执行的结果发送到汽车嵌入式平台。 (4)安全监控软件。CCD摄像头把汽车行驶车道的图像输入到DSP处理系统,DSP处理系统对图像数据进行分析,并把分析结果送到在汽车嵌入式平台上运行的安全监控软件,监控软件分析该数据。如果汽车偏离行驶车道,监控软件则调用多媒体API通过扬声器或者在LCD上显示信息提醒驾驶员,从而实现安全监控和报警功能。

    时间:2012-10-30 关键词: 汽车 嵌入式 计算平台

  • 安森美半导体提升在高能效下一代计算平台的领先地位

    21ic讯 安森美半导体(ON Semiconductor)持续扩充产品系列,简化及加速计算机平台的设计。 安森美半导体计算及消费产品部高级副总裁兼总经理宋世荣(Bill Schromm)说:“随着个人电脑体验历经进一步转变,安森美半导体贯彻聚焦于以创新的器件推进高能效及功率密度,帮助原设备制造商(OEM)简化设计,加速开发过程。我们一贯地提供不单能以更高频率工作,并具备更优的电源管理及更高的信号完整性的集成方案,同时将占用的电路板空间减至最少。安森美半导体的方案使现代高性能计算机应用中能有高速连接。” 安森美半导体设计的产品旨在用于台式计算机、服务器、笔记本及平板电脑中所有的主要子系统,包括中央处理器(CPU)供电、热管理、传统电源及适配器中的电源转换、时钟产生及分配,以及高速接口开关及保护。公司的计算机产品系列还因应业界从传统计算技术迈向智能手机及平板电脑等移动平台的趋势,提供方案以解决将新兴串行通信集成到系统设计之挑战。 公司宽广阵容的计算机方案包括:多相内核电压(Vcore)控制器;AC-DC及DC-DC控制器、转换器及稳压器;电压及电流管理;MOSFET;放大器及比较器;EEPROM存储器 ;以及用于计算机及外设应用之电源开关、接口、保护、滤波等方案。 安森美半导体应用于下一代计算机平台的产品包括: - 安森美半导体首个基于可控硅整流器(SCR)的静电放电(ESD)保护产品,此产品提供急速反回(snap back)及业界最低ESD钳位电压,能够保护几何尺寸低于22纳米(nm)的芯片组。此技术的最大电容仅为超低的0.25皮法(pF),为USB 3.0及Thunderbold等高速接口提供了极优方案。 - NCP1851完全可编程锂离子(Li-Ion)开关电池充电器,此器件大幅加速充电过程、改进启动序列及优化电池总寿命,用于智能手机、平板应用及其它手持便携设备。 - NCP6132A及NCP6153电源控制器结合真正的差分电感直流阻抗(DCR)电流感测、输入电压前馈及自适应电压定位功能,为台式机及笔记本应用提供精确稳压的电源。控制系统基于双缘脉宽调制(PWM),还结合了DCR电流感测,为动态负载事件提供最快的初始响应,并降低系统成本。 - 全系列节省空间的双增强热性能分立MOSFET,用于元器件密度及散热效率要求高的网络、笔记本、服务器及图形卡应用。 - NB3N1XXK和NB4N1XXK系列差分时钟及数据扇出缓存增强系统灵活性,使设计人员可以轻易地连接多路输入信令方案,非常适合于要求多重备份符合PCI Express (PCIe)标准的高精度、低相位噪声时钟信号的系统。 - 新的ecoSWITCH™先进负载管理系列器件,提供重要的成本及占用面积节省,以及市场领先的性能,包括:超低导通阻抗(RON)、市场上最高的电池承载能力、故障保护、可配置浪涌电流控制及其它特性,且采用极小封装。 - NIS5132和NIS5135单片集成电路,提供优异的保护性能,增强硬盘驱动器或其它电路的可靠性,保护它们免受灾难性故障及关闭故障影响。

    时间:2012-09-12 关键词: 安森美半导体 高能效 计算平台

  • 基于Atmega8的实用车载空调控制器电路

    电子设备在汽车中的广泛应用被认为是汽车技术发展进程中的一次革命。随着汽车电子技术的发展和汽车控制单元的增加,汽车电子技术正朝着集中化、智能化、网络化和模块化方向发展。车内CAN/LIN总线网络的使用使得车内各个控制单元的数据可以共享,从而使在汽车嵌入式计算平台上采用多变量多目标的综合协调控制成为可能。另一方面,网络化拓展了汽车的服务领域,为汽车的移动通信、移动办公、娱乐、导航定位和远程诊断与维修提供了技术基础,逐步形成了汽车、家庭、社会一体化的互动体系。汽车嵌入式计算平台在该一体化体系中担当重要角色。  本文介绍了车载嵌入式计算平台,它为完成汽车辅助驾驶和安全监控、远程诊断和维修、在线/离线导航定位、娱乐、与家庭互动等各项功能提供了很好的软硬件平台。下面将从汽车/家庭/社会一体化体系结构、计算平台的硬件体系、软件体系三个方面进行说明。  1 汽车/家庭/社会一体化体系结构  汽车嵌入式计算平台为实现各种功能服务提供了良好的软硬件平台。车外网络和车内网络结合构成了汽车/家庭/社会一体化的互动体系结构。该体系结构示意图见图1,车内计算网络示意图见图2。在图1中,交通管理中心、汽车服务中心、互联网服务中心和娱乐服务中心等共同组成汽车远程服务平台,家庭/办公室和汽车组成汽车/家庭互动平台体系。其主要提供三类服务:  (1)汽车集成服务。主要指汽车远程诊断服务和汽车最优控制方案服务。汽车计算平台通过CAN/LIN总线读取电子控制模块(ECM)诊断产生的故障代码,然后通过汽车网关利用无线通信技术发送至最近的汽车服务中心。汽车服务中心分析故障代码形成诊断方案并以服务的形式发送到汽车嵌入式网关,经过协议解析后再发送到汽车嵌入式计算平台,最后通过人机接口显示给驾驶员。汽车制造商同时向汽车提供下载最佳汽车控制方案的服务,以适合汽车在不同的行驶条件下运行。这些服务主要由汽车远程服务平台或汽车制造商提供。  (2)导航定位服务。运行在车载嵌入式平台上的应用层软件接收GPS接收仪发送的数据,借助车载的地理信息系统(电子地图)实现导航。此外应用层软件还可以把GPS接收的数据发送到远程汽车服务平台或第三方服务提供商,再由他们把导航信息以服务的形式发送给汽车嵌入式平台。这些服务对准确性和及时性要求比较高。如何准确高效地传递这些信息成为决定这类服务质量的关键。  (3) 个人/娱乐信息服务。汽车/家庭互动平台体系使人们可以在驾驶汽车的过程中了解家中的情况,将汽车-家庭连为一体。车载信息处理(Telematics) 系统的地位日益突出。它通过无线通信技术将安全保密信息或娱乐信息以服务(Service)的方式传递至汽车。  2 汽车嵌入式计算平台的硬件体系结构  硬件平台的设计必须根据其要完成的功能来确定。本项目是将汽车嵌入式网关集成到计算平台中,因此,计算平台要完成的功能主要为:与远程服务中心的无线通信功能;导航功能;音视频播放的功能;通过CAN/LIN总线访问车内电子控制模块的功能等。基于32位ARM内核的EP9315处理器具有良好的计算能力和丰富的外围接口,在对其做了适当的外围扩展后设计出如图3所示的汽车嵌入式计算平台。EP9315是高度集成的片上系统处理器。它拥有200MHz ARM920T处理器及支持Linux、Windows CE和其他许多嵌入式操作系统的存储器管理单元(MMU)。EP9315内置一个高性能1/10/100 Mbps以太网媒体存取控制器(MAC)及外部接口,可连接SPI、I2S音频、Raster/LCD、IDE存储外设、小键盘和触摸屏等。该器件还集成了运行速度为12Mbps的三端口USB 2.0全速主机和3个UART。PCMCIA接口的无线网卡提供远程网络的访问功能,可以实现对远程服务中心网络服务器的访问。IDE接口的电子硬盘用来存放地理信息系统,为导航软件提供电子地图。GPS接收仪通过串口与EP9315处理器相连,提供实时的车辆地理位置信息。触摸屏是人机输入界面,用来完成各种用户信息的设置。LCD显示屏和扬声器是人机输出界面,可以播放MPEG4视频或提示语音报警信息。CAN/LIN总线接口可以挂接汽车内的 CAN/LIN总线,提供对车内CAN/LIN总线的访问。基于上述硬件平台所设计的软件能很好地完成计算平台所要完成的各项功能。  3 汽车嵌入式计算平台的软件体系结构  软件平台采用嵌入式Linux设计。上文已对软件部分要实现的功能进行了一定的描述。其中导航任务是一个实时任务,而Linux不具有实时功能,因此需要改进Linux,使其支持实时任务。基于实时Linux的软件体系结构如图4所示。系统上电后,首先启动LINux操作系统,然后启动QT引擎,再启动 QT主程序。在LCD显示屏上显示各个应用程序的选择按钮,通过触摸屏按下相应的按钮,即会启动相应的应用程序。下面介绍主要应用程序的执行流程。   (1)导航应用程序。导航程序启动后,用户通过触摸屏输入旅程的起始地点和目的地点。导航软件把该起始地点和目的地点发送到导航服务中心(本项目中为无线局域网中一台计算机),并且每隔一定时间调用导航API从串口1接收GPS接收仪发送的当前车辆的实时地理位置数据,再调用通信API,通过无线网卡把该地理位置数据发送到导航服务中心。导航服务中心根据接收到的旅程起始地点和目的地点计算出最优行使路径,并且每接收到车辆位置信息时,都计算出当前车辆所在的位置,把包含当前车辆位置和应该行使路径的小范围的位置图像发送到车辆。车上的导航软件把接收到的图像在LCD上显示出来,通过该图像司机就可以了解车辆当前的位置和下一步要行使的路线。  (2)诊断应用软件。诊断服务软件启动后,该软件调用诊断API读取连接在CAN/LIN总线上的各个ECU的故障代码,然后再调用通信API把这些代码发送到汽车服务中心(本项目中是与导航服务中心相同的计算机)。汽车服务中心分析故障代码,确定出汽车的具体故障情况,把最终结果通过无线网发送到汽车嵌入式平台。汽车嵌入式平台通过无线网卡接收这些数据,诊断服务软件读取该数据,并在LCD上显示。  (3)汽车/家庭互动应用软件。当在汽车嵌入式平台上运行家庭/汽车互动系统软件时,该软件在LCD上显示家庭中的各个电器及其状态。当用户通过触摸屏发出改变某个电器状态的命令时,汽车/家庭互动软件调用家庭API函数把该命令发送到家庭网关(由社会第三方服务公司提供)。在家庭网关上运行着实现 OSGI协议的软件,该软件可以完成所接收到的命令,并把执行的结果发送到汽车嵌入式平台。  (4)安全监控软件。CCD摄像头把汽车行驶车道的图像输入到DSP处理系统,DSP处理系统对图像数据进行分析,并把分析结果送到在汽车嵌入式平台上运行的安全监控软件,监控软件分析该数据。如果汽车偏离行驶车道,监控软件则调用多媒体API通过扬声器或者在LCD上显示信息提醒驾驶员,从而实现安全监控和报警功能。

    时间:2009-03-10 关键词: 汽车 LCD Linux 控制器 嵌入式 空调 车载 电路 电源技术解析 基于 实用 atmega8 计算平台

  • 基于FPGA+PCI的并行计算平台实现

        当前对于各种加密算法.除了有针对性的破解算法,最基本的思想就是穷举密钥进行匹配,通常称为暴力破解算法。由于暴力破解算法包含密钥个数较多,遍历的时间超过实际可接受的范围。如果计算速度提高到足够快。这种遍历的算法因结构设计简便而具有实际应用的前景。   PCI总线(外设互联总线)与传统的总线标准——ISA总线(工业标准结构总线)相比,具有更高的传输率(132MBps)、支持32位处理器及DMA和即插即用等优点,用于取代ISA总线而成为目前台式计算机的事实I/O总线标准,在普通PC机和工控机上有着广泛的应用。PCI总线为满足在插卡和系统存储器中高速传输数据的要求提供了很好的途径。   PCI总线是一种独立于处理器的局部总线,因此通过PCI总线插入扩展板,利用并提升普通PC机和工控机对大规模数字信号处理的运算能力和速度是一项非常具有实用意义的工作。   随着数字技术日益广泛的应用,以现场可编程门阵列(FPGA)为代表的ASIC器件得到了迅速普及和发展,器件集成度和速度都在高速增长。FPGA既具有门阵列的高逻辑密度和高可靠性,又具有可编程逻辑器件的用户可编程特性,可以减少系统设计和维 护的风险,降低产品成本,缩短设计周期。FPGA与通用CPU相比又具有如下显著优点:   (1)FPGA一般均带有多个加法器和移位器,特别适合多步骤算法中相同运算的并行处理。通用CPU只能提供有限的多级流水线作业。   (2)一块FPGA中可以集成数个算法并行运算。通用CPU一般只能对一个算法串行处理。   (3)基于FPGA设计的板卡功耗小、体积小、成本低,特别适合板卡问的并联。   本文介绍的基于PCI总线的FPGA计算平台的系统实现:通过在PC机上插入扩展PCI卡,对算法进行针对并行运算的设计,提升普通PC机对大计算量数字信号的处理速度。本设计采用5片FPGA芯片及相关周边芯片设计实现这一并行高速计算平台,并在该平台上完成了DES和MD5等算法的加密和解密。文中通过基于MD5算法设计的加密方案(仿Yahoo邮箱的密码校验)进行暴力破解,验证了本系统的可行性以及速度快、性价比高等显著优点。   1 系统结构   系统利用普通PC机或工控机进行控制、数据流下载和结果采集,大计算量的数字运算利用IP-CORE技术并行地在FPGA中进行。将数字信号处理的算法设计为一个单元模块,并根据芯片的结构对布局和布线进行优化,该单元模块重复利用的技术被称为IP-CORE技术。在本系统中利用TP-CORE的可重复利用性,通过仲裁逻辑调度数据的分配,从而实现算法的并行处理。   1.1 硬件结构   系统中采用5片ALTERA公司的STRATIX EP1Sl0FPGA芯片,其中4片作为数字信号处理算法CORE的载体(文中称为算法FPGA);l片作为连接PC机与运算CORE的桥接芯片、加载程序、并行总线裁决和中断判决等仲裁逻辑的载体。与PCI总线的接口使用PLX公司的PCI9054芯片。系统硬件结构如图l所示。   1.2 逻辑结构   BRIDGE FPGA的程序采用自顶向下的设计方法,其逻辑结构如图2所示,按功能可分为以下部分:顶层模块PCI_FPGA_PARALLEL;与PCI9054的接口模块PCI接口;数据缓存及仲裁部分:数据缓存模块FIFO、寄存器模块regpart、数据回传模块deserial、内部总线仲裁和流控模块CORE接口等。   PCI接口部分实现与PCI9054芯片的接口时序,使得复用的地址和数据分开,产生地址空间的选取及使能信号,便于后端处理。   仲裁逻辑部分:   (1)实现对地址空间内数据缓冲区、各种寄存器的读写,以及根据配置寄存器的内容对算法CORE和桥FPGA做相应的操作(配置、启动、停止、复位等)。   (2)利用缓冲区及FIF0的队列长度信号wrusedw、rdusedw、full和empty进行数据流控制。数据由PC机下载时首先进入缓冲区,每一块算法CORE均对应一个数据下行FIFO,由FIFO当前状态来判定是否从缓冲区中取数。具体逻辑模型如图3所示。   (3)返回结果引入本地中断机制,当有正确结果产生、或无正确结果但密钥匹配完成、或系统异常状态,均产生中断信号并填写中断类型寄存器,经级联后产生向PC机的中断。中断判决如图4所示。   (4)实现与算法core间的协议逻辑,控制多种数据流的下行以及结果的返回。 2 MD5算法简介   MD5(Message Digest 5)报文摘要算法是一种应用广泛的提取数字指纹的算法标准,它由MIT的密码学专家、RSA算法的发明人之一Rivest设计发明。MD5算法结构如图5所示。   对任意长度的信息输入,MD5都将产生一个长度为128bit的输出,这一输出可以被看作是原输入报文的“报文摘要值(Message Digest)”。   MD5的特点:   (1)两条不同的报文具有相同的报文摘要值的可能性极小。   (2)对于预先给定的报文摘要值,要想寻找到一条报文,使得其报文摘要值与某个给定的报文摘要值相等,在计算上是不可能的。   (3)根据报文的摘要值,要想推测出原来的报文是极端困难的。   MD5算法被广泛地应用于网络数据完整性检查以及各种数据加密技术中。   Yahoo邮箱密码算法是基于两次MD5算法。共算法步骤如下:   stepl:对一个密码字段(例如:dfeag~hyt),用MD5算法加密:h=md5 (dfertgrhyt)。   step2:将step1所得结果转换为32Bytes的hex值:hex(h)。   step3:将step2所得结果与一个yahoo提供的chanllenge值简单级联:string=hex(h)+chanUenge   step4:将step3所得结果再进行一次MD5运算:hash=md5(strmg)。   由于未得到实际Yaheo邮箱密码生成参数(例如ch allenge码),本文构造了相近算法以测试本系统性能。   测试方案如下:   提供一个已知的challenge值与相应的Hash值,从提供的字典中提取合适密码,由生成算法计算出对应的Hash值与提供的Hash值匹配来校验匹配的密码。密钥字典的产生有两种方式:人为构造字典及系统自加、穷举产生密钥。   3 实测性能分析   实际系统中算法CORE运算时钟为20MHz,64bit数据宽度输入;采用多级流水线设计及运算速度就是系统运行时钟的速度。除运算初期流水线建立过程和运算结束时流水线完成过程,运算速度均可视为20MHz;实际制成的系统为四片算法FPGA并行运算,实际吞吐量为4×20M×16bit=1.28Gb;经Ahem Quartus 4.1综合,实际仲裁逻辑占用3725个逻辑单元。综合频率最高为156.2MHz,单算法逻辑占用7718个逻辑单元,综合频率最高为37.10MHz。   典型的普通PC机定点运算需要多个指令周期,包括取指令、取数据、计算、保存数据等指令周期,而一个x86指令周期又由多个CPU时钟周期组成,大大降低了实际运算速度。由于单个CORE以20MHz时钟流水线运算,相当于一台普通PC机的运算速度,因此多个CORE并行运算即可达到多台PC机并行运算的效率。   采取密钥字典自FPGA穷举产生方式,可发挥算法CORE的最大效能。若采取密钥字典自PC机下载方式,则实际速率由PCI总线最高速率决定。但由于字典可以人为选取,大大降低了密钥选取的盲目性。本系统接入普通PC机上32bit、32MHz的PCI总线,单算法CORE连续运算(64bit×20MHz)即可满足PCI总线全速下载。若使用64bit、66MHz的PCI总线或PCI EXPRESS,将进一步提高系统的实际吞吐量。   本文提出了一种基于FPGA的适合大规模数字信号处理的并行处理结构,利用CORE的可置换性,可以针对不同应用的数字运算设计不同的CORE,系统通用性的特点非常显著。一台普通PC机中可以同时插入数块PCI卡。每块卡上的任意一块算法FPGA都可提供相当或超过一台普通PC机的运算速度。而每增加一块算法FPGA,在效率提高一倍的前提下,功耗增加不超过10W,而体积几乎不变,成本也只是比普通PC机增加了五分之一。因此.本文提出的并行结构具有极高的性价比。   如果将PCI总线接口模块集成到FPGA中以取代PCI9054芯片,将进一步降低硬件成本,减少硬件设计的复杂度;因实际运算速度与算法的并行度和优化有密切的关系,因此,设计不同应用的CORE以及相关算法的优化是下一步要进行的重要工作。

    时间:2007-10-24 关键词: FPGA 并行 PCI 计算平台

发布文章

技术子站