当前位置:首页 > 消费电子 > 消费电子
[导读] 到底为什么我们要讨论软错误呢?诚然,这一问题在几十年前就提出来了,但问题是,相关的措施到位吗?当然,就某种程度而言,是到位的。诸如降低串扰等设计层面的措施,以及不使用硼磷硅玻璃、采用低α封装和无铅

    到底为什么我们要讨论软错误呢?诚然,这一问题在几十年前就提出来了,但问题是,相关的措施到位吗?当然,就某种程度而言,是到位的。诸如降低串扰等设计层面的措施,以及不使用硼磷硅玻璃、采用低α封装和无铅化等制造层面的手段,所有这些都显著降低了由软错误导致的出错几率。 

    问题在于,这些减少软错误的技术都无法彻底根除软错误。另外,要减少由宇宙射线引发的错误,恐怕需要筑上几英尺厚的防护掩体,而这基本上是不现实的。更糟糕的是,软错误对当今复杂系统造成影响的严重程度可能比以前对简单系统的影响高几个数量级。例如,遭遇一个特殊软错误时,当如今的一个复杂系统很可能会要求重新启动,从而严重影响服务质量(QoS)。这就是为什么起源于航空和航天应用中静态随机存取存储器(SRAM)的软错误问题如今对网络设备供应商提出越来越严峻的考验,迫使他们采用更严苛的软错误规范,并施以更严格的约束。

    随着工艺技术节点的微缩,SRAM的每百万位失效率(FIT)也在随之下降。但三重内容可寻址存储器(TCAM)的情况又怎样?在90nm节点,TCAM的故障率与SRAM基本相当,但就过去的两个节点而言,TCAM的故障率反有增加的趋向,所以我们必须对在65nm节点TCAM的故障率将超过SRAM的情况做出心理准备。另外,因故障率是以每百万位为计算给出的,所以,随着存储器容量的不断增加,该问题将进一步恶化。这种趋势非常关键,因为TCAM是网络搜索引擎中使用的一种底层技术,负责对网络信息包进行分类,并对数据包进行转发。

    对此,软错误评估工具、软错误专业服务和辐射测试服务提供商iRoCTechnologies公司总裁OlivierLauzeral指出:“SRAM和TCAM中发生的绝大多数错误都是由单粒子反转(SEU)或单点错误(SBE)引起的。因此,为确保最高水准的网络QoS,并为了符合服务等级协议,TCAM必须采用最先进的纠错码(ECC)技术。那么,这些技术具体又是怎样的呢?

    为将软错误存续时间降至最短,需要在系统中的不同层级配置纠错码(ECC)。例如,在高可靠性系统中,为确保正确的系统功能,要从自应用层起的功能链中各个环节都施加ECC。但是,在发现错误(或更准确地说是其造成的后果)的这个点上,将对QoS产生显著影响。对系统盒体级和网络系统级对错误进行持续监视并予以消除当然能够很好地避免许多灾难性的错误。但是,如果“迟”至应用级,则有可能无法对错误进行纠错。所以,在芯片级进行侦错的方法具有最高可靠性。

    问题在于:是将ECC集成进TCAM,还是在外部应用ECC?毕竟,外部ECC方法已实施多年,业内经过时间洗礼,是一种被证明行之有效的存储器纠错方法。但是,外部ECC要求系统设计师在开发所需的电路时花费更多设计时间、付出更大努力和开销,且所用的器件成本和PCB面积也更高更大。它还需要系统处理器发布命令和进行控制,但这样也会增加系统延迟,进而可能对系统性能带来负面影响。随着TCAM变得越来越大,这些不利因素(特别是性能方面的影响)将会更严重。

    将ECC集成进TCAM将免去所有这些问题。集成的ECC电路是专门为TCAM优化设计的,从而使完成相应功能所需增加的绝对门数和成本都最少。另外,ECC的工作会被器件延迟所“掩盖”,而在整个工作条件下,器件的延迟参数是具体及可预测的。另外,该设计和验证工作是由半导体厂商完成的;所以,系统设计师不必再为此劳心费力。

    正因为这些原因,IDT将ECC集成进其搜索加速器。ECC可在内核内纠正单一错误并侦测出双重错误,它还检测接口的总线奇偶性。非常重要的是,它还检测最近一直没访问过的内容以侦测“沉默”的错误。所谓“沉默错误”,就是那些直到数据被访问前一直保留并可能导致灾难性后果(例如,一个转错了的911紧急呼叫)的错误。另外,集成ECC工作在后台模式,从而不会对搜索性能产生影响。

    随着工艺技术节点的不断精进,以及TCAM变得越来越大,加之我们想方设法要从中获取更多性能方面的好处,对设备供应商来说,用于软错误纠正的集成ECC是唯一具成本效益的方案。纠正软错误不必等到“事后诸葛亮”。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

作者 Mohamad Ali| IBM咨询首席运营官 北京2024年5月24日 /美通社/ -- 生成式AI的兴起几乎在所有面向上给业务带来改变。根据 IBM 商业价值研究院最新的年度 CEO 研究,近60%...

关键字: IBM AI BSP 模型

台北2024年5月21日 /美通社/ -- 提供针对AMD WRX90和TRX50主板优化的DDR5 OC R-DIMM 提供容量128GB(16GBx8)到768GB(96GBx8),速度5600MHz到8...

关键字: AMD 内存 BSP GB

上海2024年5月20日 /美通社/ -- 2024年5月16日,世界知名的生命科学公司 Eppendorf 集团于第二十三届生物制品年会上成功举办了"疫路超越 推流出新"的产品发布会,正式推出大规模...

关键字: RF PEN BSP IMAC

May 20, 2024 ---- 据TrendForce集邦咨询研究,三大原厂开始提高先进制程的投片,继存储器合约价翻扬后,公司资金投入开始增加,产能提升将集中在今年下半年,预期1alpha nm(含)以上投片至年底将...

关键字: 晶圆 HBM 存储器

北京2024年5月20日 /美通社/ -- 过去五年里,支付和收款方式日新月异,其发展和变化比过去五十年都要迅猛。从嵌入式数字商务的出现,到"一拍即付"的...

关键字: VI BSP PAY COM

华钦科技集团(纳斯达克代码: CLPS ,以下简称"华钦科技"或"集团")近日宣布致敬 IBM 大型机 60 载辉煌历程,并将继续实施集团大型机人才培养计划。

关键字: IBM BSP 研发中心 PS

助力科研与检测新突破 上海2024年5月15日 /美通社/ -- 全球知名的科学仪器和服务提供商珀金埃尔默公司今日在上海举办了主题为"创新不止,探索无界"的新品发布会,集中展示了其在分析仪器领域的最...

关键字: 质谱仪 BSP DSC 气相色谱

上海2024年5月16日 /美通社/ -- 2024年5月10日至5月13日,富士胶片(中国)投资有限公司携旗下影像产品创新力作亮相北京P&E 2024。在数码相机展览区域,全新制定的集团使命"为世界绽...

关键字: 富士 数码相机 影像 BSP

贝克曼库尔特目前已成为MeMed Key免疫分析平台和MeMed BV检测技术的授权经销商 在原有合作的基础上,继续开发适用于贝克曼库尔特免疫分析仪的MeMed BV检测 加州布瑞亚和以色列海法2024年5月16日...

关键字: BSP IO 检测技术 免疫分析仪
关闭
关闭