当前位置:首页 > NPU
  • 戴上口罩为什么手机还能认出你?原来全靠它?

    戴上口罩为什么手机还能认出你?原来全靠它?

    近日,鉴于戴口罩后有时让人难以辨认,日本一家印刷企业推出名片口罩,上面印有戴口罩者的信息。日媒称,这种名片口罩用棉布制作、清洗后可重复使用,目前有三种款式供选择:“客户服务”口罩上印有使用者的姓名以及公司名称等,“推销”口罩突出显示使用者姓名,此外还有印制公司标志和个人证件照片的口罩,售价约合94元人民币。 疫情的到来,让人脸解锁功能低下了高贵的头颅。 当口罩成为我们出街必备的单品,在解锁手机时,我们总要经历‘人脸识别失败’—‘输入密码’的繁琐过程。这不由得让人怀念起指纹识别的好。 为了优化人脸解锁的体验,今年早些时候国外创业者 Danielle Baskin 推出了一款带有面部信息的口罩。该产品通过提取用户的面部信息,然后印在口罩外侧,用户戴上口罩后就可以拼凑成完整的脸部。 不过这个产品的解锁成功率尚不明确,并且没有大量的样本验证。那么如何让人脸识别系统,不再被口罩困扰呢? 一些网友渐渐发现,随着戴口罩的时间越来越久,手机似乎在一次次人脸解锁失败中找到了‘经验’,逐渐能够识别成功戴着口罩的自己。 靠着这个思路,一些科技博主也分享了更高效的教程,比如戴着口罩反复解锁,人脸识别不成功就立即输入密码,循环这个动作 30 分钟左右,手机便能识别出戴着口罩的自己了。 不过在实践的过程中,网友们表示不同机型的‘学习’速度不一。有人将上述动作重复了 20 分钟便已成功,但有的人重复了上千次,手机仍然无法识别戴着口罩的自己。 为什么会出现这种情况呢?其实答案关乎手机的 AI 学习能力。 深度学习利器——NPU 如果你有关注近两年的手机发布会,你一定发现了手机厂商们在介绍 SoC 芯片时,都会重点提到 NPU 的升级。 所谓 NPU,就是指神经网络处理器。在一个手机芯片中,一般会分为几个功能区,发布会常提的有三个:一是擅长处理繁复任务和发号指令的 CPU,二是擅长图形处理的 GPU,再者就是擅长处理人工智能任务的 NPU。 虽然 NPU‘占地’没有 CPU 和 GPU 大,但其能力却不容忽视,一台手机的智慧程度,主要依赖它。 我们可以对 NPU 期待什么? 虽然移动端 NPU 在近两、三年才开始被厂商宣传,实际上和它相关的概念在 2013 年就已出现。 当时,高通希望通过一种模仿人脑的计算结构,缩小普通机器运算与人脑之间的差距,这种通过模拟神经元的运算处理器,被高通称之为‘Zeroth’。 在当前的软件生态下,移动端 CPU 和 GPU 的提升,对于用户日常使用来说已经感知不强了。比如一台 iPhone XS 和一台 iPhone 12 相比,在应用的流畅性上几近一致。更加影响用户体验的,是机器学习能力的变化。这也是为什么我们要关注 NPU 的发展。 或许再过十年,当 AI 技术发展地更为成熟,‘智能’手机是时候改名为‘智慧’手机了。更多详细信息,我们拭目以待,大家对此 还有哪些进一步的看法呢?欢迎留言讨论哦!

    时间:2020-11-17 关键词: 人脸 CPU npu

  • 人工智能的又一个微小进步_麒麟970:人工智能芯片NPU_亲测Mate10手机麒麟970性能

    人工智能的又一个微小进步_麒麟970:人工智能芯片NPU_亲测Mate10手机麒麟970性能

    人工智能的又一个微小进步 人工智能时代是信息化时代的延续和新生,今天在这个领域的每个微小的进步都会累积起来,直到再为我们推开一扇伟大时代的大门。 人类在出生时近1000亿个大脑神经元就已经产生和分化好,并且处在它们该存在的位置,等着建立神经网络。这时候的神经元还没有多少触突,相互之间也没有多少链接,新生儿的神经触突数不到成年人的三分之一。在婴幼儿的成长发育过程中,神经元迅速伸出触突,彼此建立起非常复杂的链接,相连的神经元可以传递电和化学信号,接近三岁的时候,触突的数量达到顶峰,此时的数量是成人的二倍,这段时间也正是人类学习和认知最快的时期,我们基本的生存技能,比如语言、图像识别和分类、运动都要在这个时候建立起来。此后的时间里,大脑不断优化和修剪神经元的链接,让信息的处理更加高效。在神经网络的建立过程中,链接的建立是随机的,但是修剪不是随机的,大脑不断根据外界信息和反馈来完成。最终形成的神经网络复杂且能高效处理数据,即便是相同环境里成长起来的同卵双胞胎也会有完全不同的两个大脑。 模仿生物神经系统建立的神经计算网络,基本原理就是一层一层处理和过滤信息,每一层的基本运算都很简单,无非是用加法和乘法来完成矩阵运算,但是运算中的各种参数因子是个未知数,只能让神经网络通过大量的数据来自己学习,这个学习的过程和孩子学习识图是一样的,大量各种形态的图像数据输入,对最终输出做出纠正,一旦发现输出错误就回退尝试新的参数设定,直到找到复合要求的输出。所以神经网络只关注于问题「可解」,并不强调「最优解」,每次解决和处理问题,都可以进一步优化网络参数,让网络适应更复杂的数据输入。 一直到2016年,GoogleDeepmind团队的AlphaGo战胜了职业九段李世石,才在世界范围内掀起了对人工神经网络的关注。这是一场彻底的胜利,AlphaGo的研发者并不懂围棋,打开AlphaGo程序也没人读得懂里面天书一样的各种参数,AlphaGo完全是靠自己学习围棋来达到了战胜人类的能力。最初的AlphaGo以CPU+GPU为运算单元,随着运算量的增加,GPU毕竟不是专为神经网络计算而设计,Google为了提升效率而自行设计了计算单元TPU。TPU是专为深度学习框架TensorFlow而定制的,改用TPU的AlphaGo提升更快,仅靠单机4个TPU就在随后的比赛里碾压了所有人类顶级棋手。

    时间:2020-08-03 关键词: 人工智能 麒麟970 npu

  • ExynosAuto将成为首款内置NPU模块的三星芯片

    ExynosAuto将成为首款内置NPU模块的三星芯片

    ExynosAuto将成为首款内置NPU模块的三星芯片。NPU在汽车上可用于分析车内图像传感器接收到的图像信号。因此,它能够帮助构建更高效的ADAS(高级驾驶员辅助系统),ADAS可用来识别车道和障碍物。 1月初,三星正式发布了新一代旗舰芯片Exynos 9810,综合素质已经有领先高通骁龙845的趋势。在成功研发手机芯片之后,三星也计划推出首款汽车芯片,或命名为Exynos Auto。 根据韩媒ETNews的报道,三星电子LSI事业部正在开发名为“Exynos Auto”的汽车芯片,计划在今年年底前量产,并将供应给奥迪、哈曼等公司,后者已成为三星子公司。三星Exynos Auto将内置人工智能(AI)芯片NPU,并支持4G LTE网络。 三星Exynos Auto的目标是满足国际汽车功能性安全标准ISO 26262的ASIL-B级。ASIL的全称为汽车安全完整性等级,共有A到D级,其中D是最高级。由于Exynos Auto主要用于汽车上的信息娱乐系统、数字仪表板和HUD(平视显示器),所以只需要满足B级就够了。 早在2017年1月,三星就曾为奥迪汽车提供过芯片,不过当时的产品是基于智能手机芯片修改而成,而Exynos Auto则明显是针对汽车进行开发。 目前三星在汽车系统半导体市场的竞争对手为恩智浦、瑞萨和英飞凌等传统汽车芯片厂商,类似于手机和PC领域的竞争对手高通和英特尔。 而在今年1月的CES2018上,三星也发布了首个自动驾驶平台DRVLINE,其特点是内置了AI助手Bixby和哈曼卡顿扬声器,预计也将和Exynos Auto一样提供给第三方汽车厂商使用。 值得一提的是,三星在手机SoC领域的竞争对手高通也早已开发汽车芯片。这家美国巨头曾在CES 2014上推出过首款汽车芯片骁龙602A(A代指Automobile,即汽车);而在CES2016上,也推出过名为骁龙820A的升级产品。看来半导体市场的激烈竞争已经从手机蔓延到了汽车领域。

    时间:2020-07-28 关键词: 三星电子 人工智能 npu

  • NPU致力于量子计算芯片的研发,AI芯片突破新进展

    NPU致力于量子计算芯片的研发,AI芯片突破新进展

    阿里将在两三年内推出量子计算芯片,“为人工智能提供无限的计算能力”。 刚刚,阿里巴巴集团CTO、达摩院院长张建锋在杭州云栖大会宣布,阿里神经网络芯片AliNPU将于明年6月发布。 此外阿里宣布,新成立一家半导体公司“平头哥”,致力于量子计算芯片的研发。张建锋透露,阿里将在两三年内推出量子计算芯片,“为人工智能提供无限的计算能力”。 AI芯片新进展 张建锋在今天的大会上,回顾了达摩院成立一年以来的进展。 目前阿里达摩院已经构建了“4+X”实验室,也就是:机器智能、数据计算、机器人、金融科技和X,一共五个实验室,聚集了300多位研究人员,分支机构遍及全球8个城市。 张建锋表示达摩院的主要任务非常简单:数据从哪来,人工智能怎么处理这些数字?“达摩院就是要打破人工智能的黑盒子,真正解决AI面临的根本问题”。 他也描绘了阿里的AI架构:ABCDE。A代表算法,B代表大数据,C代表计算,D代表领域,E代表生态系统。 “我们不缺数据,”张建锋表示未来数据会越来越多,如何低成本高速完成计算成为一个很大的挑战,而达摩院就更加关注底层的算法、算力。 为了获取丰富的计算力,为了获取更多的数据,这些都跟阿里巴巴的芯片策略有关。张建锋表示阿里要做两类芯片。 第一类是NPU(神经处理芯片),加强数据处理能力。AliNPU今年4月首次对外披露。 据介绍截至上周,AliNPU团队已经完成所有的芯片指标的检测验证,明年4月正式流片。明年6月,阿里巴巴的第一款神经处理芯片正式亮相。 “我们各类指标应该是全球最领先的,”张建锋表示阿里NPU实现了10倍的深度学习推理性能提升,40倍的系统总体性能功耗比。不过他没有明确表示比较的对象。 第二类是嵌入式芯片。主要用于更多的数据获取。这里包括全兼容RISC-V的CK902芯片等。 而达摩院还面向未来,布局了量子计算。 去年阿里发布了太章,模拟了81比特的随机量子电路。这个研究意义在于,量子计算要变成现实,第一要有芯片,第二要有应用场景,在真正的量子芯片出来之前,要有工具进行模拟。 张建锋表示,阿里达摩院很快会完成量子实验室的建设,准备做量子芯片。“我们希望在两三年内,真正做一款量子芯片出来。” 除了芯片之外,达摩院还要研究量子计算系统和应用等。希望能和阿里的平台融合,为人工智能系统提供无限的计算能力。 为了推出量子芯片,阿里成立了新公司“平头哥”。确实就是这个名字,平头哥半导体有限公司。 这个名字,是来自非洲大草原的一种动物,名叫蜜獾,体型不大,但拥有技巧,且胆量超群。团队是希望借此名称,在艰难的“创业”里程中激励大家。 无论是NPU还是量子芯片,都是阿里巴巴在AI计算领域的最新布局。 刚刚,马云向制造业下了战书 讲了数年新零售的马云,终于把矛头调转到了零售的上游:制造业。 1、什么是新制造? 马云先提了一个观点:制造业不会消失,落后的制造业一定会消失。 IT时代诞生制造,DT时代诞生创造;IT时代依赖知识, DT时代依赖智慧。许多公司要做平台,其实平台不是公司做的大才能做平台,而在于有没有利他精神:只有让别人做得更好,你才能成为平台。 那到底什么是新制造呢?制造业用互联网营销、简单加一个芯片不代表新制造,未来成功的制造业一定是用好互联网、物联网、云计算、大数据的新型制造业企业。 2、个性化 工业时代考验的是生产一样东西的能力,数据时代是生产不一样东西的能力,20年前流行全城市的姑娘船一样的衣服,现在流行每个姑娘穿不一样的衣服。 3、数据是新能源 衡量制造业的发达程度,以前是看电力指数,未来看数据要看计算指数。 物联网、数据的应用,像蒸汽机、石油改变制造业一样,将会改变现在的制造业。我们有很多摄像头、数据,但没有计算能力、没有AI,这些摄像头只能用来罚款,是数据的浪费。 4、旧制造要凉 不拥抱新制造的企业如同盲人开车,你都不知道谁是你的客户,你的客户需要什么。 未来的制造业不是流水线工人,是专家是在写代码。 5、制造业不创造就业 有人说,复兴制造业以创造就业,但我们不能寄希望于制造业创造就业,未来的制造业都是机器人,未来创造就业的是现代服务业,制造业中流水线的工作都是标准化的,机器都可以取代,但是体验、服务、创新创造,这些东西机器未必能取代。 6、做好贸易战打20年的准备 另外,马云也毫不避讳的提到了贸易战。马云说,面对贸易战,他强任他强,月亮照大江 。制造业不可能在两个月、两年解决,要做好20年的长期思想准备。 或许,这里应该恭喜一下刚迈进职场的年轻人。 7、落后利益群体:国家不会保护你 对于那些每天叫嚣着“互联网让实体经济衰落”的“落后利益群体”,马云开了一枪: 过去十年零售业面临的巨大痛苦,很快会降临到制造业。国家不会因为你是实体保护你,而是因为你是未来保护你。

    时间:2020-06-26 关键词: 芯片 AI npu

  • Galaxy S10有望首发 三星7nm Exynos芯片曝光:集成双核NPU

    Galaxy S10有望首发 三星7nm Exynos芯片曝光:集成双核NPU

    三星的7nmLPP制程已经投入量产,无疑,其新一代移动SoC和高通的5G基带等芯片将率先得以出货。韩媒ETnews报道称,三星将在新一代7nmExynos旗舰芯片上集成双核NPU单元,而且是第二代产品,从而大大增强AI场景的负载能力和处理速度。据悉,三星此前已经研制了第一代NPU,年初的Exynos79610最早集成。 有爆料人补充,双核NPU将为GalaxyS10的ISP(图像处理器)增光添彩,进一步提升拍照、视频录制、声控等功能的体验。 目前,竞争对手华为、苹果等,都在NPU上开疆拓土。以A12芯片为例,NPU升级为8核,每秒可处理5万亿次,使得FaceID解锁、拍照、系统运行速度等得到不同程度的升级。 按照上周TheBell的说法,S10有望在2月25日开幕的MWC2019上发布。 本文来源:快科技

    时间:2020-06-24 关键词: 三星 7nm npu

  • 阿里巴巴将于今年发布首款自研NPU,称性能领先10倍

    阿里巴巴将于今年发布首款自研NPU,称性能领先10倍

    阿里达摩院首款自研NPU来了,性能领先10倍。昨天,在阿里云峰会上,新上任的阿里巴巴CTO、阿里总裁张建锋表示,达摩院成立三年以来,在芯片端特别是IOT端嵌入式芯片发展非常快,至今已经有 1100 名员工,去年销售芯片更是超两亿片。 张剑锋表示,去年,达摩院销售芯片超两亿片,还带来了一个重磅消息,今年阿里巴巴即将正式发布自己研发的第一款NPU,很快就会流片,这个性能在这个同等芯片里面都是非常非常领先的,拥有领先10倍以上的性能。 阿里巴巴成立于2017年10月。当时,其表示,三年内在技术研发上的投入将超过1000亿人民币。去年9月,阿里巴巴宣布成立芯片公司“平头哥半导体有限公司”,该公司分别由阿里收购的国产芯片企业中天微与其旗下达摩院芯片团队整合而成,主要面向智联网芯片平台,其中包括汽车、家电、工业等领域。 此外,该公司计划在今年4月发布第一款AI神经网络芯片,2-3年后打造出一款真正的量子芯片。值得一提的是,阿里云在本次大会上延续了一贯的传统——降价。据介绍,阿里云全线产品包括ECS云服务器、块存储、高速通道、ENS边缘计算节点、CDN等都有不同幅度的降价。 本文来自PConline,此次作为转载分享。

    时间:2020-06-09 关键词: 阿里云 阿里巴巴 嵌入式芯片 npu

  • 恩智浦首次推出带有专用神经处理引擎的i.MX应用处理器,支持边缘计算

    恩智浦首次推出带有专用神经处理引擎的i.MX应用处理器,支持边缘计算

    美国内华达州拉斯维加斯——(CES 2020)——2020年1月7日——恩智浦半导体今日宣布推出i.MX 8M Plus应用处理器,进一步丰富其业界领先的EdgeVerse产品组合。这是恩智浦首个集成了专用神经处理引擎(NPU)的i.MX系列处理器,能够在工业和物联网等领域实现边缘端高级机器学习推理。i.MX 8M Plus提供2.3TOPS算力(每秒兆级操作)的高性能NPU、主频高达2GHz的四核Arm®Cortex-A53子系统、主频可达800MHz的基于Cortex-M7的独立实时子系统、用于进行语音和自然语言处理的高性能800MHz音频DSP、双摄像头图像信号处理器(ISP)和用于丰富图形渲染的3D GPU。通过将高性能的Cortex-A53内核与NPU相结合,边缘设备将在少量或无人为干预的情况下支持机器学习和推理输入,从而在本地端做出明智的决策。经济高效的i.MX 8M Plus的应用范围涵盖人与物体对象识别,通过自然语言处理支持公共安全、工业机器视觉、机器人、手势与情绪检测,从而以超快的响应时间和高准确率实现人与设备之间的无缝交互。恩智浦消费和工业市场i.MX应用处理器副总裁兼总经理Martyn Humphries表示:“随着技术进步助力更加准确的本地决策的实现,边缘端成为部署机器学习应用的理想目标位置。恩智浦与消费和工业物联网市场中的领先企业建立了良好的合作关系,将基于i.MX 8M Plus设计和开发出创新型的产品。在‘智慧’边缘转变为‘智能’边缘的过程中,i.MX 8M Plus是重要的里程碑式产品,它将成为处理解决方案的潮流引领者。”以沉浸式多媒体功能推动智能边缘设备发展恩智浦i.MX 8M Plus采用先进的14nm LPC FinFET工艺技术,可同时执行多个高度复杂的神经网络,如多对象识别、超过40000个英语单词的语音识别和医疗成像。强大的NPU能够处理Mobilenet,这是一种热门的图像分类网络,分类速度超过每秒500个图像。开发人员可将机器学习推理功能的负载转移到NPU,让高性能Cortex-A和Cortex-M内核、DSP和GPU执行其他系统级或用户应用任务。视觉部分集成了双ISP,并支持高动态范围(HDR)和鱼眼镜头校正。ISP支持两个用于实现实时立体视觉的高清摄像头或单个12兆像素分辨率摄像头。这些功能为监控、智能零售应用、机器人视觉和家居健康监测仪等实时图像处理应用提供支持。为支持语音应用,i.MX 8M Plus集成了高性能HiFi 4DSP,通过对语音流进行预处理和后处理来增强自然语言处理性能。强大的Cortex-M7内核可用于运行实时操作系统,而应用处理器可以执行复杂的非实时应用,通过关闭应用处理器,同时只让Cortex-M内核保持运行状态以进行唤醒词检测,可降低总体系统级功耗。凭借可使用H.265或H.264HD视频编解码器(支持云流媒体传输或本地存储)压缩多个视频输入的系统以及由3D/2D图形、带有Dolby Atmos®和DTS:X®的Immersiv3D音频支持的丰富用户体验,i.MX 8M Plus能够扩展支持高级多媒体和视频处理能力。提高工业物联网的智能程度i.MX 8M Plus能够提高工业生产力和自动化,可检测、测量、精确识别对象并通过准确检测机器操作异常情况实现对设备的预测性维护。此外,通过将准确的人脸识别、语音/命令识别和手势识别相结合,工厂人机界面可以更直观、更安全。i.MX 8M Plus支持工业4.0IT/OT融合,将千兆以太网与时间敏感型网络(TSN)相集成,结合Arm Cortex® M7实时处理功能,提供确定性有线网络连接和处理。为满足工业应用所需的高质量和可靠性要求,i.MX 8M Plus提供适用于内部存储器和DDR接口的纠错码(ECC)功能。该系列符合严格的工业温度应用范围(-40℃到105℃环境温度)和通电配置(100%通电)要求,并计划纳入恩智浦的行业领先持续供应时间承诺(15年)。技术规格·计算内核:主频高达2.0GHz的四核Arm®Cortex-A53和主频高达800MHz的Cortex-M7·机器学习:高达2.3TOPS算力的神经处理引擎(NPU)·音频和语音处理:以800MHz速度运行的低功耗Tensilica® HiFi4DSP·双图像信号处理器(ISP):分辨率高达12MP,具有2个MIPI-CSI摄像头接口·视频处理:1080p视频编/解码,支持H.265和H.264标准·GPU:支持OpenGL® ES 3.1、Vulkan®、Open CL 1.2FP和OpenVG™ 1.1的3D/2D图形·内存支持:在内部存储器和DDR总线上实现纠错码(ECC)功能、高达4.0GT/s的32/16位DDR3L、DDR4、LPDDR4·多个音频接口:TDM、DSD512、S/PDIF、PDM麦克风输入、eARC和ASRC。·显示屏:HDMI 2.0b Tx、MIPI DSI、LVDS(4/8通道)Tx·有线连接:支持AVB、IEEE 1588、EEE的2个千兆以太网、支持TSN的1个千兆以太网、2个CAN-FD、带有PHY Type C和PCIe Gen3的2个USB 3.0/2.0OTG·恩智浦系统PMIC的电源管理解决方案(PCA9450C),针对i.MX 8M Plus应用处理器进行了定制和优化。产品上市时间和演示恩智浦预计将于2020年第一季度开始向客户提供i.MX 8M Plus应用处理器样品。2020年国际消费电子展(CES 2020)将于1月8日至11日在拉斯维加斯举办,公司届时将在CP-18展台展示i.MX应用处理器系列。有关详细信息,请联系当地的恩智浦销售代表。

    时间:2020-01-08 关键词: 应用处理器 边缘计算 npu

  • 可以卖给中国!ARM发布全新Ethos NPU:华为会用吗?

    可以卖给中国!ARM发布全新Ethos NPU:华为会用吗?

    10月23日,在北京召开的2019 ARM技术峰会上,ARM正式发布了全新的Ethos-N77/N57/N37系列NPU IP,进一步加码人工智能(AI)计算。 与此同时,ARM还推出了针对主流移动游戏市场的高能效的Mali G57 GPU和针对主流及入门级市场的单位面积最高效的Mali-D37 DPU。 ARMv8及后续架构将不受限制的继续支持中国合作伙伴! 今年9月25日,ARM中国在深圳召开媒体沟通会,针对此前外界盛传的“ARM断供华为”一事,ARM表示与华为仍是合作伙伴,ARMv8及后续指令集可继续授权! 10月23日,在2019 ARM技术峰会北京站上,ARM董事长兼CEO吴雄昂在开场致辞当中再度重申,经过法务严谨的调查及相关调整,目前无论是ARMv8,还是后续的架构都是源自英国的技术,将可不受限制的继续支持中国的合作伙伴! 此外,吴雄昂还指出,ARM在中国的合作伙伴已经超过200家,中国合作伙伴出货的基于ARM架构的芯片已超过了160亿颗,国产SoC芯片95%都是基于ARM架构的。 吴雄昂强调,ARM是唯一非源于美国的主流计算架构。ARM中国承接ARM在中国的业务和技术,在ARM标准之下自主创新、赋能产能,把中国工程师能力调动起来打造知识产权。这些知识产权将不只是提供给中国产业,还要通过统一标准面向全球。 加码AI计算,ARM发布Ethos系列NPU IP 根据ARM及研究机构的预计,到 2028 年,移动设备的数量将从现在的17亿台增长到 22 亿台,智能的IP Camera将由现在的1.6亿台增长到13亿台。在终端侧具有人工智能的设备将会由现在的3亿台增长到32亿台。足见人工智能市场增长之迅速。 而随着AI技术的兴起和广泛应用,AI对于芯片的算力也提出了更高的要求。作为全球最大的处理器IP供应商,ARM的Cortex CPU和Mali GPU在以智能手机为代表的移动终端市场占据了极大的市场份额,但是在AI计算领域,ARM此前一直都是依托于其Cortex CPU、Mali GPU及相关软件开发工具来提升其AI计算的能力。 但是,传统的CPU、GPU核心并不是AI计算的最佳载体。因此越来越多的芯片厂商开始推出了AI专用芯片,或者在SoC当中加入AI计算专用的NPU内核。 比如华为2017年就率先推出了集成NPU内核的麒麟970处理器,同时苹果推出的A11处理器也首次集成了NPU内核。此后,高通、联发科、三星、展锐等手机芯片厂商也纷纷开始在SoC当中集成自己的NPU内核。 在此趋势之下,为了应对市场对于AI内核的需求,ARM在2018年年初也公布了针对AI的Project Trillium项目,其中就包括了全新的机器学习处理器IP、目标检测处理器IP和神经网络软件库。经过了近两年的时间,现在Project Trillium项目的成果也开始正式产品化。 ▲ARM市场营销副总裁Ian Smythe 今天,ARM市场营销副总裁Ian Smythe在ARM技术峰会上正式发布了全新的Ethos系列NPU IP,包括针对高端市场的Ethos-N77、针对主流市场的Ethos-N57和低端市场的Ethos-N37。 Ethos-N77实际上就是ARM去年公布的Project Trillium项目中的那款机器学习处理器IP,其内部集成了可配置的1-4MB的SRAM,在1GHz主频下,7nm工艺下,可以提供最高4 TOPS的AI算力,每瓦性能高达5 TOP。另外,之前Proj m项目公布的数据显示,Ethos-N77的单位面积算力为4.6 TOPs/mm?(最新发布的可能有进一步提升)。 那么Ethos-N77的这个性能在市场上处于什么水平呢? 根据资料显示,华为麒麟970 NPU是基于寒武纪1A IP,算力是1.92TOPS。而苹果A11的NPU算力仅为 TOPS,A12的NPU性能为5TOPS。而根据此前高通骁龙855发布之时的数据显示,其整体(包括CPU+GPU+DSP等)的AI算力(超过7 TOPS)是华为麒麟980的两倍,照此估算的话,0.6麒麟980的NPU性能大概在3.5 TOPS左右。 另外据了解,华为麒麟980的NPU是基于寒武纪IH8,是针对低功耗场景视觉领域的NPU内核IP,而寒武纪IH8有 4 种可选的配置1T、2T、4T、8T OPS@1GHz,麒麟980应该是4TOPS的版本。而麒麟990系列的NPU并未公布具体的OPS数据,不过其采用了全新的达芬奇架构以及两个大核+一个小核的配置,性能应该更强。 在单位面积的算力方面,根据芯智讯此前的估算,麒麟970的NPU的单位面积性能大概是1.48 TOPs/mm2,而麒麟980和990没有相应数据可以参考。而根据TechInsights的拆解,苹果A12的NPU内核的面积为5.79mm2,也就是说苹果A12的NPU的单位面积算力约为0.86TOPS/mm2。 在每瓦算力方面,华为公布的资料显示,麒麟810的每瓦算力可以达到6TOPS。苹果的NPU未有相应数据。寒武纪新的NPU内核1M在7nm下每瓦性能为5TOPS。 从上面的数据对比来看,Ethos-N77的AI性能与苹果A12和麒麟980的NPU相当,相比麒麟990系列的NPU性能可能要弱一些。在单位面积算力方面,远高于苹果A12和麒麟970的NPU。在每瓦算力方面,也是远高于苹果A12的NPU,略低于麒麟810。 综合来看,ARM Ethos-N77各方面都还是比较出色的,达到了目前旗舰级NPU的水准。 需要指出的是,4 TOPS的性能是单个Ethos-N77核心在1GHz主频下的性能,如果配置双核的话,那么性能无疑将进一步提升,当然功耗和面积会进一步提升。 ARM此前就表示,Ethos系列IP是具有高可扩展性、兼容性和可编程的,可以提供计算性能最低从2 GOPS到超过70 TOPS的产品。 另外,ARM还推出了针对主流市场的Ethos-N57,内置了512KB SRAM,在1GHz主频下,算力最高可达2TOPS;而针对低端市场的Ethos-N37,是为了提供面积最小的ML推论处理器(小于1mm?)而设计,其同样也内置了512KB SRAM,在1GHz主频下,算力可达1TOPS。 ARM表示,Ethos-N57和Ethos-N37针对Int8与Int16数据类型的支持性进行了优化,通过如创新的Winograd技术的落地,使性能比同类NPU提升超过200%,并且配备了先进的数据管理技术,以减少数据的移动与相关的耗电,在ML在性能与成本、面积、带宽与电池寿命之间达成了比较好的平衡。 据芯智讯了解,除了移动市场之外,ARM的Ethos系列IP未来也将会开始进入物联网、工业、汽车、网络以及服务器市场。 开源的AI开发框架ARM NN 我们都知道,此前高通骁龙845/855系列都并未内置专门的NPU内核,但是其仍然提供了较高的AI能力,而这一切得益于其神经网络引擎Neural Processing Engine的助力。即采用更为弹性的异构的机器学习架构,在通用平台内做内核优化,使得AI计算合理的分布在CPU、GPU、DSP等每个单元上,从而可以针对不同移动终端提供弹性调用各个处理单元来进行AI计算。 而ARM此次在发布Ethos系列NPU IP的同时,也推出了开源AI开发框架ARM NN,强化异构的AI计算,进一步提升整体的AI性能。 据介绍,ARM NN是属于偏底层的架构,而且在其基础之上,可以支持其他的更高层级第三方的NN框架,并提供完整工具链,可实现在AI计算上对于ARM CPU/GPU/NPU内核的合理调用,实现更高效的异构的AI计算。 ARM表示,由于不同的SoC对于AI的加速方法是不一样的,因此第三方应用及开发者要用到片上系统的加速能力是比较困难的。而开源的ARM NN的推出,将降低开发者调用ARM内核的难度,进一步提升开发人员的体验。 此外,为了推进基于ARM NN的内容创建和开发,ARM还与Unity(Unity最目前主要的3D引擎,50%的3D游戏,75%的VR内容都是基于Unity引擎开发)达成合作,进一步优化Unity引擎,使得基于Unity的开发者能够更容易的访问和更高效的利用ARM的内核,在ARM CPU/GPU/NPU之间获得更好的性能。可以实现一次开发,即可获得ARM全系列的内核的支持(即可支持众多基于ARM不同类型的内核的SoC),无需再重新编译。 Mali G57 GPU:为主流市场带来智能与沉浸式体验 今年6月,ARM针对高端市场推出了首款基于全新Valhall架构的GPU—;—;Mali-G77。今天,ARM针对游戏市场推出了第二款基于Valhall架构的高性能、高能效的GPU内核—;—;Mali-G57。(Vahall架构进一步提升了并行执行的能力,同时在代码上也做了尽量的简化,从编译角度来讲也更加友好。) 据介绍,Mali-G57的性能相比上一代的Mali-G52在能效上提升了30%,性能密度提升了30%,机器学习性能提升了60%。并且Mali-G57还加入了针对虚拟现实(VR)提供注视点渲染支持,再加上机器学习性能的提升,可以支持更复杂的XR实境应用。而且,Mali-G57还支持1-6个核心的配置,可以满足不同市场定位的智能手机的需求。 ARM表示,Mali-G57可以将优质的智能与沉浸式体验带到主流市场,包括高保真游戏、媲美电玩主机的移动设备图型效果、DTV的4K/8K用户接口,以及更为复杂的虚拟现实和增强现实的负荷。 Mali-D37:ARM单位面积效率最高的DPU 在今天的技术论坛上,ARM还推出了目前单位面积最高效的显示处理器Mali-D37。 据介绍,Mali-D37是ARM第一个面向主流市场的基于Komeda架构DPU,拥有极高的单位面积效率,在支持全高清(Full HD)与2K分辨率的组态下,16nm制程的面积将小于1mm?。 在性能方面,Mali-D37保留了高阶的Mali-D71关键的显示功能,包括与Assertive Display 5结合使用后,可混合显示高动态对比(HDR)与标准动态对比(SDR)的合成内容。另外,Mali-D37其通过将部分GPU核心显示的工作负载卸载到Mali-D37来工作,以减少GPU的工作以及对于内存的访问,使得系统的功耗可以降低30%。 ARM表示,Mali-D37可以支持入门级智能手机、平板电脑等成本较低的设备,获得2K级别的视觉效果与性能支持。 ARM的通用型NPU能否获得成功? 从目前的市场趋势来看,AI芯片正越来越向专用化的方向发展,越来越多的算法厂商也都纷纷基于自身的算法推出了自己的AI芯片。同样,正如前面我们所提到的,目前华为、苹果、高通、三星、展锐等众多的手机芯片厂商也都有推出自己的NPU内核。那么ARM的“通用型”的Ethos NPU IP真的有市场吗? 对此,ARM市场营销副总裁Ian Smythe表示,ARM的Ethos NPU IP并不是孤立存在的,其主要的优势在于,在其本身提供出色的AI性能的同时,可以更好与ARM的CPU、GPU进行协同,以实现异构的AI计算,从而进一步提升整个系统层级的AI性能、降低功耗。而且,目前AI市场还是在初期,很多的AI算法仍在快速迭代,选择“通用型”的NPU是比较安全的做法。 在采访当中,Ian Smythe向芯智讯确认,ARM的Ethos NPU IP也可被集成于比如RISC-V等其他架构的SoC当中,但是Ian Smythe也强调,这样并不能发挥出Ethos NPU与其它非ARM CPU/GPU在AI计算上的协同优势。 另外,ARM的Ethos NPU IP还实现了对于高中低阶的全面覆盖,但是目前众多的芯片厂商主要还是在其高端SoC当中集成了NPU,而随着AI计算向边缘侧部署的趋势,未来市场对于NPU的需求也将会越来越大。Ethos NPU IP的推出,将可帮助芯片设计厂商更简单、更低成本的获得不同档位的NPU内核的支持。 另一方面,目前的Android应用生态基本都是基于ARM架构的处理器,因此,如果采用ARM的Ethos NPU IP,结合开源的ARM NN框架,应用开发者将可以更简单、高效的调用ARM的CPU/GPU/NPU内核,可以为用户带来更为出色的AI体验。而且,可以实现一次开发,即可获得ARM全系列的内核的支持(这也意味着,可支持众多基于ARM不同类型的内核的SoC),无需再重新编译。而对于其他的芯片厂商的NPU来说,开发者要想实现灵活高效的调用NPU,充分发挥其AI性能,则需要针对性的进行优化,而且还需要其提供相应的权限和工具。即便是开发者开发应用实现对于A厂商的NPU调用,同样的应用要想实现对于B厂商NPU的调用,可能需要重新进行编译。显然,对于应用开发者来说,ARM的NPU所具备的生态优势无疑是其他厂商所无法比拟的。 最后,Ian Smythe强调,ARM对于AI性能的提升是多维度的,一方面会持续推出更高性能的NPU IP,同时也在不断提升ARM CPU/GPU的AI性能。 值得一提的是,Ian Smythe在演讲当中透露,ARM在下下一代的大核架构Matterhorn当中,加入Matrix Multiple(MatMul),令其ML(机器学习)性能与前代CPU相比提升一倍。

    时间:2019-11-05 关键词: 华为 高通 ARM npu

  • Arm首推主流市场NPU/GPU/DPU IP,将为中国市场带来什么?

    Arm首推主流市场NPU/GPU/DPU IP,将为中国市场带来什么?

    近年来,几乎进入了“全员NPU的大数据时代”,华为、海思、三星、阿里、寒武纪……NPU作为手机、云端重要的组成部分,迎来了大爆发。但目前来说,整体的硬件还没有一个统一的硬件标准,也鲜有完整生态支持,所以市场需要的是一套软件硬件相结合的,能够发挥生态系统的力量。   主流市场NPU、GPU、DPU三箭齐发   10月23日,Arm在2019年度技术论坛上发布了三款面向主流市场的IP,包括全新的NPU产品,Ethos-N57和N37;首款基于Valhall架构的GPU,Mali-G57 GPU;目前为止单位面积效率最高的显示处理器DPU,Mali-D37。 图1:Arm发布面向主流市场的NPU、GPU、DPU新IP 据Arm市场营销副总裁Ian Smythe介绍,该产品的设计理念主要为主流设备带来最极致的体验,针对不同市场,希望根据客户所需处理能力,提供有效的IP,既能够合理控制成本,又能达到客户期待的性能。正如上文所述,Arm的目标就是发挥生态系统的力量,将软硬件结合来提升使用体验。 据了解,此前Arm曾发布过高端市场所用IP,此次发布主要针对主流市场,通过Arm的标准化和强大的生态系统,使市场可获得更加极致的体验。值得一提的是,这几款产品均可基于最新开源的通用软件Arm NN上开发。   具有智能数据管理的Ethos-N57/N53   Arm ML事业群商业与营销副总裁Dennis Laudick介绍,此前曾发布过名为Arm ML处理器的NPU IP,此次扩充主流市场产品IP后,现称之为Ethos系列产品,而原Arm ML处理器现名为Ethos-N77。当然,主流市场推出的IP则分别为Ethos-N57和Ethos-N37。 他表示,本次发布的Arm Ethos-N57与N37与N77拥有相同的新架构,具体来讲Ethos-N77主要针对最高端、性能要求最高的市场;Ethos-N57针对主流市场,这款产品非常完美地实现了性能、成本以及功耗的均衡;Ethos-N37则针对低端市场,也就是对成本极端敏感的市场。 据Dennis Laudick介绍,Arm已发觉市场对NPU的多样化需求,并且值得一提的是,市场对性能以及带宽的需求非常一致, Ethos-N37、N57、N77是针对性能需求和市场的差异化产品。 图2:Ethos-N37、N57、N77可针对多样化市场需求 据了解,Arm的NPU产品自Arm ML处理器设计之初,重点关注的是数据而非处理,因此在设计中更多地注入了智能数据管理的功能和理念,包括数据敏感型压缩技术、高密度剪枝和稀疏功能。 图3:Ethos-N37、N57、N77拥有智能数据管理功能 需要强调的是,本次Arm推出的NPU产品为通用型产品,旨在硬件标准化。众所周知华为、海思、三星、阿里、寒武纪均拥有自己的NPU产品,不过目前市面很多机器学习(ML)工作负载使用的是Arm的CPU,本次发布的NPU可以将Arm的CPU ML性能进一步提升,同时提供更好的软件和工具支持。   相比前代提升30%的Mali-G57   Ian Smythe对现场记者介绍表示,Mali-G57是针对主流市场的基于Valhall架构的GPU。值得一提的是,与前代产品在相似条件下测试,Mali-G57性能是Mali-G52的1.3倍。 在性能方面,Mali-G57能效比提升了30%,性能密度也提升了30%,机器学习(ML)性能提升了60%。换言之,用户可以获得更好的图形表现力和画质,有效支持不断增长的图形和机器学习(ML)复杂性。 他表示,Arm Valhall架构设计之初的宗旨便是把并行最小线程数量做得越来越大,使架构越来越宽;另外,尽量简化,让编译过程越来越友好。  图4:Valhall的设计理念   小型化低功耗的Mali-D37   Ian Smythe介绍表示,Arm的DPU产品要追溯到2013年,在今年同样发布过针对高端使用场景,特别是VR中应用的Mali-D77。而此次发布的Mali-D37是首款面向主流和入门级市场的DPU产品。 图5:Arm在DPU方面的历史 Mali-D37的最重要的特点是支持全高清(Full HD)与2K分辨率,16纳米制程的面积小于1 mm²。另外,该款产品通过减少GPU核心显示工作和内存管理功能,功耗最高可降低30%。   开源架构Arm NN与生态建立完整工具链   Ian Smythe强调,除了处理器相关IP的研发以外,Arm非常注重软件和生态系统。事实上,Arm拥有如此众多的高性能产品,在强调软硬结合的现今,Arm的开源架构Arm NN是发挥硬件性能的关键性钥匙。 Arm NN是一个偏向底层的机构,可与高层的机器学习(ML)或人工智能(AI)框架连接,除此之外,也可连接标准引擎,实现Arm IP与第三方可配置的IP连接。利用Arm NN可以简化开发环境,加快ML的部署。 值得一提的是,Arm NN的强势在于全面化和标准化,在标准化前提下,开发人员可以进行定制开发。当然,Arm NN是一个开放开源的平台,是支持其他第三方处理器的,不过利用众所周知Arm的异构计算能力非常强,再结合其提供的软件和工具可以发挥预期的表现力。 图6:开源软件Arm NN加快ML的部署 值得注意的是,Arm还宣布与Unity合作。众所周知,Unity是著名的图形游戏引擎,Arm一直以来拥有非常优良性能的CPU/GPU/NPU IP,根据Ian Smythe强调,Arm将进一步优化Unity引擎,用户将获得更好的性能体验。 图7:Arm将与Unity合作   将一如既往为中国市场提供服务   通过上文所述,我们明白了Arm首推的主流市场NPU/GPU/DPU IP可以为中国市场带来标准化的生态建设。除此之外,对于目前许多消费者非常关注的问题,在Arm 2019年度技术研讨会上,Arm中国董事长兼首席执行官吴雄昂表示Arm是唯一的非美国计算平台,经过法务部门调查,Arm v8与未来的Arm v9都是源于英国技术,ARM会一如既往持续对中国企业进行授权和服务支持。 据了解,目前在中国拥有超过200家合作伙伴,中国客户基于Arm技术的芯片累计出货量大于160亿,在国产SoC中,有95%是基于Arm处理器技术。吴雄昂强调,中国地区也是ARM的重要市场,占到该公司营收20%左右。 另外,此前Arm曾宣布推出PSA认证,高速发展的现如今,这套认证可以帮助中国本土独立的IoT生态体系的建设。值得一提的是,在中国有很多其他的品牌厂商、方案解决商有意愿参与PSA认证。 今年7月,Arm携手国联通旗下联通物联网有限责任公司宣布部署基于Arm Pelion设备管理平台与Mbed OS操作系统所打造的全新物联网平台。该物联网平台是一个开放、共享的平台,支持各种种类的跨平台设备,如果是基于Arm架构的设备,完全可以在Pelion的平台上来实现端到端的解决方案的开发;如果是基于非Arm架构的设备,Pelion平台也可以很好地管理并提供安全的保障。 可以说,Arm一直以来都非常重视中国市场,同时Arm从硬件的CPU/NPU/GPU/DPU IP,到软件的Arm NN、Pelion,再到PSA安全认证,可为中国市场的标准化生态建立提供非常有利的帮助。   【相关阅读】 1.《“安全疑云”成了IoT的绊脚石,警戒线下如何获取IoT的“安全通行证”?》 2.《跨过阻碍IoT的“大山”需要做加法:Arm+中国联通=破局》 

    时间:2019-10-26 关键词: ARM dpu ip GPU 技术专访 npu

  • 全新Arm IP为主流市场带来智能沉浸式体验

    全新Arm IP为主流市场带来智能沉浸式体验

    新闻重点: · Arm Ethos-N57与 Ethos-N37 NPUs:扩展机器学习(ML)处理器的产品范围,以便在主流设备上提供人工智能(AI)应用。 · Arm Mali-G57 GPU: 第一个基于Valhall架构的主流GPU,性能是前几代产品的1.3倍 · Arm Mali-D37 DPU:在最小的面积内提供丰富的显示功能组,以呈现全高清(Full HD)及2K分辨率。 北京 – 2019年10月23日—曾经只是高端设备专属的沉浸式体验,如AR、高保真游戏与以AI为基础的全新移动与家庭应用案例,目前也逐渐成为主流市场的需求。让开发人员能够使用针对日常设备优化的高性能AI与媒体IP解决方案,可以赋能新的AI驱动应用案例,提供包括语音识别与always-on在内的功能,告别这些功能由移动设备所独享的时代。 从游戏设备到数字电视(DTV),人工智能已经无所不在,但要促成这些响应式体验,端点必须具备更强的计算能力。例如,数字电视的智能体验,包括智能助理语音指令、节目实时翻译,以及人脸辨识以强化家长监护。 为了达成这些功能,Arm宣布将推出两款全新的主流ML处理器,以及最新的MaliGPU与DPU。这些IP的集成代表着Arm有能力根据需求调整产品,把高端的体验带入消费者高效的日常生活设备中。这套全新IP套件包括: · Ethos-N57 and Ethos-N37 NPUs:让AI应用成为可能并在ML的性能与成本、面积、带宽与电池寿命之间达成平衡。 · Mali-G57 GPU:第一款基于Valhall架构的主流GPU,可透过性能提升带来沉浸式体验 · Mali-D37 DPU:以最小的芯片面积达成丰富的显示功能,成为入门设备与小型显示屏幕最适合的显示处理器(DPU)。 Ethos-N57 与 Ethos-N37 NPUs:提供真正的异构计算 继Arm ML处理器(现称为Ethos-N77)发布后,Ethos NPU家族又添加Ethos-N57与Ethos-N37两位新成员。Arm Ethos产品组合旨在解决AI与ML复杂运算的挑战,以便为日常生活设备创造更为个性化与沉浸式的体验。由于消费者的设备越来越智能化,通过专属的ML处理器提供额外的AI性能与效率,是非常有必要的。全新的Ethos 对成本与电池寿命最为敏感的设计进行优化,NPU可以为日常生活设备带来优质的AI体验。 Ethos-N57与Ethos-N37的设计理念包括一些基本原则,例如: · 针对Int8与Int16数据类型的支持性进行优化 · 先进的数据管理技术,以减少数据的移动与相关的耗电 · 通过如创新的Winograd技术的落地,使性能比其他NPU提升超过200% 此外,Ethos-N57的功能还包括: · 旨在提供平衡的ML性能与功耗效率 · 针对每秒2兆次运算次数的性能范围进行优化 Ethos-N37的功能还包括: · 为了提供面积最小的ML推论处理器(小于1平方毫米)而设计 · 针对每秒1兆次运算次数的性能范围进行优化 更多有关Ethos-N57与Ethos-N37 NPU资料,请参阅Arm blog。 Mali-G57:为普罗大众带来智能与沉浸式体验的GPU Mali-G57,将优质的智能与沉浸式体验带到主流市场,包括高保真游戏、媲美电玩主机的移动设备图型效果、DTV的4K/8K用户接口,以及更为复杂的虚拟现实和增强现实的负荷。这是移动市场划分中最大的一部分,而Arm最近与Unity的发布强调其基于Arm IP的片上系统(SoC),CPU, GPU进一步的性能优化的努力,它可以让开发人员有更多的时间创造出全新的沉浸式内容。 Mali-G57关键功能包括: · 与Mali-G52相比,各种内容都能达到1.3倍的性能密度 · 能效比提升30%,使电池寿命更长 · 针对虚拟现实(VR)提供注视点渲染支持,且设备ML性能提升60%,以便进行更复杂的XR实境应用 更多有关Mali-G57资料,请参阅Arm blog。 Mali-D37:Arm单位面积效率最高的处理器 Mali-D37是一个在最小的可能面积上包含丰富显示与性能的DPU。对于终端用户而言,这意味着当面积成为首要考虑,在例如入门级智能手机、平板电脑与分辨率在2k以内的小显示屏等成本较低的设备上,会有更佳的视觉效果与性能。 Mali-D37关键功能包括: · 单位面积效率极高,DPU在支持全高清(Full HD)与2K分辨率的组态下,16纳米制程的面积将小于1 mm2。 · 通过减少GPU核心显示工作以及包括MMU-600等内存管理功能,系统电力最高可节省30%。 · 从高阶的Mali-D71保留关键的显示功能,包括与Assertive Display 5结合使用后,可混合显示高动态对比(HDR)与标准动态对比(SDR)的合成内容。 更多有关Mali-D57的资料,请参阅Arm blog。 这一套全新的IP,设计时就考虑到解决方案,并吻合Arm全面运算(Total Compute)的初衷,以确保它们确实是实际体验驱动,同时针对解决未来工作负荷的复杂运算挑战进行优化。这套全新的IP提供更高的单位面积效率且更为节能,同时能提升性能、降低成本及减少上市所需的时间,为移动设备带来更高保真游戏与媲美游戏主机的体验,为DTV带来计算复杂性,并为个人化沉浸式内容带来更高的ML性能,以及消费者期待的更快反应速度。

    时间:2019-10-23 关键词: ARM dpu GPU npu

  • AI Benchmark榜单更新:紫光虎贲T710登上第一、超越骁龙855 Plus

    手机SoC领域,国产芯片再次引发世界瞩目。 苏黎世联邦理工学院主导的AI Benchmark最新榜单显示,紫光展锐的虎贲T710芯片综合获评28097分,暂居世界第一,这一成绩领先了高通当前最高端的骁龙855 Plus,同时对华为达芬奇架构NPU的麒麟810也有显著优势。 通过测试结果对比,AI Benchmark点评说,紫光展锐的虎贲T710无论是在浮点和量化AI模型方面,还是几种常见AI模型的平均推断时间和预测误差上,包括在推理准确性方面,几乎全面超越了所有竞争对手。 AI成绩 不过,纯CPU模块的性能指标上,T710整数和浮点则要稍稍落后于骁龙845、麒麟980。 | CPU成绩 据悉,虎贲T710的CPU部分为8核设计,即4颗2GHz A75大核配4颗1.8GHz A55小核,GPU集成PowerVR GM 9446,独立的NPU负责AI运算和加速。

    时间:2019-09-09 关键词: 紫光 plus 虎贲 骁龙855 npu

  • 华为麒麟810详解:历时3年研发上千人参与 自研NPU性能登顶

    华为麒麟810详解:历时3年研发上千人参与 自研NPU性能登顶

    继不久前首款搭载麒麟810芯片的手机新品—;—;华为nova 5正式发布之后,7月8日,在荣耀9X发布之前,荣耀在北京提前举办了一场技术沟通会,荣耀产品副总裁熊军民在会上公布了X系列上一代产品8X的出货量:发布9个月全球出货量突破1500万台。同时还首次展示麒麟810芯片,并详细介绍了麒麟810芯片。 荣耀9X搭载的麒麟810芯片,是全球仅有的四颗7nm工艺旗舰手机芯片之一。熊军民表示由于半导体物理极限的原因,未来很长一段时间7nm都会是最先进的工艺制程,而麒麟810成为了“7nm俱乐部”的最新成员,未来搭载麒麟810芯片的手机都会成为市场上极具竞争力的机型。他打趣的说,7nm旗舰手机芯片一共四颗,华为就占了一半(另一颗是麒麟980),“打麻将有点占便宜了,欢迎友商来斗地主”。 ▲麒麟810实拍 据介绍,麒麟810芯片的研发历经36个月,有超过1000名半导体设计与工艺专家参与其中,耗费了5000多块工程验证开发板。具体到7nm工艺的领先技术优势,熊军民使用“芯优一级压死人”来形容。相比上一代荣耀8X的12nm工艺的麒麟710,荣耀9X搭载的麒麟810在晶体管密度上增加110%,而能效比提高了50%,这使得麒麟810兼顾了更好性能和更优能效。 在架构方面,麒麟810采用了两个旗舰级Cortex-A76大核加6颗Cortex-A55高能效小核的CPU组合,通过灵活调度,可高效使用系统资源。前者会扛起大型游戏、网页渲染等较重的工作,而后者用于处理听音乐之类的轻负载。 根据官方公布的数据显示,相比麒麟710,麒麟810搭载的定制A76大核在单核性能上提升了75%,而多核性能也提升了40%。GPU则为定制版的Mali G52,对比上一代的麒麟710,游戏性能大幅提升,在1080P曼哈顿离屏测试中成绩提升175%,而GPU能效也提高了160%。 此外,新推出的麒麟Gaming 技术则在提供高性能的同时,全面兼顾了高能效的诉求。尤其值得一提的是,荣耀9X还搭载了最新的GPU Turbo 3.0技术。支持的主流游戏增加到70多款,在图形性能提升的同时还可降低功耗,提供毫秒级的触控响应。 熊军民介绍,麒麟810集成的NPU基于华为自研的全新达芬奇架构,这也是达芬奇架构首次出现在手机芯片中;而其强悍的AI性能让麒麟810一出生便登顶了权威机构AI-Benchmark的排行榜,32000多的测试得分远超第二名。 对此,熊军民解释达芬奇架构以独特的达芬奇魔方为基础,集成了张量化立体运算单元,形成了极具创新的架构设计。从对比高通骁龙855的数据来看,麒麟810的FP16数据格式的性能和能效表现优异,特别是能效比有6-8倍的优势;而麒麟810的Int8精度保留和超分性能也更好,体现到图片处理上就是细节更清晰,而且不会出现画面错误。 熊军民表示除了沟通会上展示的图像处理,荣耀9X作为AI旗舰还会有更多的智慧AI应用和体现,在正式发布会和产品上市后会逐步揭晓。

    时间:2019-08-20 关键词: 华为 海思 麒麟810 npu

  • 华为屏下传感器+麒麟990+4500mAh

    华为屏下传感器+麒麟990+4500mAh

     周所周知,只有重视创新和研发的手机厂商才能在腥风血雨的市场中脱颖而出,并且会得到大家的尊重。随着智能手机的蓬勃发展,三星华为苹果已经很为行业的领头羊,也成为其他手机厂商所赶超的对象。这三大手机厂商有个共同点特点就是在核心技术上敢于研发和创新,因此在手机市场中我们能看到P30 Pro、iPhone X以及三星S10这样惊艳的产品,这些产品的问世不仅丰富了市场的选择性,同时彰显出了手机厂商的真正实力。     华为手机做为国产手机厂商的老大哥,在研发的投入上可以说花费了大量的人力物力,正是这种敢于投入的精神才换来了今天的成绩,以至于华为手机逐渐成为一个世界著名的手机厂商,一个让对手胆寒的手机厂商。大家都知道,华为Mate20 Pro和华为P30 Pro是两款黑科技满满的手机,里面携带了众多华为独创的先进的技术,尤其P30 Pro的50倍变焦能力,可以说为行业带来了新的研究方向。当然对于华为来说这些黑科技只是华为的一小部分,相信在接来了华为手机还会为我们带来更多的惊喜。近日,网上曝光了一组华为旗舰新机的概念图,该机外观设计出奇惊艳,看来华为要亮王牌了!   华为亮王牌!在外观设计方面,据曝光图片显示,这款华为旗舰新机采用了真全面屏的设计,真全面屏设计顾名思义就是无刘海无水滴屏设计,手机的正面被一整块屏幕占据,看起来非常震撼。这款华为旗舰新机能做成这样,是因为采用了屏下传感器技术,在屏下传感器技术的加持下,该机实现了真正意义的全面屏,再加上极窄的边框设计以及曲面的屏幕工艺,因此该机的正面颜值非常出色,给人一种满满的未来感。   在手机的背部设计上,据曝光的概念图显示,这款华为旗舰新机的背部采用了大家喜欢的玻璃材质,并且经过曲面+3D工艺的处理之后,该机的背部立体感十足,相信这样的设计也对手机的手感会有很大的帮助。在摄像头方面,该机采用了后置5摄的设计,后置5摄被安排在手机背部中间靠上的位置,并且以竖列的形式排列,这样的设计非常不错,同时使得整个手机的背部一体感强烈。   华为亮王牌!在核心硬件方面,这款华为旗舰手机据悉将搭载了华为新一代自研芯片麒麟990,据悉麒麟990将继续将采用台积电第二代7纳米工艺,集成了全新的自研达芬奇架构的NPU,如果真是这样的话,那么该机在性能上和NPU的算力上将会得到大幅提升。并且据悉该机还将搭载5G基带芯片,如果真是如此的话,那么它还还是一款真正意义的5G手机,在核心竞争力上又增添一大亮点。另外,在续航方面,这款华为旗舰新机配备了一块4500mAh的大容量电池,因此该机的续航能力备受期待!   真香警告!在竞争越发激烈的手机市场,拥有核心技术就意味着掌握了主动权,而华为手机以坚实的技术基础创造了属于自己的优势,而这种优势将进一步助力华为手机勇攀高峰。而上述曝光的这款华为旗舰新机在外观设计上,屏下传感器技术的加入,使得该机实现了真全面屏的设计,让手机的视觉效果更加精彩。尤其是麒麟990、5G以及4500mAh大电池等核心技术的加持使得该机达到了顶级机皇的水准。

    时间:2019-07-16 关键词: 智能手机 传感器 自研芯片麒麟990 npu

  • 三星电子加强NPU研究,看好AI研究岗位将扩充10倍

    三星电子加强NPU研究,看好AI研究岗位将扩充10倍

    据报道,三星电子今天宣布将加强其神经处理单元(NPU)的功能,以进一步扩展其人工智能(AI)解决方案的覆盖面。 据报道,根据三星对下一代NPU技术的关注,三星计划到2030年在全球创造2000多个相关工作岗位,这大概是现有员工总数的10倍。三星电子还将扩大与全球知名研究机构和大学的现有合作,并支持培养包括在深度学习和神经处理的人工智能领域的未来人才。 三星系统LSI业务总裁Inyup Kang表示:“在即将到来的人工智能时代,三星致力于通过自己的NPU技术实现行业领先的进步。我们很高兴未来的人工智能处理能力将更上一层楼。” 报道指出,三星去年在其高端移动处理器Exynos 9820中推出了首款NPU,并计划继续为高性能移动芯片提供先进的设备AI功能。三星的NPU的应用也将扩展到汽车处理器、车载信息娱乐系统(IVI)和高级驾驶辅助系统(ADAS),以及针对为优化大数据处理的下一代数据中心。 Samsung Newsroom还表示,三星系统LSI业务部和三星高级技术研究所(三星的研发部门)共同计划将公司目前的NPU研究扩展到新的AI硬件技术,例如研制出像人类大脑运行的神经形态处理器。

    时间:2019-06-19 关键词: 三星 人工智能 厂商动态 npu

  • 阿里达摩院首款自研NPU年内发布 很快将会流片

    阿里达摩院首款自研NPU年内发布 很快将会流片

    3月21日,阿里云峰会上,阿里巴巴CTO、阿里云总裁张剑锋表示,达摩院成立三年以来发展迅速,去年销售芯片超两亿片,并且将在今年发布首款自主研发NPU,性能领先10倍。张剑锋表示,我们大概三年前成立了达摩院,并持续加大投入,到今天为止已经有1100名员工,发展非常快。“在芯片端,我们在IOT端嵌入式芯片发展非常快,去年大概销售出去两亿片以上的芯片。”同时,他还透露,今年阿里巴巴自己研发的第一款NPU将正式发布,很快就会流片,性能领先10倍以上。资料显示,阿里巴巴成立于2017年10月。当时,阿里巴巴表示,三年内在技术研发上的投入将超过1000亿人民币。“达摩院”将实行院长负责制,由阿里巴巴集团CTO张建锋(花名行癫)担任首任院长。去年9月,阿里巴巴宣布成立芯片公司“平头哥半导体有限公司”,该公司由阿里收购的国产芯片企业中天微与阿里旗下达摩院芯片团队整合而成。“平头哥”将会主要打造面向汽车、家电、工业等领域的智联网芯片平台,计划在2019年4月发布第一款AI神经网络芯片,2-3年后打造出一款真正的量子芯片。

    时间:2019-03-28 关键词: 阿里巴巴 iot物联网 平头哥 npu

  • Imagination推出第九代PowerVR GPU,游戏性能显著增强

    Imagination公司推出的PowerVR GPU曾是移动厂商广泛采用的方案,但在和苹果分道扬镳后,这家公司受到的关注就逐渐下降。Imagination日前宣布,正式推出旗下第九代PowerVR GPU,包含PowerVR 9XEP/9XMP/9XTP三个系列。     这三个系列中最高端的产品是PowerVR Series9XTP,是基于Furian架构开发的。Imagination表示,这款GPU显著提升了游戏/计算密度,优化了功率/性能/面积(PPA)这一比例。这款产品定位高端移动设备、高端车载信息娱乐系统,以及跨计算/服务器细分市场领域。 官方并未详细介绍几款产品的详细性能,但是表示,在《绝地求生》手游中,PowerVR 9XMP比华为麒麟970、三星Exynos 9810异性过滤的性能提升2倍,阴影样本性能提高4倍。     此外,Imagination还发布了PowerVR Series3NX全新NPU,单核性能0.6~10TOPS,多核性能规模最高达160TOPS;官方称在同一芯片领域中,新系列NPU比上一代产品提升了40%,并为SoC制造商带来60%的能效比提升。

    时间:2018-12-05 关键词: powervr 第九代gpu npu

  • Arm移动处理器那么牛,为何明年Q1才发布AI处理器?

    Arm移动处理器那么牛,为何明年Q1才发布AI处理器?

    AI热潮来势汹汹,即便算法还不成熟,处理器算力还不足够,但大部分手机厂商已经让其旗舰手机用户或多或少地享受到了所谓的AI功能。其中,苹果和华为更是用集成NPU的自研处理器增强其手机的AI功能作为一大卖点。有意思的是,无论是手机处理器市场市占最高的高通还是目前移动设备处理器IP最重要的提供方Arm,都迟迟没有推出集成NPU的处理器,这究竟是为什么?Arm的AI处理器时间上已经落后?AI迎来了第三波热潮,但目前AI芯片受到了更大的关注,其中除了有芯片算力是AI发展的基础外,AI芯片市场的迅速增长也是一个重要原因。Allied Market Research发布的一份报告指出,2017年全球机器学习芯片市场规模约24亿美元,预计到2025年这一市场规模将达到约378亿美元,复合年增长率(CAGR)为40.8%。因此,我们看到不同类型的AI芯片不断地被大大小小的公司推向市场。对此,Arm机器学习部门商业与市场副总裁Dennis Laudick接受专访时表示:“从CPU、GPU发展的历史看,刚开始市场上会有多种多样的选择,但市场最终会收敛和融合,留下最合适的产品。我相信NPU的发展也会遵循同样的规律。”Arm机器学习部门商业与市场副总裁Dennis Laudick在众多新入局AI芯片市场的公司中,值得注意的是以前更加擅长软件的科技巨头们都纷纷开始自主研发AI芯片。对此,Cadence首席执行官、华登国际创始人陈立武此前接受采访时表示科技巨头们积极布局AI是因为他们不希望落后,因为他们有很多数据。Dennis Laudick也发表了自己的看法,他表示:“AI发展中训练和推理都非常重要,科技巨头有大量的数据,因此也有包括机器学习在内的许多需求。他们在构建自己AI生态的时候在AI算法和模型层面更多是依赖学校的研究,因此他们对硬件更感兴趣。”不过,作为全球最大的IP授权商,也是目前移动处理器IP首要的提供商,Arm直到2018年初才首次公开其ML处理器(Machine Learning Processor)的相关消息,产品的正式发布要到明年。这是为什么?Dennis Laudick说道:“我们一直都在关注AI的进展,在机器学习方面的工作也已经有几年的时间,最新的Arm Cortex A57/A75/A76都有对机器学习的扩展。虽然我们多年来一直致力于机器学习,但这项技术存在一些问题,也不稳定。如数据类型,到底是整数还是浮点数,FP16,FP32,8位整数谁更适合机器学习,针对此现在已经有大量的研究。但要在早期的市场上要提供解决方案就需支持所有的数据类型和模型,而不是优化,这会带来处理器面积大且耗电的问题,我们需要等待技术的稳定。”因此,对于想要让机器学习技术更加简单易用的Arm而言,方法有两个,一个是不断改善现有处理器,另一个就是推出新的神经处理单元(NPU)。在技术还不够稳定的时候我们看到Arm不断改进Cortex CPU和Mali GPU,并配合软件实现AI功能。对于Arm推出NPU的时间点,Dennis Laudick表示:“最近我们已经看到机器学习技术正在稳定和成熟,市场需求也正在不断增加,我们认为现在是进入市场的最佳时机。”可以认为,基于Arm在处理器IP市场和整个生态链的关键地位,推出ML处理器的时间点晚一些不是什么大问题,更吸引人关注的是Arm的ML处理器到底如何。Arm明年第一季度推出AI处理器对于将在2019年第一季度发布的Arm ML处理器,Dennis Laudick介绍,其定位与现有的Cortex CPU一样是系列产品,根据市场需求会性能范围是1-4 TOP/s,匹配不同的CPU满足手表、手机、智能家居、汽车等市场的需求。Arm ML处理器主要有三个部分,一个是MAC引擎,主要执行卷积计算;二是可编程引擎,可以支持未来新的算子和网络;三是数据管理,减少AI计算的耗能。他特别指出,Arm在ML处理器的数据管理上做了很多的设计和思考,因为AI的数据搬迁比数据的计算更耗能。他们分析AI处理器中卷积运算所需能量比不高,但数据的管理和搬迁可能是运算所需功耗的一百倍。因此他们通过分析技术降低功耗,其中一个技术是数据的压缩,可以减少数据的搬迁量,另一个是选择神经网络单元权重激活或者不激活,还有就是数据的过滤,用特殊的方法免除不必要的加工。他们希望通过对不同场景的深入分析,尽量做到数据高效、多次使用,减少数据搬迁降低功耗。当然,即便是经验丰富的Arm,认识到AI处理器最重要的是数据管理也走了一些弯路。Dennis Laudick表示:“Arm有很多种不同类型的处理器技术,当我们第一次看到机器学习时想到的是是否可以从其中的一种处理器开始,因此我们开始用了GPU的方法,但最终发现机器学习处理器面临的不是处理问题而是数据问题,所以取消了早期GPU的方法,创建了一个全新的处理器专注于数据以及机器学习中的数据类型,可以执行并行指令。”Dennis Laudick也同时指出,无论是CPU、GPU、FPGA还是ASIC都可以运行机器学习算法,不同点在于比如实现同样的人脸解锁功能,GPU需要的时间少于CPU,而NPU则能够实现最快的速度和最低的功耗。引人思考的是,Dennis Laudick认为不同类型的AI处理器适用于AI早期市场,机器学习领域市场最终可能是CPU占80%的市场,NPU占20%的市场。他认为CPU在不断改进,而市场上更广泛的NPU也不断出现,最终GPU和FPGA将会消失,留下最通用的CPU和最专用的NPU。不过,在Dennis Laudick看来软件才是AI处理器中更关键的部分。他表示:“Arm的AI处理器是一个异构的系统,其中包含CPU、GPU、NPU等,但作为IP核想要实现更好的可配置性软件体系非常重要。所以在硬件之上有我们特别优化的Compute Library,它会把底层的硬件和驱动进行充分优化,根据算子的不同需求驱动硬件,可以提升几倍到十几倍的效率。再上一层是Arm nn,可以将TensorFlow、Caffe等神经网络框架转换成Compute Library可以执行的任务,让开发者不用关心底层的硬件,只需要使用标准架构进行开发就可以。”至于Arm nn以及Compute Library是如何实现根据需求做机智性的决策充分发挥异构系统的优势的问题,Dennis Laudick表示,Arm实际上借助了许多专家的分析,通过跨越团队的专家团队分析应用程序和软件,试图找到瓶颈和限制,最终保证软件非常优化。为了让Arm nn和Compute Library更加优化,Arm也鼓励硬件架构师和软件分析团队紧密合作。还可以看到,Arm Project Trillium中除了有ML处理器、NN SDK,还有OD(Object Detection,对象检测)处理器,Arm认为,手机、摄像头、汽车等都是机器学习中对象检测的头号应用,因此对象检测市场足够大,值得做一个额外的处理器,特别是针对物体识别。AI处理器获胜软件和数据更关键?需要指出的是,NPU是目前执行机器学习任务效率最高的处理器,但对价格比较敏感的产品,NPU的成本难以承受,只拥有CPU,并且使用CPU处理机器学习就已足够。因此在物联网和AI领域,基于RISC-V指令集的CPU也受到了不少的关注,一些人也认为RISC-V处理器未来将会在物联网智能终端成为Arm的竞争对手。对此,Dennis Laudick表示:“基于RISC-V指令集的处理器是一个CPU,它并没有真正与我们的NPU产生竞争,在CPU方面,我们已经进行了两到三代的机器学习改进,比如支持向量扩展,RISC-V也开始实施其中的一些改进,不过这些事情我们已经做过。”他进一步指出,在机器学习方面,很多芯片公司专注于硬件,与他们有所不同,为了能够让每个人都能更好地获得机器学习,我们最重要的事情就是确保软件生态系统具有一致的平台。因为程序开发人员创建一个应用程序是希望其能够运行在更多设备上,通过提供一个通用、稳定的软件平台,能够确保我们拓展CPU以提高机器学习的能力。并且我们为市场提供新的硬件功能时,软件社区也会变得非常有创意。软件生态系统是Arm成功的关键所在,Arm推出良好的处理器是因为软件生态系统有这样的需求,这也是Arm过去20年已经做的事情。也了解到,为了能够更好的构建软件生态,Arm将会选择与工程师、软件公司等进行广泛合作。其中也与Android生态的大公司进行了合作,Arm在中国生态系统中的大公司花费的时间也越来越多。因此,Dennis Laudick认为近两年的AI热潮会对于软件行业带来革命性的变化,因为传统的软件在概率判断,评估猜测方面有一些局限性,AI对概率判断的准确度和猜测的准确度上有其特点,AI也将带来软件2.0的时代。至于许多人都关心的在AI芯片市场中谁将取得最终胜利的问题,Dennis Laudick认为:“AI还处于比较早期的阶段,现在判断谁能胜出为时尚早。不过,全球的大公司都在AI上投入了大量的资金,但有一个巨大的差异是中国的公司更容易获得数据,也能更轻松的使用这些数据,所以我认为在机器学习方面中国的公司在数据方面更具有优势,但还不知道它将如何发挥作用。”小结Dennis作为拥有20余年移动、汽车与消费电子领域从业经验的资深人士,对于AI发展有着自己的观察,对Arm的AI处理器的解读也让我们得以更进一步了解即将在明年第一季度发布的Arm ML处理器。在算法、模型都还不够稳定的时候,作为提供处理器IP和通用处理器的公司,Arm和高通没有着急推出NPU,而是通过优化硬件和软件提升AI性能是一个明智的选择,毕竟他们与华为和苹果这样手机处理器只为自己所用的公司有着巨大的差别。在整个采访的过程中,Dennis反复提到软件的重要性,这对于一些AI芯片企业而言或许是一个提醒,毕竟现在已经有越来越多的IC设计公司意识到了AI时代与软件团队合作的重要性。那么,除了硬件和软件,数据又将如何影响AI芯片市场的竞争?

    时间:2018-11-15 关键词: ARM 机器学习 ai处理器 ml处理器 npu

  • 三星官宣:将于14日推出新品 或为Exynos 9820

    三星官宣:将于14日推出新品 或为Exynos 9820

    三星Exynos官方推特正式发出预告,将于11月14日带来新产品。 三星官方并未透露详细的产品,但配上了“Intelligence from Within”的文字,可能是在暗示采用新一代NPU的全新Exynos处理器平台。 此前的爆料消息显示,三星下一代Exynos旗舰芯片采用7nm FinFET工艺制造,并且拥有双核NPU单元(根据此前的爆料,很有可能是第二代NPU)。有了新技术的加持,三星Exynos新旗舰芯片在AI运算方面和图像处理方面将会有大幅升级。 这一动作预示着,在继华为麒麟980、苹果A12处理器之后,三星的Exynos旗舰芯片也要朝着7nm进发了。

    时间:2018-11-12 关键词: 三星 芯片 厂商动态 npu

  • 苹果A12处理器小核心集群和NPU集群探究!

    苹果A12处理器小核心集群和NPU集群探究!

    上周我们对全新iPhone XS和A12处理器进行了深入分析,不过主要部分集中在CPU的大核心集群以及GPU集群两方面,对A12的低功耗小核心集群和NPU集群并没有过多描述,本文便来继续探究这两部分。代号“Tempes(暴风)”:凶猛的小核心从A10这一代开始,苹果在SoC中引入了代号为“Twister(龙卷风)”的低功耗小核心集群,而后是A11为“Mistral(干冷的北风)”,而此次的A12则为“Tempest(暴风)”。不过多年来小核心经历三代更迭,我们却从来没有分析过这些架构,对它们始终有一种神秘感。从某种意义上说,高性能的核心架构无论怎样压低功耗,也无法媲美天生的低功耗小核心架构,即使时钟门控设计完美,也无法避免核心中存在的静态泄漏。使用更小的CPU核心有助于缓解静态泄漏,以及提高动态泄漏功率效率。Tempest核心是一个乱序三发射的架构,这意味着它与Arm big.LITTLE体系下的小核心基本无关,因为Cortex A53和Cortex A55等均为更简单的顺序执行架构。Tempest核心的执行单元也相对较少,只有两个简单ALU算数逻辑单元,其中一个可执行整数和浮点乘法,另一个则能够执行浮点加法。除了两条主要管道外,只有一个专用的组合装载/存储端口。有趣的是,Tempest核心基本上与苹果此前A6处理器的Swift核心是相同的,苹果很有可能是将老的高性能架构精简并修改为64位后作为低功耗小核心使用。如果Tempest核心确实是Swift核心派生的,那么在上面描述的三个执行单元之外,还应该有一个用于整数和浮点分区的专用端口,这样在指令被馈送时才不会阻塞主流水线。Tempest核心频率最高可达1587MHz,有32KB L1缓存以及2MB L2缓存。除了L2容量较大之外,Tempest核心与A11的Mistral核心并没有其他明显差异。不过不幸的是,当A11的小核心集群上只有一个线程处于活动状态时,Mistral核心的频率可以提升到1694MHz,高于Tempest核心,很难直接比较二者的能耗比。与大核心Vortex非常相似,A12的Tempest核心的最大改进体现在对内存敏感的测试项中。,而输给A11的Mistral核心主要是由于频率劣势。总体而言,除了内存改进之外,Tempest核心在性能上与Mistral核心非常相似,这也为我们对比二者的能耗比提供了便利。但不幸的是,Tempest核心相比Mistral核心的能耗比提升并不如大核心一样巨大,纵观SPECint2006测试,Tempest核心的能耗比提升了35%,考虑到Mistral核心的频率更高,实际同频下的能耗比提升还要低于35%。而在浮点基准测试中,Tempest核心的能耗比平均只提高了17%。如果将A11和A12的小核心与大核心以及来自Arm的竞争对手放在一起对比,其实并没有太大的惊喜。与苹果的大核心相比,小核心的性能大概只有三分之一到四分之一,但它们消耗的能量却足有大核心的一半。(注:小核心的功耗只有大核心的七分之一到八分之一,但因为性能较低,执行相同任务所用的时间更长,因此实际消耗的能量为大核心的一半)不过令人惊讶的是,在SPEC的整数工作负载中,A12的Tempest核心和A11的Mistral核心性能甚至相当于2.1GHz频率下的Cortex A73,但Mistral核心的功耗却仅有Cortex A73的41%(A11和麒麟970同为台积电10nm)。不过在浮点工作负载中,小核心由于没有专用的浮点执行单元而失去了性能上的竞争力,但它们仍能提供很高的能效。从测试来看,苹果的小核心要比Arm的小核心性能要高得多,从私下里积累的Cortex A55测试成绩来看,Tempest核心的性能大概是Cortex A55的将近3倍。Arm小核心的性能在实际使用中很容易成为短板,这意味着我们未来可能会看到更多像麒麟980这样的的“大-中-小”三集群SoC,而Arm也应该思考一下小核心是否还应该继续使用性能低下的顺序执行架构。NPU神经网络推理性能测试A12另一个重大而神秘的进化是自主研发的全新NPU,在上篇文章中曾经提到,NPU在A12芯片上占据了较大的面积,几乎相当于两颗Vortex大核心。幸运的是,鲁大师的AImark支持iOS,使用Apple的CoreML框架来加速与Android相同的推理模型,可以直接对比苹果和安卓阵营处理器的神经网络推理性能。从结果来看,虽然苹果公布的理论性能(A11:0.6TOps,A12:5 TOps)在这个测试中并未得到很好的验证,但提升依然达到了4~6.5倍。测试中还发现,拥有NPU的A11成绩并没有比A10高出许多,这可能是由于A11的NPU从未通过API公开展示,因此在测试中只能使用GPU来执行CoreML。华为P20 Pro的麒麟970比A12落后大约2.5倍,恰好与各自宣称的NPU理论性能比例相同(2TOP和5TOP)。而华为表示,麒麟980的全新双核NPU比麒麟970的NPU快2.2倍,每分钟可实现4500次推断,由此看来麒麟980的AI性能应该能够追平A12。高通骁龙845的表现也很好,在不同特性的测试中与麒麟970互有胜负。由于AJmark目前还不支持NNAPI,只能使用SNPE框架进行推理加速,因此Pixel 2和Note9不得不使用CPU来进行运算,测试结果很差。功耗方面,A12的NPU满载功耗约为5.5瓦,且整个测试期间的功耗有很大起伏。这一功耗水平意味着苹果希望拥有最高的突发处理性能。使用GPU加速AI处理的A11和10功耗在2.3瓦到5瓦范围内,具体取决于推理模型。via:Anandtech

    时间:2018-10-22 关键词: 苹果 a12处理器 npu

  • 对标高通骁龙 710/670,联发科 Helio P70 或将于 10 月发布,

    对标高通骁龙 710/670,联发科 Helio P70 或将于 10 月发布,

    相对于高通、华为麒麟这样的芯片厂商来说,联发科在智能手机 SoC 领域的角色正处于一种不大好过的状态;自从宣布退出高端 SoC 芯片领域之后,联发科的自我定位更加贴合自我实际,并在今年上半年推出了对标高通骁龙 660 系列的 Helio P60 芯片。如今,Helio P60 可能将要迎来它的继任者了。Helio P70 或将来袭,搭配独立 NPU10 月 13 日,据台湾媒体 Digitimes 报道称,联发科 Helio P 系列的下一款作品 P70 即将在今年 10 月底发布,相关的手机也会随之推出。根据目前已经曝光的消息,Helio P70 将会采用与 P60 相同的 12nm 工艺,由台积电代工,同样也是 8 核心设计,同样包括 4 个 A73 大核和 4 个 A53 小核,而且 GPU 型号也同为 Mali-G72——单从这几项信息来看,P70 与 P60 似乎并没有什么区别。在不可或缺的 AI 方面,爆料联发科的 P70 将配备 NPU(神经处理单元),但是关于这个 NPU 的具体消息则未可知。不过据所知,上半年已经发布的 Helio P60 已经搭载了专用的人工智能处理模块 APU,它采用了双核架构,而且是基于此前 Helio P30 内置的 VPU(图像处理单元)经过算法提升而推出的。因此从产品逻辑的角度来说,P70 搭载一个专用的 AI 处理模块是极有可能的,但是不知道与 P60 所搭载的 APU 是否有继承或递进关系。另外,从产品对标的角度,如果说 P60 剑指高通骁龙 660 的话,那么 P70 毫无疑问则是奔着高通今年刚刚发布的骁龙 710 和骁龙 670 而来。从产品时间线的角度,联发科赶在半年之后推出新品与市面上的同级产品做竞争,也是合理的。联发科会走出泥潭吗?毫无疑问,搭载 Helio X30 的魅族 Pro 7/Plus 的失利,对于联发科来说是一个不小的打击;此后联发科似乎陷入了一个泥潭。在外界对其高端芯片不看好的情况下,联发科决定忍痛砍掉,专注于中端市场。由此,搭载双核 APU 的 P60 毫无疑问承担了拯救者的角色。而从产品接受度的角度,联发科 Helio P60 被多家厂商所采用,比如说 OPPO R15 标准版、诺基亚 X5、vivo Z3i 等产品;不过从整体来看,Helio P60 在品牌认知度上还是比骁龙的同级别芯片低了一头,上述产品都是手机厂商为价格敏感用户群体推出的作品,但却不足以承担同级别产品的扛鼎者的角色,这也是联发科的无奈之处。然而,P60 在 2018 年 4 月首次伴随智能手机面向消费者出货之后,联发科的表现似乎有了一定的回升。了解到,根据联发科公布的 2018 年相关业绩,2018 年第一季度营收为 496.5 亿元新台币(约合 17 亿美元),环比下滑 17.8%,同比下滑 11.5%;然而第二季度,联发科的营收环比增长了 21.8% 至 604.8 亿元新台币(约合 19.9 亿美元),同比增长了 4.1% 。其中,2018 年 6 月联发科的营收达到 210.6 亿元新台币,创下 9 个月来的新高。当然,看起来有所回升的表现,并不完全是 P60 的功劳;在 P60 之外,联发科还有 P40 和 P22 等低端芯片,它们丰富了联发科的 SoC 的产品线。但是作为联发科 SoC 体系下的拳头产品,联发科 P60 作用还是重要的。另外,也有观察人士称,得益于联发科 Helio P60、P22 和 A22 SoC 芯片的出货量增长,该公司的收入在 2018 年 Q3 达到了达到 670.3 亿新台币(约合 21.5 亿美元),同比增长 10.8%,刷新了近 7 个季度以来的收入记录。倘若该数据为真,那么联发科的 Q3 表现也可以说是非常难得了。不过在看来,P60 对联发科来说只是新道路上的一个开始,而接下来要发布的 P70 将会成为联发科是否能够走出泥潭的又一个重要变数,我们拭目以待。

    时间:2018-10-18 关键词: 联发科 helio p70 npu

首页  上一页  1 2 下一页 尾页
发布文章

技术子站

更多

项目外包