当前位置:首页 > 智能硬件 > 人工智能AI
[导读] (文章来源:教育新闻网) 在今年的英特尔AI峰会上,该芯片制造商展示了其第一代神经网络处理器(NNP):用于训练的NNP-T和用于推理的NNP-I。两条产品线现在都已投入生产,并已交付给

(文章来源:教育新闻网)

在今年的英特尔AI峰会上,该芯片制造商展示了其第一代神经网络处理器(NNP):用于训练的NNP-T和用于推理的NNP-I。两条产品线现在都已投入生产,并已交付给最初的客户,活动中出现了其中的两家,分别为Facebook和百度,以赞扬新的切片机。

专用的NNP设备代表了英特尔迄今为止对AI市场的最深推动,挑战了Nvidia,AMD和一系列针对专门为人工智能部署专用芯片的客户的初创公司。就NNP产品而言,该客户群是由超大型公司(如Google,Facebook,Amazon等)固定的,这些公司的业务现在都由人工智能提供支持。

三年前,英特尔收购了Nervana Systems时,甚至没有设想到推论线NNP-I。那时,饶和他的团队正在开发一种训练芯片,该芯片只是在侧面进行推断。它不被认为是值得专业化的东西。当然,现在,推理已被普遍认为是一种独特的工作负载,它对低延迟,低功耗和特殊数学有其特殊的需求。

第一代推理处理器NNP-I 1000采用Intel的10纳米工艺实现,根据SKU的不同,其功耗在10瓦至50瓦之间。它由12个推理计算引擎和2个IA CPU内核组成,这些内核通过高速缓存一致性互连挂钩。它可以执行混合精度数学,特别强调使用INT8进行的低精度计算。NNP-I 1000提供两种产品:NNP I-1100(包含一个NNP-I芯片的12瓦M.2卡)和NNP I-1300(由以下设备供电的75瓦PCI-Express卡)两个筹码。NNP I-1100提供高达50 TOPS,而NNP I-1300提供高达170 TOPS。

Rao声称,一旦将功率考虑进去,就根据MLPerf基准测试,就每瓦性能而言,NNP-I将成为推理领导者。他说,它还提供了非凡的密度,“您可以将每秒最多的推论推入单个机架单元中。”通过英特尔的测量,它还提供了Nvidia T4 GPU的计算密度的3.7倍。结果,Rao说:“我们可以运行更大的模型,更复杂的模型,并并行运行数十个模型。”

为了支持数据中心(尤其是超大规模数据中心)所需的可伸缩性级别,英特尔已经开发了与此类环境相关的解决方案堆栈。特别是,该公司开发了使用Kubernetes挂钩将NNP-I应用程序容器化的软件。它还提供了支持功能即服务(FaaS)模型的参考软件堆栈,该模型是基于云的推理的新兴范例。

Facebook的AI主管Misha Smelyanskiy加入Rao,解释说其Glow机器学习编译器已移植到NNP-I硬件上,这暗示着这家社交媒体巨头已开始至少在其某些数据中心中安装这些设备。Smelyanskiy没有提供有关这些部署范围的任何详细信息,但确实提到了新硬件可以提供的一些关键推理应用程序,包括照片标记,语言翻译,内容推荐以及垃圾邮件和虚假帐户检测。Smelyanskiy解释说,这些针对Facebook的专用ASIC的价值在于,它们“使ML工作负载的执行具有高性能和高能效性。”

NNP-T 1000 ASIC完全是另一种芯片,提供了更大的计算能力。它由多达24个Tensor处理核心(支持FP32和bfloat16数字格式),55 MB至60 MB的片上SRAM,32 GB的高带宽存储器(HBM)和片间链接(ICL)组成16112 Gb /秒的通道数ASIC以两种尺寸形式提供:PCI Express卡(NNP-T 1300)或夹层卡(NNP-T 14000)。PCI-Express卡的最大功耗为300瓦,而Mezzanine卡的最大功耗为375瓦。

ICL链接可用于跨越系统的多个级别,用作跨节点中的卡,机架中的节点和POD中的机架的无缝连接结构。一个节点最多可以构建八个卡,并且可以连接这些卡以构建多机架POD。在AI峰会活动上,他们演示了一个带有480个NNP-T卡的10机架POD,无需使用开关。结构是使NNP-T平台能够大规模使用以训练这些数十亿参数模型(在合理的时间内)的关键设计元素。Rao解释说:“横向扩展可能是培训中最重要的问题,任何新的培训体系结构都必须考虑这一点。”借助32卡NNP-T机架,英特尔在标准图像分类模型ResNet-50和自然语言处理的高级模型BERT上展示了95%的缩放效率。
     

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

4月22日消息,中国第一季度半导体产量激增40%,标志着成熟制程芯片在中国市场的主导地位日益巩固。

关键字: 半导体 英特尔 意大利

业内消息,近日英特尔表示其已成为第一家完成组装荷兰ASML的新型“High NA”(高数值孔径)EUV(极紫外)光刻设备的公司,目前已转向光学系统校准阶段。这是这家美国芯片制造商超越竞争对手的重要举措。

关键字: 英特尔 ASML EUV 光刻机

该实验室的创新技术能够增强人工智能边缘解决方案,提高神经网络能力

关键字: 人工智能 神经网络

近日,英特尔联合华铭、锐宝智联和育脉共同打造了融合掌静脉特征识别技术的智能城市轨道交通自动售检票系统(AFC)方案,将掌静脉特征识别技术应用于城市轨道交通场景,实现了轨道交通自动售检票系统的技术革新。

关键字: 英特尔 智慧交通

业内消息,继此前正式公布新一代AI加速芯片 Gaudi 3 之后,英特尔拟另准备针对中国市场推出“特供版”Gaudi 3,包括名为HL-328的OAM相容夹层卡(Mezzanine Card )和名为HL-388的PCl...

关键字: 英特尔 特供芯片 芯片 Gaudi3

发布AI开放系统战略,展示与新客户、合作伙伴跨越AI各领域的合作。

关键字: AI 英特尔 处理器

2024年4月10日,苏州——英特尔与苏州阿普奇物联网科技有限公司联合举办2024阿普奇生态大会暨新品发布会。会上,阿普奇携手英特尔及其他行业专家共同发布了阿普奇E-Smart IPC新一代旗舰产品AK系列,该系列采用英...

关键字: 数字化 英特尔 处理器

机器学习将是下述内容的主要介绍对象,通过这篇文章,小编希望大家可以对机器学习的相关情况以及信息有所认识和了解,详细内容如下。

关键字: 机器学习 神经网络 支持向量机

当地时间 4 月 9 日,英特尔在 Vision 2024 客户和合作伙伴大会上正式宣布推出最新的芯片产品 Gaudi 3 AI 加速卡及全新的Xeon 6 处理器。另外,英特尔还公布了针对边缘平台的新品发布计划与 AI...

关键字: 英特尔 AI 芯片 英伟达 H100

英特尔,开始正面硬刚英伟达了。

关键字: 英特尔 英伟达 芯片
关闭
关闭