当前位置:首页 > 芯闻号 > 美通社全球TMT
[导读] (全球TMT2022年9月5日讯)燧原科技在2022世界人工智能大会"算尽其用·定义AI算力中心新实践"云端算力产业应用论坛上正式发布云燧智算机(CloudBlazer POD)。云燧智算机是针对大规模、集约化人工智能算力应用场景推出的高性能人工智能加速集群产品,通过一站式预集...

(全球TMT2022年9月5日讯)燧原科技在2022世界人工智能大会"算尽其用·定义AI算力中心新实践"云端算力产业应用论坛上正式发布云燧智算机(CloudBlazer POD)。云燧智算机是针对大规模、集约化人工智能算力应用场景推出的高性能人工智能加速集群产品,通过一站式预集成人工智能加速硬件、一体化开发与管理平台及配套人工智能应用软件与服务。

燧原科技在2022世界人工智能大会正式发布云燧智算机(CloudBlazer POD)
燧原科技在2022世界人工智能大会正式发布云燧智算机(CloudBlazer POD)

基于燧原科技过往多个大规模AI算力中心工程实践

  • 开箱即用,实现智算中心优异TCO

云燧智算机采用一体化设计,是专为人工智能场景下计算、存储、网络、软硬协同设计的标准化产品,提供高可用的整体安全设计,确保集群架构扩展性能符合预期,提供包括采购、安装、运维一体的交钥匙方案。对数据中心的环境和IT计算资源提供全面的监控和管理,提高集群部署、测试的质量和效率,辅助用户提升运营效益和降低运行成本,帮助用户提升运维价值,为用户实现AI算力中心从交付部署到后期上线及运维管理全生命周期中的优异总拥有成本(TCO)。

  • 全局优化,提供卓越AI性能保障

云燧智算机代表了燧原科技经过多个大规模工程实践所形成的计算、网络、存储的整体设计:以全局优化为目标,基于计算、存储、管理网络分离,全互联无阻塞的网络架构,结合高效的多级存储方式,在强大的"邃思"芯片与CPU的异构算力支撑下,云燧智算机能够提供卓越的AI性能。

云燧智算机整体设计
云燧智算机整体设计
  • PUE=<1.1,满足新型数据中心要求

基于双碳目标以及绿色环保的总体趋势,无论是新型数据中心的规划建设,以及东数西算的政策性要求,都对数据中心整体能效(Power Usage Effectiveness,PUE)有明确的优化指标性要求。云燧智算机采用一体化冷板式液冷技术,实现单节点8颗高性能人工智能芯片液冷散热,通过液冷板等高效热传导部件将被冷却对象的热量传递到自然冷媒中,采用先进流量控制系统,大幅提高流量变化范围、降低能耗,拥有架构简约、系统可靠、智能监控等特性,PUE可降至1.1及以下。

搭载经业务实证的AI芯片,软硬协同算尽其用

  • 突破E级算力,最高可支持超千卡规模集群

依托于"邃思"芯片核心能力,在典型配置下,云燧智算机每单元可达到8PFLOPS的TF32浮点算力,并且支持按需横向扩容,可支持数千卡规模集群,突破E级算力,打造业界领先的超级算力集群。

  • 软件协同,充分释放集群的生产力价值

目前算力构成复杂,多CPU架构,多异构计算单元,并且考虑到集群本身一般服务于多用户、多场景的特性,如何能够对上层用户屏蔽底层算力异构性、赋能用户高效开发与部署上线AI应用,真正释放集群作为生产力工具的价值 -- 软件是关键要素。

燧池智算平台(CloudBlazer Station)是全栈式人工智能开发服务平台和通用的大规模算力管理平台,结合强大的云燧AI算力集群和先进的大规模算力资源调度,为用户提供人工智能模型生产及应用发布的全流程服务,能够一站式满足复杂的人工智能业务场景对人工智能服务的需求。

燧池智算平台(CloudBlazer Station)
基于燧原科技过往多个大规模AI算力中心工程实践
  • 可支持超千亿参数巨量模型的高效、并行训练

大规模数据训练超大参数量的巨量模型是人工智能的发展方向,"预训练大模型+下游任务微调"的模型开发方式将极大提升企业的AI应用开发效率,开发者只需要少量行业数据就可以快速开发出精度更高、泛化能力更强的AI模型。

而训练出一个大模型,除了算法和数据,还需要超大规模的算力支撑。基于云燧智算机所构成的大规模集群解决方案采用高带宽、全互联拓扑架构,计算、存储、管理网络全分离,计算节点内基于GCU-LARE2.0多芯互联技术提供近1TB/s的互联带宽,跨节点互联能力高达600Gb/s,可实现千卡级大规模集群高速互联,具备优异的线性加速比以支撑超千亿参数巨量模型的高效、并行训练。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

是德科技(Keysight Technologies, Inc.)现已开启与全新 NVIDIA 6G 研究云平台的合作。该平台包括 NVIDIA Aerial Omniverse 数字孪生,这是一个开放、灵活的网络仿真资...

关键字: 6G 人工智能 RAN

纵观人类近现代史,每一次工业革命都是将战略性科技转化为生产力,从而创造巨大的新增财富和全面提升国家竞争力的过程;而且一个国家在工业革命面前的“沉与浮”,则取决于一个国家对这些战略性科技和产业化能力的把控。从被称为蒸汽机时...

关键字: 人工智能 算力 大模型

云和超大规模服务运营商正不断增大计算密度。随着 Microsoft Cobalt、阿里巴巴的倚天 710、AmpereOne等配置 128 核或以上的 CPU 设计进入市场,单个封装可实现的性能更强,且下一代的目标还将远...

关键字: CPU 处理器

Arm Neoverse 旨在为从云到边缘的全场景基础设施用例提供高性能和出色能效。针对需要更高性能的工作负载和用例,Arm 推出了 Neoverse V 系列。其中,Neoverse V2 核心已被行业先行者广泛部署于...

关键字: 云计算 人工智能 CPU

本文中,小编将对人工智能AI予以介绍,如果你想对它的详细情况有所认识,或者想要增进对它的了解程度,不妨请看以下内容哦。

关键字: 人工智能 AI

在这篇文章中,小编将为大家带来人工智能AI的相关报道。如果你对本文即将要讲解的内容存在一定兴趣,不妨继续往下阅读哦。

关键字: 人工智能 AI

“人工智能+”时代将至 超过90%的受访企业将招聘人工智能人才列为首要任务,但62%的受访企业在招聘所需人才时面临困难

关键字: 人工智能 生成式AI 机器学习

今天,小编将在这篇文章中为大家带来人工智能AI的有关报道,通过阅读这篇文章,大家可以对它具备清晰的认识,主要内容如下。

关键字: 人工智能 AI

通过与北美J-Squared Technologies、南美Macnica DHW以及日本NEXTY Electronics三家企业深化合作,Hailo实现了迅速成长,并逐步拓宽了其全球商业版图。

关键字: 人工智能 处理器 芯片

本文中,小编将对 CPU 开核予以介绍,如果你想对它的详细情况有所认识,或者想要增进对 CPU 开核的了解程度,不妨请看以下内容哦。

关键字: CPU 开核
关闭