当前位置:首页 > 芯闻号 > 产业新闻
[导读]北京2022年12月19日 /美通社/ -- 浪潮信息副总裁、浪潮AI&HPC产品线总经理刘军在近日举行的量子位“MEET2023智能未来大会”上发表了主题演讲《AI新时代,智算力就是创新力》。 在该大会公布的“2022人工智能年度评选”榜单上,浪潮信息获评为“2022...

北京2022年12月19日 /美通社/ -- 浪潮信息副总裁、浪潮AI&HPC产品线总经理刘军在近日举行的量子位“MEET2023智能未来大会”上发表了主题演讲《AI新时代,智算力就是创新力》。

在该大会公布的“2022人工智能年度评选”榜单上,浪潮信息获评为“2022年度人工智能领航企业”,刘军获评为“2022年度人工智能领军人物”。

浪潮信息刘军:AI新时代,智算力就是创新力


以下为刘军在MEET2023智能未来大会的演讲实录:

为什么说智算力就是创新力?

当今在人工智能前沿领域的大模型,就是在智算算力驱动下重大创新的典型,比如GPT-3,浪潮“源1.0”等等,这些大模型发展的背后是算力的极大支撑。 

我们提出用“算力当量”来对AI任务所需算力总量进行度量,单位是PetaFlops/s-day也就是PD,即用每秒千万亿次的计算机完整运行一天消耗的算力总量(PD)作为度量单位。一个任务需要多少PD的计算量,就把它视为这个任务的“算力当量”。GPT-3的算力当量是3640个PD,源1.0是2457亿的参数的大模型,它的算力当量是4095个PD。

当前元宇宙非常关注的数字人的建模和渲染方面,如果要做一个栩栩如生的人物形象的创建和渲染,以《阿丽塔:战斗天使》来举例,它平均每一帧需要花100个小时来渲染,总共这部影片的渲染计算使用了4.32亿小时的算力。

在自动驾驶领域,特斯拉创建了DOJO的智算系统,用于感知模型的训练和仿真。它的FSD全自动驾驶系统的融合感知模型,训练消耗的算力当量是500个PD。

在备受关注的AI+Science领域、蛋白质的结构预测、分子动力学的模拟、流体力学的仿真,它不仅融合了传统的HPC计算也融合了当今的AI计算。比如说,经常被提及的AlphaFold2,它的训练消耗的算力当量是300个PD。与此同时,为AlphaFold2训练所做的数据准备,需要花费200M CPU-hours HPC算力。

我们可以确切地认识到,今天在AI领域的众多创新背后离不开智算力的支撑,可以说智算力就是创新力。

浪潮信息刘军:AI新时代,智算力就是创新力


接下来和大家来分享当前智算发展的三个重要的趋势:算力多元化、模型巨量化以及元宇宙。

算力多元化需要软硬一体的支撑平台

第一,算力多元化。Henessy和Patterson在几年前的《计算机架构的新黄金时代》中提出了特定领域的体系架构Domain Specific Architectures(DSAs)的概念,这也可以用来解释为什么今天我们会看到这么多的多元算力芯片。

在中国,市场上有十几种的CPU芯片,有将近一百种AI算力的芯片。为什么会有这样的需求?今天算力的应用场景是多元化的,不同的场景需要不同的计算精度类型和计算特征。比如说,高性能计算里面可能会需要FP64双精度计算,AI训练需要使用数字范围更大、精度低的16位浮点计算,AI推理可以使用INT8或者INT4格式。而为适应这些计算的特点,需要我们引入多元的芯片来进行支撑。如何从软件和硬件上来应对这样的挑战?浪潮信息认为,重点是从系统的硬件平台和软件角度来进行相应的创新支撑。

浪潮信息刘军:AI新时代,智算力就是创新力


首先是在硬件方面的系统支持,当今AI计算用的非常多的还是采用英伟达GPU的AI服务器。但是对于其他品牌的AIPU来说,要用什么样的一个AI服务器系统来支撑呢?浪潮信息打造了全球首款开放加速的AI服务器,在一个系统里能够支持8颗国内最高性能的AI芯片进行高速互联,从而能够完成大规模的模型训练所需要的算力。芯片之间使用了开放加速的接口标准,芯片间可以进行高速通信。今天,这个系统已经可以支持多个品牌的国内最高端的GPU和AIPU,并且已经在众多的客户场景里面实现了落地。同时,它还支持先进的液冷技术,使得我们构建的AI算力集群的PUE会低于1.1。

作为智算中心的核心,如何来调度多元的算力?这是一个平台软件方面的挑战,浪潮为此推出了业界首款智算中心算力调度软件AIStation,实现了对异构AI芯片进行标准化与流程化管理,不仅能够充分发挥多元异构芯片的性能潜力,并且能够提升智算中心的整体效能。从基本的接入适配到业务应用在异构算力的使用优化,AIStation提供了完备的工具与解决方案,与传统开源方案相比,芯片接入稳定性方面提升30%,减少接入工作量90%以上。标准化、流程化也使得AIStation在芯片管理种类上达到了业界前列,已经支持了30多款国内外最顶尖的AI芯片,包括X86和ARM等CPU芯片、FPGA芯片,也包括今天应用非常广泛的GPU和AIPU,例如像英伟达的GPU系列,以及各类国产AIPU等等。

我们做了众多的实践落地,位于宿州的淮海智算中心采用全球领先的“E级AI元脑”智算架构,通过开放多元的系统架构,在底层基础设施层支持通用处理器、通用加速处理器、专用芯片、可编程芯片等,通过AIStation实现了异构算力的调度,提供FP64、FP32、FP16、INT8等多种精度的计算类型支持,并支持国内外主流的深度学习的框架、数据库、数据集以降低用户的学习成本。

大模型成为AIGC算法引擎

第二,大模型。大模型正在成为AIGC的算法引擎,今天大家看到的DALL・E或者Stable Diffusion的背后都是大模型在驱动。大模型使得AI从五年前的”能听会看”,走到今天“能思考、会创作”,下一步甚至于到“会推理、能决策”的进步。但是我们知道大模型带给我们的是在算力方面巨大的挑战。如何能够把大模型的能力交付到众多的中小企业中,帮助他们实现智能化的转型,是我们今天要去解决的重要课题,所以在这方面我们认为Model as a Service(MaaS)是比较好的一种方式。

今天,在大模型的能力加持下,AIGC,包括文本生成、文生图以及虚拟数字人等应用都会快速的进入到商业化阶段。

“源1.0”是浪潮去年推出的中文语言巨量模型,拥有2457亿参数,在众多的评测里面表现出了非常优异的成绩。团队围绕深度学习框架、训练集群IO、通信开展了深入优化,构建了面向大模型的软硬件协同体系结构,训练平台的算力效率达到45%,这遥遥领先于GPT-3、MT-NLG这样的大模型。同时,通过在AI编译器与深度学习推理框架上的优化,“源”已经实现了对多元AI芯片的支持。

下面分享几个基于“源1.0”构建的实际应用案例:

第一个案例是AI剧本杀。剧本杀是大家比较熟悉的游戏,一位开发者基于“源1.0”构建了一个AI角色来和人类玩剧本杀,玩到最后其他人类玩家都很难察觉到自己是在和AI一起玩剧本杀,因为AI在这里面所表现出来的场景理解能力、目的性对话能力是我们在传统的AI算法上面很难见到的。目前项目已经在GitHub上开源,大家感兴趣可以尝试。

第二个案例,上海一个开发者群体基于“源1.0”构建了数字社区助理,类似于给我们的居委会打造了一个教练员,通过让AI模拟来居委会咨询的居民,提升社区工作者应对居民突发状况服务的能力,这种将大模型反向应用于教培领域的案例给AI发展带来了更多想象空间。

浪潮信息刘军:AI新时代,智算力就是创新力


最近,大家都在讨论ChatGPT,简单来说它就是基于大模型的面向长文本、多轮对话的AIGC应用。其实我们基于“源1.0”也开发了公文写作助手。现在大家希望有个助手来协助写总结报告、学习体会,所以我们希望打造一个写作助手来帮助大家进行长本文创作。其中,我们突破了可控文本内容生成技术,解决了长文本内容偏移问题,生成文本的语义一致性高达96%。这样的优化使得我们的中文写作助手能够带来非常惊艳的效果,目前我们的产品处于内测阶段,欢迎大家来申请使用。

我们把“源”大模型应用在浪潮自己的业务上,赋能自身业务智能化转型。浪潮信息是中国最大、全球第二的服务器厂商。我们拥有一个覆盖非常广泛的客户服务系统,传统的智能客服更多是基于规则和提炼的知识来构建的问答系统,这样的问答系统大部分情况下是不能帮客户满意地解决问题的。今天基于“源1.0”构建的浪潮信息智能客服可以进行长文本的内容生成,能够持续地多轮对话,同时非常重要的是它不仅仅是基于知识规则而构建的问答系统,它可以自己去阅读和服务器相关的产品技术文档,我们说它可谓是服务器的“服务大脑”,在它的支撑下,浪潮信息的客户服务效率得到了大幅的提升,这个项目荣获了《哈佛商业评论》鼎革奖,即年度新技术突破奖。

元宇宙需要强大的算力基础设施

第三,元宇宙。大家可能会惊奇元宇宙需要算力吗?我们告诉大家,元宇宙非常需要算力。元宇宙的构建有四个大的作业环节,协同创建、高精仿真、实时渲染、智能交互,每一个环节上面都需要大量算力做支撑。比如说,在高精仿真的阶段,要实现元宇宙场景中逼真的、符合物理定律的仿真,不仅需要AI计算,同时还需要HPC算力。在图形渲染环节,不仅传统的光线追踪、路径追踪等图像渲染算法需要大量算力,当今基于AI的DLSS等算法也需算力支撑。到了最后的智能交互环节,今天所看到的数字人、多轮的语言交互等等,它背后都是基于算力才得以实现,这就是为什么说元宇宙需要强大的算力支持。

今年浪潮信息推出的MetaEngine元宇宙服务器就是为了应对这样的算力挑战,有兴趣的可以看下我们如何基于MetaEngine来创建虚拟数字人和数字孪生的全过程。

浪潮信息刘军:AI新时代,智算力就是创新力


为了推动了元宇宙的快速落地,上个月青田人民政府和浪潮信息和我们合作伙伴谷梵科技一起,签约建设国内首个元宇宙算力中心,用于支撑在青田、浙江乃至于长三角在元宇宙的数字空间创建、数字产业发展,支撑数字经济、数实融合的发展。

我的演讲到此结束。谢谢大家!

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

随着人工智能(AI)模型变得越来越复杂,数据量不断攀升,数据中心正在通过改变系统架构,来实现更快、更高效的处理。

关键字: AI 连接器

近日举办的GTC大会把人工智能/机器学习(AI/ML)领域中的算力比拼又带到了一个新的高度,这不只是说明了通用图形处理器(GPGPU)时代的来临,而是包括GPU、FPGA和NPU等一众数据处理加速器时代的来临,就像GPU...

关键字: FPGA AI 图形处理器

西门子作为制造业数字化转型成功的代表企业之一,面对生产、服务与业务增长等挑战,积极拥抱AI、自动化等新兴技术,优化企业业务流程,打造企业数字化技术新基座,开拓出更多业务转型思路。

关键字: 自动化 AI 数字化

2024年3月20日,2024中国闪存市场峰会(CFMS2024)在深圳宝安前海·JW万豪酒店盛大举办。本次峰会以“存储周期、激发潜能”为主题,共同探讨在供需关系依然充满挑战的大环境下,未来存储市场的变化,以及如何挖掘产...

关键字: SSD 存储 AI

近日,胡润研究院发布《2024家大业大酒·胡润全球富豪榜》。70岁的钟睒睒财富比去年缩水9%,以4500亿元连续第四次成为中国首富,位于全球第21位,同比下降6位。44岁的黄峥财富比去年增长71%,即1600亿元,是今年...

关键字: 钟睒睒 AI

根据戴尔日前发布的一份文件,该公司在过去一年里裁掉了大约6000名员工,以改善财务状况。

关键字: 戴尔 AI

IDC在日前发布的一份名为《全球AI和GenAI支出指南》报告中指出,2023年生成式人工智能(GenAI)的支出占欧洲AI总支出的9.6%,而在未来三年内这一比例将提升至25%。

关键字: 生成式人工智能 GenAI AI

台湾新竹 – 2024年3月26日 – 新唐科技宣布推出基于微控制器的终端AI平台,使AI生态系扩展至微控制器领域。此解决方案是基于新唐全新架构设计的微控制器和微处理器,包括NuMicro® MA35D1、NuMicro...

关键字: AI 智能家居 机器学习

近日,英特尔在深圳举办以“智绘混合AI新篇, 赋能生成式 AI 无处不在 -- OpenVINO™ 2024 焕新启航”为主题的OpenVINO™ DevCon中国系列工作坊2024活动,此次活动汇聚了英特尔产品专家、行...

关键字: AI 英特尔 AIGC大模型
关闭