当前位置:首页 > 厂商动态 > 阿里云
[导读]11月3日,2022云栖大会上,阿里巴巴集团副总裁、阿里云基础设施负责人周明表示,阿里云将服务器、网络、数据中心进行了一体化架构升级,打造成“一台超高速运转的计算机”,并为这台发动机研发了一套超高性能的网络——磐久PredFabric,长尾时延显著降低90%,低至2微秒。


11月3日,2022云栖大会上,阿里巴巴集团副总裁、阿里云基础设施负责人周明表示,阿里云将服务器、网络、数据中心进行了一体化架构升级,打造成“一台超高速运转的计算机”,并为这台发动机研发了一套超高性能的网络——磐久PredFabric,长尾时延显著降低90%,低至2微秒。

磐久超高性能网络 解决AI算力难题

近几年人工智能、机器学习相关需求井喷,AI算力需求每3.5个月翻一倍,过去六年已增长了30万倍,面对这种爆发式的算力需求,简单粗暴的硬件堆砌不可持续。虽然市面上许多AI硬件(包括GPU、FPGA等)的计算能力很强大,但它们的内存资源非常稀缺,当内存资源不足时,要么运算停滞,要么会增加数据的无效传输,带来很大的运行开销,增加了时间成本。

周明透露,阿里云工程师为此打造了一套“磐久超高性能网络”,采用自研的Solar-RDMA高速网络协议,使处理器可以通过load/store指令访问其他任意服务器的内存,非常适合深度学习模型内神经网络的交互形态,相比传统模式可降低长尾时延90%以上,最低可至2微秒。

阿里云磐久超高性能网络亮相  时延降低90%至2微秒

同时,阿里云将云服务器的接入带宽提升了一倍,可达1.6Tbps,再配合上层的融合通信库ACCL,实现了在AI场景下的通信效率倍增,保障集群算力的线性输出,确保在大流量突发场景甚至部件异常的情况下,整个数据中心仍能保持稳定、高效的运转。

“灵骏”智算助力人工智能 释放高效算力

基于这套超高性能网络技术及软硬一体化能力,今年6月阿里云推出了新一代智能计算产品——灵骏,可最小化所有非计算开销,实现5倍的通信性能提升,千卡并行计算效率高达90%。

目前,“灵骏”不仅在阿里巴巴集团内大规模部署,也为广大企业提供算力服务。今年8月,小鹏汽车就基于“灵骏”建成了中国最大的自动驾驶智算中心“扶摇”,用于自动驾驶模型训练,训练速度相比传统模式下提升了近170倍。

阿里云磐久超高性能网络亮相  时延降低90%至2微秒

通过与阿里云合作,“扶摇”以更低成本实现了更强算力,将GPU资源虚拟化利用率提高3倍,端对端通信延迟降低90%至2微秒。整体计算效率上,实现了算力的线性扩展。存储吞吐比业界20GB/s的普遍水准提升了40倍,数据传输能力相当于从送快递的微型面包车,换成了20多米长的40吨集装箱重卡。

更绿色低碳的全球云计算基础设施

目前,阿里云基础设施层已形成了服务器、网络、数据中心一体化架构设计,具备计算异构、资源池化和加速引擎三大能力,支撑上层云计算产品和应用平台的算力释放最大化,从而实现数据中心利用率的全局最优。

阿里云磐久超高性能网络亮相  时延降低90%至2微秒

同时,阿里云还积极推动数据中心低碳转型,自主研发了单相浸没液冷技术,PUE低至1.09,大幅降低数据中心散热能耗。在清洁能源使用方面,2022年1-9月,阿里云五大数据中心清洁能源使用占比超过50%,累计减排二氧化碳77.4万吨,位列国内科技公司榜首。

“绿色是检验数据中心的黄金标准,我们将持续加强绿色自研技术创新投入,积极开展清洁能源电力交易,推动数据中心减碳增效。”周明表示。


本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

2月29日消息,今天阿里云召开了“2024阿里云战略发布会”。

关键字: 阿里云

10月31日,在2023云栖大会拓局海外 乘风远航——中国企业全球化专场上,阿里云发布了“中企出海分销伙伴招募计划”。该计划将邀请30家伙伴共同服务22万家中企出海。参与该计划的伙伴不仅能获得国际站权益,还可以共享合作伙...

关键字: 阿里云 出海

11月1日,2023杭州云栖大会上,阿里云瑶池数据库宣布已全面实现Serverless化,并接入通义等大模型能力,大幅提升数据库一站式及智能化水平。同时,PolarDB Always On系列推出3大重磅升级,首个数据智...

关键字: Serverless AI 阿里云 数据库

10月31日,杭州云栖大会上,阿里云宣布无影全新升级2.0:从云电脑到云上解决方案,帮助中小企业更便捷地构建云上办公,并开放无影产品及解决方案能力,为生态合作伙伴提供企业云平台,帮助其打造定制化的云电脑产品及解决方案。

关键字: 阿里云 无影 云电脑

10月31日,在2023云栖大会上,阿里云CTO周靖人表示,面向智能时代,阿里云将通过从底层算力到AI平台再到模型服务的全栈技术创新,升级云计算体系,打造一朵AI时代最开放的云。在现场,周靖人公布了云计算基础能力的最新进...

关键字: AI模型 阿里云 通义灵码

10月31日,2023杭州云栖大会上,阿里云宣布一项面向全国高校的重磅计划——“云工开物”计划,为中国4000多万高校学生每人送一台云服务器,希望帮助中国广大青年运用云和AI探索科技创新。

关键字: 阿里云 云服务器

10月31日,在2023云栖大会上,阿里云CTO周靖人表示,面向智能时代,阿里云将通过从底层算力到AI平台再到模型服务的全栈技术创新,升级云计算体系,打造一朵AI时代最开放的云。在现场,周靖人公布了云计算基础能力的最新进...

关键字: 阿里云 AI基础设施 大模型

10月31日,阿里云正式发布千亿级参数大模型通义千问2.0。在10个权威测评中,通义千问2.0综合性能超过GPT-3.5,正在加速追赶GPT-4。当天,通义千问APP在各大手机应用市场正式上线,所有人都可通过APP直接体...

关键字: GPT 阿里云 通义千问 大模型

能不能用大模型,为小朋友们创作属于自己的故事绘本?10月31日,童语故事创始人张华受阿里云邀请,在2023云栖大会主论坛上,分享了一位父亲用大模型创业的故事。

关键字: 大模型 阿里云
关闭