当前位置:首页 > 嵌入式 > 嵌入式新闻
[导读]GPU重分IT奶酪

当年一场场CPU革命把人类推上了IT列车,如今GPU正把火车换成飞机。而一直在IT方面不断追赶的中国,此次也搭上了头等舱。

  近日,中国科学院和清华大学分别被授予CUDA卓越中心的称号,以表彰他们在利用GPU进行高性能计算的突出贡献,而亲自授予他们这个荣誉的正是GPU计算革命的发起者和主导者-----NVIDIA(英伟达)公司。

  在双方眼中,GPU计算不仅是世界IT业的下一场革命,也是中国赢得IT奶酪的绝佳机会。

  GPU取长CPU补短

  在人们都习惯了“Intel Inside”之后,再提计算革命似乎总有点班门弄斧,但事实胜于雄辩,GPU以极其强悍的数据证明,下一场颠覆性的计算革命已经到来,世界需要新的计算之王。

  这不是噪音,也不是口号,而是正在发生的巨变。

  在英特尔的奔腾时代,摩尔定律让处理器的主频时钟速度在短短几年显著提升。但是随着摩尔定律的进步,从45纳米到32纳米,CPU集成的晶体管越来越多,但在高性能计算方面性能还不能满足用户持续增长的需求。同时基于CPU的大型计算服务器也由于高额的采购成本和维护费用也成为了无法逃避的弊端。

  高性能计算的明天在哪里?革命在何方?GPU计算应运而生。

  如果说上一次计算革命——集成电路,让过去占据一幢房子大小的高性能计算机缩小到一个房间,也就此掀起一场个人消费电脑的普及革命。而如今GPU计算的革命可以将几个房间大小的高性能计算服务器缩小成一台个人电脑的大小,以GPU为基础的个人高性能超级计算机就此诞生!

  改变的秘密在于CPU和GPU的本质区别。

  CPU的设计宗旨就是要从指令流中得到最高的处理效能,即要用最短的时间完成一项任务,这就是串行计算,但串行计算架构的CPU天生就不适合高性能计算领域所强调的并行计算工作,这是为什么CPU现在成为了高性能计算性能提升的瓶颈。

  相形之下,始于图形处理的GPU一开始就是被设计来处理大规模的并行计算,数千万的多边形和像素的并行处理使得GPU在发展的同时不断地加入更多的处理核心并完善并行处理能力。

  举个今天GPU计算应用的实例,比利时安特卫普大学原来用的超级计算机有512颗处理器核,成本是530万美元,占用了好几个机柜;而后来换成一台拥有8个GPU的台式系统,性能相当,成本只有7000美元,占地面积也大为减少。以GPU计算为基础的高性能计算服务器在成本、性能等方面的优势毋庸置疑。

    但拥有先天的强大并行计算能力的GPU被广大高性能计算用户所接受的道路并非一帆风顺。

  作为先驱者,NVIDIA(英伟达)1999年就推出GPU,2002年就开始大力推广GPU计算技术,推出第一个可编程的GPU,提出了GPGPU概念,即具有通用计算用途的GPU,这开始让CPU厂商恐慌。但GPGPU编程难度太高,无法快速推广。

  2003年,NVIDIA(英伟达)开始全新尝试,举三年之力,于2006年成功推出CUDA架构(Compute Unified Device Architecture),于2007年正式发布。

  CUDA是一个更适合于并行计算的架构,提供了硬件的直接访问接口,并率先提供了针对GPU(图形处理器)编程的C语言开发环境。

  CUDA是由NVIDIA(英伟达)推出的通用并行计算架构。该架构充分将GPU强大的并行计算能力调动起来,使GPU能够在解决复杂计算问题上发挥其先天的优势。开发人员现在仅使用C语言(C语言是应用最广泛的一种高级编程语言),就能在基于CUDA架构的GPU(图形处理器)上编写程序,所编写出的程序可以在支持CUDA的处理器上以超高性能运行。CUDA将来还会支持其它语言,包括FORTRAN, Python以及C++。[!--empirenews.page--]

  不仅如此,CUDA还是免费的开源技术,使广大开发者都能挖掘NVIDIA(英伟达) GPU巨大的计算能力,解决复杂的科学运算问题。

  CUDA技术开启了GPU实现通用运算的大门,是GPU从专用平台走向通用平台的一个里程碑,自然也是下一场计算革命的真正起点。

  与英特尔的X86架构不同,CUDA基于GPU,但不拘于GPU,而是取长补短,将CPU串行计算和GPU的并行计算融合,开启“CPU+GPU协同计算”的全新时代,即“异构计算”。

  “异构计算”真正实现了系统整体计算能力的最大化利用:GPU和CPU协同工作,GPU处理大量的图形和并行处理,CPU处理操作系统和指令的逻辑控制。

  两者的协同比以往单纯CPU运算高出几十倍甚至几百倍,上千倍,将一直局限在大型服务器集群和超型计算机领域的高性能计算推向主流,可以使得PC和工作站具有超级计算的能力,使得个人超级计算机的普及成为可能,成为一场真正的革命。

  目前,基于CUDA架构的GPU不仅成为游戏玩家的最爱,也受到科研机构的青睐。诸如地质勘探、生物科学、流体力学、金融建模、医疗成像、有限元计算等新兴应用领域,都开始广泛地通过CUDA架构利用到GPU强大并行处理能力,所有开发人员都能够使用标准的C语言,挖掘GPU中多个处理单元强大的并行计算能力。

  随着开发人员的不断壮大,现在GPU计算渗透的领域不断增加,与CPU并驾齐驱。

  迄今为止,NVIDIA(英伟达)已经在全球卖出了超过1亿颗以上支持CUDA架构的GPU产品,CUDA开发人员的数量已经超过25000人,应用程序超过100个,全世界有250多所大学开设了CUDA课程,包括中国科学院、清华大学等,GPU计算的生态系统已经形成。

    目前由GPU集群组成的高性能计算机集群数量已经达到30个,预计到2010年采用NVIDIA(英伟达) Tesla GPU构建的超级计算机有望进入全球高性能计算机TOP500排行榜的前十位。

  中国奶酪

  GPU运算无疑将改变世界IT产业的版图。可喜的是,包袱较少的中国在接受新潮流方面处于更加有利的地位。

  如今,中科院、清华大学、中国同济大学、上海交大、西安交大等7所高校已经将基于CUDA架构的并行计算课程融入其教学之中,其中中科院和清华大学已经走到全球CUDA应用的前列。

  在学术机构支持下,NVIDIA(英伟达)的GPU计算迅速超越大学与科研机构,为中国顶级工业效力。[!--empirenews.page--]

  在宝钢,使用异构计算技术使得冶金过程模拟时间从一天缩短到两分钟,效率提高了50倍以上;在清华大学,采用GPU使得过去要用一个小时的三维图像重构减少到几十秒甚至几秒钟,将实时重构的不可能变为可能;在中国科学院北京基因组研究所,采用GPU+CPU混合计算平台做基因比对比传统CPU集群快30倍,而功耗降低5倍,成本降低10倍。

  2009年4月,中国科学院过程工程研究所抓住 GPU编程环境更新的机遇,采用NVIDIA(英伟达)Tesla技术自主研制成功基于多尺度离散化并行计算模式的计算系统,这是中国第一套单精度峰值超过每秒1000万亿次浮点运算的超级计算系统,将中国的高性能计算机水平推到全球前列,代表了中国国家能力的增强。

  NVIDIA(英伟达)正与中国的科研机构和产业一起,推动着一场基于GPU计算的集成创新的革命,这将帮助中国IT产业实现集成创新的“跨越式可能”。

  每一次技术革命的兴起都是一个拐点,既是企业的拐点,也是行业的战略转折点,乃至国家、政府和民族的战略转折点。

  过去20年,在摩尔定律的带领下,在CPU为中心的时代里,中国IT业只有一路跟跑,一路落后。尽管有863计划,尽管有龙芯等一系列项目,但实现核心技术突破的难度越来越大。

  在原始创新方面,中国IT产业已经注定处于劣势,原因有三。

  第一,中国IT企业的技术、人才积累远远不如国外企业;第二,资金实力不足以应付如今IT产业大规模、高投资的研发趋势,英特尔、三星等企业每年投入的研发资金都超过50亿美元,仅建设半导体产业芯片生产线就需要数百亿投资;第三,技术发展速度加快,摩尔定律下,芯片集成度每18个月就翻一番,因此,在英特尔和微软控制核心知识产权的世界里, 中国IT产业想靠原始创新切入,可能性很低。

  另一方面,中国在第二次创新浪潮中“市场换技术”策略最终败给了残酷的事实。
   
    因此,在IT的世界里,中国只剩下一条路好走,那就是“集成创新”,这是中国IT产业自主创新的必由之路,也是最现实的选择。集成创新是把已有的知识、技术等生产要素创造性地加以集成,以系统集成的方式创造出前所未有的新产品、新工艺、新生产方式或新服务方式,以满足不断发展的新需求。

  通过集成创新,我们还能逐渐培养自主创新的能力。

  GPU计算革命,恰好为中国IT产业提供了极大的市场应用机遇。CUDA采取免费开源,GPU编程语言也基于标准的C语言,这意味着基于CUDA架构的集成创新具有广泛的应用前景,是支撑中国IT企业集成创新的理想平台。

  CPU时代造就了微软,GPU时代将造就一批新的王者,而中国称王的机会远比CPU时代均衡。

  过去10年间,GPU 的计算能力飞速发展,基本上平均6个月就性能翻倍,预计GPU的浮点性能将每两年翻一番。这是新的摩尔定律,也是中国IT产业实现跨越式发展的末班车。

  中国应当在这块奶酪中争取更多的份额,否则将会在下一个时代继续挨饿。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

近日,一则有关“砺算科技濒临破产”的消息在业内不胫而走。虽然东芯股份有意收购其40%的股权,帮助砺算科技渡过难关,但这一投资事项能否最终完成仍存在不确定性。

关键字: GPU

慕尼黑2024年5月9日 /美通社/ -- TÜV南德意志集团(以下简称"TÜV南德")持续保障安全、可靠及可持续发展。作为全球化的服务提供商,TÜV南德2023年全年营收达约31亿欧元,首次突破30亿欧元大关,同比增长...

关键字: BSP 可持续发展 数字化 人工智能

5月11日消息,Arrow Lake、Lunar Lake还没有发布,Intel再下一代处理器Panther Lake的消息就传出来了,CPU方面没啥惊喜,GPU又一次要飞跃。

关键字: GPU CPU 芯片

凭借深度学习技术和SmartBid产品,百度国际MediaGo获得美国商业奖认可 旧金山2024年5月6日 /美通社/ -- 第22届美国商业奖(American Business Award®)近日发布获奖名...

关键字: MEDIA GO SMART BSP

近日,联发科在深圳隆重举办了天玑开发者盛会2024(MDDC 2024),展示了联发科在科技创新方面的卓越实力。在此次盛会上,联发科隆重发布了备受瞩目的旗舰5G生成式AI移动平台——天玑9300+。作为联发科旗舰芯片系列...

关键字: 天玑9300+ 生成式AI GPU

Optiver通过包括EPYC CPU、Solarflare以太网适配器、Virtex FPGA和Alveo加速卡在内的高性能AMD解决方案搭建其业务基础

关键字: CPU 数据中心 以太网

近期,联发科在深圳举行了备受瞩目的天玑开发者大会2024(MDDC 2024),主题为“AI予万物”。作为移动游戏技术领域的重要先驱,联发科联合全球各地的游戏厂商、开发者和终端制造商等生态伙伴,共同探讨了移动游戏产业的新...

关键字: 天玑 GPU

利用LogiCoA™微控制器,以更低功耗实现与全数字控制电源同等的功能

关键字: 微控制器 电源 CPU

北京——2024年4月25日 我们的客户选择亚马逊云科技运行他们的关键应用程序和最敏感的数据。每天,世界上发展最快的初创公司、最大的企业和最值得信赖的政府机构都选择亚马逊云科技作为技术基础设施平台。他们之所以选择亚马逊云...

关键字: GPU 计算 生成式AI

上海2024年4月17日 /美通社/ -- 在2024 F1中国站即将拉开帷幕之际,高端全合成润滑油品牌美孚1号今日举办了品牌50周年庆祝活动。三届F1年度车手总冠军马克斯•维斯塔潘也亲临现场,共同庆祝这一里程...

关键字: BSP 汽车制造 行业标准 产品系列
关闭
关闭