人工智能下一个10年:算力的黄金时代
【导读】AI技术在未来将会如何发展,在上一篇文章《人工智能下一个10年:敢问路在何方?》中,笔者从人工智能的三要素数据、算法、算力的角度阐述了AI产业的演进趋势。
AI时代的算力、算法和数据处在一种螺旋式的提升关系中。未来10年,我们将进入一个“算力为王”的智能社会,算力成为AI产业的核心驱动力,算力的发展也将开启它自己的黄金时代。
本文我们就从算力的发展说起,聊聊未来10年,算力的挑战和机遇。
算力有多重要?
几个月前,笔者拿到一份有关人工智能的报告——《2020-2021中国人工智能计算力发展评估报告》。
算力警告
人们从来没有想到过芯片的算力会有到达极限的一天,至少从来没有想到芯片算力极限会这么快到来。
-
每一网络遍历的计算量,或给定深度学习模型中单次遍历(即权值调整)所需的浮点运算数
-
训练整个模型的硬件负担,用处理器数量乘以计算速度和时间来估算
-
香农定律:定义了熵、信道容量和失真情况下压缩极限,我们距离这三个极限已比较接近
-
冯诺依曼架构:指五个最基本模块加上程序存储原理,是图灵意义下最好的一种实现。瓶颈在于数据和计算的分离。在深度学习中,庞大数据量本身就会形成一个瓶颈
-
摩尔定律:摩尔定律的不断演进发展,高性能芯片大幅降低了深度学习算法所需的计算时间和成本,摩尔定律正在逐渐放缓
-
重新定义“数据-信息-知识" ,制定全新的计算范式
-
设计实现全新的、通用的计算体系、感知体系、通讯架构
-
需要探索全新的芯片模态。传统的冯诺依曼架构已难以支持当前深度学习所需的计算要素
-
一是基于老架构,使其老树开新花,以英伟达、AMD、Xilinx和Google等为代表的芯片大厂基于冯诺伊曼计算架构继续发展GPU、FPGA和ASIC芯片
-
二是开发新架构,如存算一体芯片、软件定义硬件、类脑芯片等
AI芯片的关键技术和挑战
广义上所有面向AI应用的芯片都可以称为AI芯片,从功能上分为:
-
训练
-
对AI芯片有高算力、高容量和访问速率、高传输速率、通用性的要求
-
推理
-
对于AI芯片主要注重算力功耗比、时延、价格成本的综合能力。实验证明低精度运算(如float16,int8)可达到几乎和float32同等的推理效果,所以AI推理芯片有低精度算力的要求
-
AI芯片当前的核心是利用乘加计算(multiplier and accumulation,MAC)阵列来实现卷积神经网络中最主要的卷积运算的加速。MAC阵列的大量运算,会造成功耗的增加。很多AI应用的场景对于功耗都有严格的限制,如何达到优异的性能功耗比是AI芯片研发的一个重要目标
-
深度学习算法中参与计算的数据量庞大,导致内存带宽成为了整个系统的一个瓶颈“Memory Wall”也是需要优化和突破的主要问题
-
提高编译器和工具链软件的优化能力、易用性越来越重要
普惠的算力
正如前面阐述的,算力有多重要,就有多昂贵。巨大的算力需求,使得GPU价格一直居高不下。高昂的成本,让更多的用户在AI世界的大门面前望而却步。
-
Make it work
-
Make it perform
-
Make it cheap
-
针对芯片架构进行创新
-
AI应用不同于传统计算架构,AI的算法、模型均有各自特点,因此,从新设计芯片的架构,使得性能、能效比达到最优
-
这也是初创企业最大的机会
-
软件定义硬件
-
虚拟化、资源池化等技术实现算力的动态可调,按需供给
-
生态开放和开源
-
规模化使能产业,在产业中实现规模化
-
实现盈利,保证产业健康可持续
-
在产业发展演进中实现产品和技术迭代
展望下一个十年
未来10年,将是人工智能算力的“超摩尔时代”
-
一方面,芯片制程技术从7纳米、5纳米到3纳米不断突破
-
另一方面,将人工智能算法和算力耦合设计,智能芯片的算力密度提升将超越摩尔定律约束,从而带来性价比更高的智能算力,让算力无处不在
-
5G传输技术的加持,也将以更大的传输带宽、更低的延时,让智能实时、可感、泛在
结语
如果把人类“力”史简单分分类,大致分成三个阶段:
-
冷兵器时期的——“人力时代”:那时候的一切基本靠肌肉,人能制造工具,让自己区别于了其他生物
-
工业革命开启了“马力时代”:虽然叫马力,其实这个单位评价的一直是物理功率和化学能量
-
时至今日,人类正在逐步被“算力时代”所取代





