当前位置:首页 > 智能硬件 > 人工智能AI
[导读] AlphaGo(阿尔法狗)战胜了柯洁,人工智能赢了,赢家仍然是人类! 深度强化学习DRL,其中一个最最经典的应用就是谷歌DeepMind团队研发的围棋程序AlphaGo(阿尔法狗)。Al

AlphaGo(阿尔法狗)战胜了柯洁,人工智能赢了,赢家仍然是人类!

深度强化学习DRL,其中一个最最经典的应用就是谷歌DeepMind团队研发的围棋程序AlphaGo(阿尔法狗)。AlphaGo的胜利将深度强化学习推上新的热点和高度,成为AI人工智能历史上一个新的里程碑。

有必要跟大家一起探讨一下AlphaGo(阿尔法狗),了解一下AlphaGo背后神奇的AI力量。

围棋的程序设计:

围棋是一个完美的、有趣的数学问题。

围棋棋盘是19x19路,所以一共是361个交叉点,每个交叉点有三种状态,可以用1表示黑子,-1表示白字,0表示无子,考虑到每个位置还可能有落子的时间、这个位置的气等其他信息,可以用一个361 * n维的向量来表示一个棋盘的状态。则把一个棋盘状态向量记为s。

当状态s下,暂时不考虑无法落子的地方,可供下一步落子的空间也是361个。把下一步的落子的行动也用361维的向量来表示记为a。

于是,设计一个围棋人工智能的程序,就转变为:任意给定一个s状态,寻找最好的应对策略a,让程序按照这个策略走,最后获得棋盘上最大的地盘。

谷歌DeepMind的围棋程序AlphaGo(阿尔法狗)就是基于这样思想设计的。

AlphaGo概述:

AlphaGo(阿尔法狗)创新性地将深度强化学习DRL和蒙特卡罗树搜索MCTS相结合, 通过价值网络(value network)评估局面以减小搜索深度, 利用策略网络(policy network)降低搜索宽度, 使搜索效率得到大幅提升, 胜率估算也更加精确。

MCTS必要性:

AlphaGo(阿尔法狗)系统中除了深度强化学习DRL外,为什么还需要蒙特卡罗树搜索?

围棋棋面总共有19 * 19 = 361个落子位置。假如计算机有足够的计算能力,理论上来说,可以穷举黑白双方所有可能的落子位置,找到最优或次优落子策略。如果穷举黑白双方所有可能的落子位置,各种组合的总数,大约是 250^150 数量级,即围棋的计算复杂度约为250的150次方。假如采用传统的暴力搜索方式(遍历搜索方式),用当今世界最强大云计算系统,算几十年也算不完。按照现有的计算能力是远远无法解决围棋问题的。早期计算机围棋软件通过专家系统和模糊匹配缩小搜索空间, 减轻计算强度, 但受限于计算资源和硬件能力, 实际效果并不理想。

但是到了2006年,蒙特卡罗树搜索的应用标志着计算机围棋进入了崭新阶段。

AlphaGo系统组成:

AlphaGo(阿尔法狗)系统主要由几个部分组成:

1.策略网络(Policy Network):给定当前围棋局面,预测/采样下一步的走棋。

2.快速走子(Fast rollout):目标和策略网络一样,只不过围棋有时间限制,需要在规定时间内适当牺牲走棋质量情况下,快速落子,速度要比策略网络要快1000倍。

3.价值网络(Value Network):给定当前围棋局面,估计是白胜还是黑胜。

4.蒙特卡罗树搜索(Monte Carlo Tree Search):不穷举所有组合,找到最优或次优位置。

把以上这四个部分结合起来,形成一个完整的AlphaGo(阿尔法狗)系统。

蒙特卡洛树搜索 (MCTS) 是一个大框架,许多博弈AI都会采用这个框架。强化学习(RL)是学习方法,用来提升AI的实力。深度学习(DL)采用了深度神经网络 (DNN),它是工具,用来拟合围棋局面评估函数和策略函数的。蒙特卡洛树搜索 (MCTS) 和强化学习RL让具有自学能力、并行的围棋博弈算法成为可能。深度学习(DL)让量化地评估围棋局面成为了可能。

小结:

可以说 AlphaGo 最大优势就是它应用了通用算法,而不是仅局限于围棋领域的算法。AlphaGo胜利证明了像围棋这样复杂的问题,都可以通过先进的AI人工智能技术来解决。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

● Arm® 终端计算子系统(CSS)作为新的计算解决方案,结合了Armv9架构的优势,以及基于三纳米工艺节点,经过验证和证实为生产就绪的新Arm CPU和GPU实现,可赋能芯片合作伙伴快速创新,并加快产品上市进程。 ●...

关键字: AI 人工智能

高性能存储最远可以出现在什么地方?对于铠侠而言,从遥远的太空,到身边的手机、家电,几乎所有智能化设备与存储息息相关,特别随着各行各业对存储需求不断增多,存储容量和性能变得更为重要。

关键字: 存储 物联网 人工智能

5月30日消息,据媒体报道,日本经济产业省近日宣布,将在半导体、先进电子零部件、蓄电池、机床及工业机器人、飞机零部件等五大关键产业领域实施更为严格的监管措施,以遏制技术外泄风险。

关键字: 半导体 传感器 人工智能 电动汽车

5月26日,华为ICT大赛2023-2024全球总决赛闭幕式暨颁奖典礼在深圳举行。本届大赛为华为历届最大规模的线下比赛,共吸引了全球80多个国家和地区、2000多所院校、17万余名学生报名参赛,经过国家赛、区域赛层层选拔...

关键字: ICT 华为 大赛 人工智能

近日,整数智能与浪潮信息签署元脑生态战略合作协议。双方将秉持协同共生、开放共赢的原则,在元脑生态的框架内开展AI与数据科学领域的深度协作,共同为各行业提供更安全高效的数据管理平台,用智能标注助力数据生产的低成本、高精度、...

关键字: 自动化 人工智能 元脑生态

2024年5月25日,上海市欧美同学会长宁分会与曼彻斯特大学中国中心以"智能向善 AI for good"为主题,联合举办了"第二届人工智能论坛"。人工智能领域的企业家和专家学者发表主题演讲及参与圆桌论坛,逾百余位海归学...

关键字: 人工智能 AI 大语言模型

进入人工智能时代,数据重要性进一步凸显。今年,国家数据局等17部门联合印发的《"数据要素x"三年行动计划》指出,要以数据驱动发现新规律、创造新知识,加速科学研究范式变革。北京材料基因工程高精尖创新中心在浪潮信息助力下,通...

关键字: 新材料 数据中心 人工智能

2024年5月28日,中国上海 —— 今日,备受瞩目的Keysight World Tech Day 2024在上海隆重拉开帷幕。作为是德科技年度盛大的技术交流盛会,它不仅是电子测试测量及相关应用领域最新行业趋势与前沿测...

关键字: 测试测量 人工智能 新能源汽车

加利福尼亚州 坎贝尔 – 2024 年 5月 21 日 – Arteris, Inc.(纳斯达克股票代码:AIP)是一家领先的系统 IP 供应商,致力于加速片上系统(SoC)的创建,晶心科技(台湾证券交易所股票代码:65...

关键字: 片上系统 RISC-V 人工智能

5月23日消息,近日在澳门举行的BEYOND国际科技创新博览会上,科大讯飞董事长刘庆峰表示,中美在通用大模型底座上的差距,是半年到一年半之间的动态追赶,不会被甩开。

关键字: 科大讯飞 人工智能 AI
关闭
关闭