当前位置:首页 > 智能硬件 > 智能硬件
[导读]大学 Stephen McAleer 和团队透过一种被称为「自学叠代」(autodidactic iteration)的 AI 技术打造出「DeepCube」系统,成功让 AI 在面对任何乱序的 3 阶魔术方块时都可以成功找出正确解答。

魔术方块是非常有趣的益智玩具,但从难度来说,并不比其他棋类游戏困难,如果人工智能(AI)算法可以在国际象棋或围棋中轻松打败人类,那么复原魔术方块也不是这么困难的事。

但是事实上对于算法来说,要解出魔术方块的谜题和下棋是完全不同种类的任务。

过去在棋类游戏中展现出超人类表现的算法,都是属于传统的「强化学习」(RL)系统,这类型 AI 在确定某些特定的一步是实现整体目标的积极步骤时,便会获得奖励,进而使系统产生追求最大利益的习惯性行为,然而当 AI 无法确定这一步是否有益时,强化学习自然就无法发挥作用。

如果还是无法理解,试着这么想吧:在进行棋类游戏时,系统可以轻易去判定一个动作究竟是属于「好棋」或「坏棋」,但是在转动魔术方块时,你能够说出有任何特定的一步,是改善整体难题的关键吗?

从外观上来看,魔术方块是个很单纯的益智玩具,然而因为 3D 立体的特性,这让一般常见的 3 阶魔术方块就已有着惊人的近 4.33×1019 组合,而在其中,只有六面都是相同颜色的状态才能成为「正确解答」。

过去人们已经研究出许多不同算法和策略来解决这项难题,但 AI 研究人员真正的目标还是希望能像 AlphaGo Zero 那样,让 AI 在没有任何历史知识的情况下,学会自行应对随机的魔术方块难题。

而近期加利福尼亚大学 Stephen McAleer 和团队透过一种被称为「自学叠代」(autodidactic iteration)的 AI 技术打造出「DeepCube」系统,成功让 AI 在面对任何乱序的 3 阶魔术方块时都可以成功找出正确解答。

根据团队解释,自学叠代是一种全新的强化学习算法,与过去棋类游戏算法的处理方式不同,它采取了「反着看」的内部奖励判断机制:当 AI 提出一个动作建议时,算法便会跳至完成的图形开始往前推导,直到到达提出的动作建议,藉以判断每一步动作的强度。

虽然听来相当的繁杂,但这让系统能够更熟悉每一步动作,并得以评估出整体强度,一但获得足够数量的数据,系统便能以传统的树状搜索方式去找出如何移动最好的方法。

 

 

▲ DeepCube 自行找出的一种策略 aba-1,许多玩家也经常使用。(Source:arXiv via Stephen McAleer)

团队在研究中发现,DeepCube 系统在训练中自己找出了许多与人类玩家相同的策略,并在经过 44 个小时的自学训练后,已经能够在没有任何人为干预下,在平均 30 步以内复原任何随机乱序魔术方块──这些「最佳解答」不是和人类最佳表现一样好,就是比这些表现更好。

McAleer 和团队打算未来将在更大、更难解决的 16 阶魔术方块上进行测试,这项全新的系统将有助于 AI 应用更全面化,像是生物物理学上重要的蛋白质摺叠(Protein Folding)问题或也有望得以解决。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

业界应如何看待边缘人工智能?ST授权合作伙伴 MathWorks 公司的合作伙伴团队与ST 共同讨论了对边缘机器学习的看法,并与 STM32 社区分享了他们的设计经验。

关键字: AI 机器学习 处理器

业内消息,在昨天的中关村论坛未来人工智能先锋论坛上,生数科技联合清华大学正式发布中国首个长时长、高一致性、高动态性视频大模型——Vidu。Vidu是自Sora发布之后全球率先取得重大突破的视频大模型,性能全面对标Sora...

关键字: Sora 清华 AI Vidu

OPPO今日推出 Find X7全新配色 ——「白日梦想家」,为消费者带来更多选择。新配色采用独特釉层处理工艺,焕发如白瓷般柔润细腻的光泽,带来初夏般的清爽。Find X7「白日梦想家」以敢想敢做,坚韧信念、无限潜能的信...

关键字: Find X7 大模型 AI

4月26日,MediaTek宣布推出天玑汽车平台新品,以先进的生成式AI技术赋能智能​汽车的体验革新。

关键字: AI 汽车电子

2024年4月26日,中国深圳——2024年是OPPO品牌成立20周年。在2024年世界知识产权日,OPPO正式发布首份《OPPO创新与知识产权白皮书》,系统性地展现了OPPO 20载技术创新和知识产权保护成果。

关键字: OPPO 知识产权 AI

「人工智能浪潮下的中国制造」论坛顺利召开 上海2024年4月17日 /美通社/ -- 4月12日,由百年名校法国里昂商学院主办,斯巴诺萨设计承办,福州东湖数字小镇,福建亚太合会数字经济专委会协办的"中法建交6...

关键字: 微软 雷诺 AI 中国制造业

根据调研机构Gartner的预测,由于竞相投资AI以及IT设备更换周期的到来,全球2024年的IT支出将增长8%。

关键字: GenAI IT AI

据报道,日本电信巨头软银集团将在未来两年投资1500亿日元(9.6亿美元)升级其计算设施,该计划包括大量采购英伟达GPU。

关键字: 软银 英伟达 GPU AI

4月24日消息,特斯拉CEO马斯克在最近的财报电话会议上透露,特斯拉的Optimus人形机器人预计将在今年底前具备执行“有用的”工厂任务的能力,并有望在2025年底前推向市场。这一消息引发了业界和公众的广泛关注。

关键字: 马斯克 AI 特斯拉 GPU

眼下,人工智能不仅能辅助科学研究与艺术创作,还能实现自动驾驶、打造“无人农场”和“黑灯工厂”,成为解锁新质生产力的关键钥匙。

关键字: 人工智能 AI 无人农场
关闭
关闭