当前位置:首页 > 智能硬件 > 机器人
[导读] 机器人技术的基本问题既涉及离散变量(比如控制模式或齿轮切换的选择),又涉及连续变量(比如速度设定点和控制增益)。通常来说,由于算法或控制策略并不总是适合的,因此这些问题很难解决。这就是为什么谷歌

机器人技术的基本问题既涉及离散变量(比如控制模式或齿轮切换的选择),又涉及连续变量(比如速度设定点和控制增益)。通常来说,由于算法或控制策略并不总是适合的,因此这些问题很难解决。这就是为什么谷歌母公司Alphabet的DeepMind的研究人员最近提出了一种技术:连续-离散混合学习,即可以同时优化离散和连续动作,以其本来的形式处理混合问题。

在预印本服务器Arxiv.org上发表的一篇论文详细介绍了他们的工作,这篇论文也在去年10月日本大阪的第三届机器人学习会议上被人接受。作者写道:“许多先进的方法都进行了优化,它们能很好处理离散的或是连续的动作空间,但是却很少有方法能同时处理。能够使用同一算法强大地处理离散和连续动作空间,使我们能够针对任何给定问题都能选择最自然的解决方案策略,而不是让算法上的便利性来决定做出哪种选择。”

团队研发的无模型算法,是指利用强化学习或者奖励实现目标的自主代理人的培训技术,通过连续和离散动作空间来解决控制问题,并通过受控和自主切换来解决混合最优控制问题。此外,这种算法通过使用“元动作”或其他类似方案来扩大动作空间(分别定义了代理人可能感知和采取的状态和动作的范围),从而为解决现有的机器人问题提供了新颖的解决方案,并使策略可以解决类似人工智能训练期间的机械磨损等挑战 。

研究人员在一系列模拟和现实基准测试中验证了他们的方法,包括Rethink Robotics公司的Sawyer机器人手臂。据称,基于给定的到达、抓取和拿起魔方的任务,其中奖励是三个子任务的总和,因此他们的算法要优于无法解决任务的现有方法。

那是因为到达魔方需要代理人打开手臂的抓具,而抓取方块需要关闭抓具。作者写道:“一开始,基线将大部分概率集中在较小的动作值上,因此很难移动抓具的手指来看到任何奖励,从而解释了学习曲线上的平稳期。另一方面,这个算法能始终以全速操作抓具,因此改进了探查性,使机器人可以完全完成任务。”

在一个单独的实验中,团队将其算法设置为参数化动作空间马尔可夫决策过程(PAMDP)或一个分层问题,其中,代理人首先选择离散动作,然后为该动作选择一组连续的参数集。在这种情况下,代理人的任务是操纵机器人手臂,以便将钉子插入孔中,然后根据孔的位置和运动学来计算奖励。

研究人员表示,他们的方法比精细方法和粗略方法获得了更大的回报,并且这种算法将来可以作为基础应用到更多的混合强化学习中。论文中写道:“对于专业设计师而言,事先选择合适的模式可能很困难。而我们的方法是很有用的,因为它只需要一个实验,而别的方法都需要通过消融来进行验证。”

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

2024年教育数字化巨浪来袭,如何引领潮流、筑起行业壁垒? 成都2024年4月17日 /美通社/ -- 在信息技术飞速发展的今天,数字化已成为推动各行各业革新的强大引擎。特别是在教育领域,一场前所未有的变革正在悄然兴起...

关键字: AMD 数字化 智慧教育 集成

上周英伟达股价大跌,市值蒸发竟然超过AMD整个市值。所谓的“Magnificent Seven”市值蒸发合计达9500亿美元。如果单看股价跌幅,最大的是特斯拉;如果只看市值蒸发,苹果、微软、英伟达跌幅最大。

关键字: 英伟达 市值蒸发 AMD 市值

业内消息,昨天美国芯片设计公司 AMD 推出了锐龙PRO 8040/8000系列AI处理器芯片,为支持人工智能的PC提供动力,试图在与英伟达和英特尔等竞争对手的AI PC 竞争中获得领先地位。

关键字: AMD 锐龙 AI处理器 芯片

为无处不在的端侧设备插上AI的翅膀,AMD发布第二代Versal™ 自适应 SoC

关键字: AMD FPGA 自适应SoC AI 边缘计算

业内消息,近日AMD在其官网上公布了两款新APU(锐龙5 7235H/7235HS),两款处理器均采用了Zen 3+核心架构的Rembrand-R芯片,隶属锐龙7035系列。尽管AMD并没有公开披露这两款新处理器,但出现...

关键字: AMD 锐龙5 移动处理器

近日外媒引述消息人士报道称,中国推出采购需求标准,或意味着中国将禁止政府电脑使用英特尔和超微半导体(AMD)CPU(处理器)芯片,截止目前英特尔和AMD尚未就此消息做出回应。

关键字: 英特尔 AMD 芯片

据国家商务部官网新闻稿,昨天商务部部长王文涛今日会见美国 AMD 半导体公司董事会主席兼首席执行官苏姿丰,双方就中美经贸关系、AMD 在华发展等议题进行了交流。

关键字: AMD 苏姿丰 王文涛

在北京举办的AMD AI PC创新峰会上,AMD高级副总裁及GPU技术与工程研发王启尚也登台演讲,做了一场AMD AI技术发展报告,还透露了一个小惊喜。

关键字: AMD 光电模块 赛灵思

虽然NVIDIA目前仍是AI芯片市场的霸主,不过年中开始,挑战者AMD的最强AI芯片MI300X也即将大批量出货,可能将会抢下部分NVIDIA的市场,并再次影响从晶圆代工到服务器的AI产品供应链。

关键字: AMD 光电模块 芯片加工

近日两名知情人士称,美国芯片巨头英特尔暂时保住了向华为的销售许可,使这家全球最大的芯片制造商一段时间内可以继续向华为出售价值数亿美元的芯片。另一家美国芯片巨头 AMD(超威半导体)申请的许可一直没得到回应,这使 AMD...

关键字: 英特尔 华为 芯片 AMD
关闭
关闭