当前位置：首页 > 工业控制 > 电路设计项目集锦

如何使用Piper RL来训练一个简单的任务

时间：2025-12-22 19:29:16

关键字：存储库 Piper RL 函数

手机看文章

扫描二维码
随时随地手机看文章

[导读]这个存储库包含Piper RL的简单演示代码，展示了如何使用Piper RL来训练一个简单的任务：到达目标，该任务要求Piper的夹持器的中心达到指定的目标位置，而不要求Piper的末端执行器的结束姿势，通过简单的奖励函数实现。该存储库提供了两个模拟器下的训练示例：Mujoco和Genesis。

这个存储库包含Piper RL的简单演示代码，展示了如何使用Piper RL来训练一个简单的任务：到达目标，该任务要求Piper的夹持器的中心达到指定的目标位置，而不要求Piper的末端执行器的结束姿势，通过简单的奖励函数实现。该存储库提供了两个模拟器下的训练示例：Mujoco和Genesis。

存储库

Piper_rlAgilex-College

环境依赖性

•安装与RL相关的依赖项

•安装与genesis相关的依赖项

•PytorchInstall Pytorch，并根据CUDA版本选择相应的安装命令。在链接中找到适用于CUDA版本的Pytorch命令。以CUDA 12.9为例，安装命令如下：

•使用命令安装Genesis World：

•安装Mujoco

《创世纪》的例子

加载创世纪中的Piper模型

运行genesis_demo / hello_genesis.py

您可以看到成功加载了Piper模型。

控制派珀模型在创世纪

运行genesis_demo / control_piper.py

你可以看到派珀根据设定的位置移动。

实现创世纪中多个piper的并行仿真

运行genesis_demo / multi_piper.py

在创世纪中实现多个风笛手的并行训练

运行piper_rl_genesis.py

你可以看到多个风笛手试图接近设定位置。

启动张sorboard查看多个风笛手在训练期间的奖励变化：

基本步骤实现派珀Env在创世纪

•初始化环境

•设计奖励功能

•设置阶跃函数

Mujoco例子

在Mujoco对多名风笛手进行并行培训

运行piper_rl_mujoco.py

启动张sorboard查看多个风笛手在训练期间的奖励变化：

在Mujoco测试训练好的模型

运行piper_rl_mujoco.py

你可以看到派珀成功到达目标位置。

本文编译自hackster.io

本站声明：本文章由作者或相关机构授权发布，目的在于传递更多信息，并不代表本站赞同其观点，本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者，如若文章内容侵犯您的权益，请及时联系本站删除（邮箱：macysun@21ic.com ）。

换一批

延伸阅读

特朗普集团移除T1手机“美国制造”标语：关键参数亦被下调

特朗普集团近日取消了其新推出的T1智能手机“将在美国制造”的宣传标语，此举源于外界对这款手机能否以当前定价在美国本土生产的质疑。

关键字：特朗普苹果 AI

特朗普：已要求苹果停止在印度建厂并增加美国产能

美国总统特朗普在公开场合表示，他已要求苹果公司CEO蒂姆·库克停止在印度建厂，矛头直指该公司生产多元化的计划。

关键字：特朗普苹果 AI

特朗普暂停90天执行新关税：苹果股价大涨

4月10日消息，据媒体报道，美国总统特朗普宣布，美国对部分贸易伙伴暂停90天执行新关税政策，同时对中国的关税提高到125%，该消息公布后苹果股价飙升了15%。这次反弹使苹果市值增加了4000多亿美元，目前苹果市值接近3万...

关键字：特朗普 AI 人工智能特斯拉

特朗普：蓄意破坏特斯拉的人或面临20年监禁

3月25日消息，据报道，当地时间3月20日，美国总统特朗普在社交媒体平台“真实社交”上发文写道：“那些被抓到破坏特斯拉的人，将有很大可能被判入狱长达20年，这包括资助(破坏特斯拉汽车)者，我们正在寻找你。”

关键字：特朗普 AI 人工智能特斯拉

特朗普宣布史上最大AI投资项目：孙正义任董事长

1月22日消息，刚刚，新任美国总统特朗普放出重磅消息，将全力支持美国AI发展。

关键字：特朗普 AI 人工智能

正在被特朗普孤立主义坑杀的全球科技产业

特朗普先生有两件事一定会载入史册，一个是筑墙，一个是挖坑。在美墨边境筑墙的口号确保边境安全，降低因非法移民引起的犯罪率过高问题；在中美科技产业之间挖坑的口号也是安全，美国企业不得使用对美国国家安全构成威胁的电信设备，总统...

关键字：特朗普孤立主义科技产业

[21ic电子网]

突发！任期还剩两天，特朗普还要“怼”华为

据路透社1月17日消息显示，知情人士透露，特朗普已通知英特尔、铠侠在内的几家华为供应商，将要撤销其对华为的出货的部分许可证，同时将拒绝其他数十个向华为供货的申请。据透露，共有4家公司的8份许可被撤销。另外，相关公司收到撤...

关键字：华为芯片特朗普

特朗普的“世界第八奇迹”项目陷入僵局！

曾在2018年时被美国总统特朗普称作“世界第八奇迹”的富士康集团在美国威斯康星州投资建设的LCD显示屏工厂项目，如今却因为富士康将项目大幅缩水并拒绝签订新的合同而陷入了僵局。这也导致富士康无法从当地政府那里获得约40亿美...

关键字：特朗普富士康

特朗普下令重审《通信规范法》第230条，美三巨头将迎“大考”

今年5月，因自己发布的推文被贴上“无确凿依据”标签而与推特发生激烈争执后，美国总统特朗普签署了一项行政令，下令要求重审《通信规范法》第230条。

关键字：谷歌 facebook 特朗普

美国FBI和特勤局：寄往特朗普包裹含蓖麻毒蛋白

众所周知，寄往白宫的所有邮件在到达白宫之前都会在他地进行分类和筛选。9月19日，根据美国相关执法官员的通报，本周早些时候，执法人员截获了一个寄给特朗普总统的包裹，该包裹内包含蓖麻毒蛋白。

关键字：美国白宫特朗普

关闭