提问 发文

Unity+ML-Agents训练机械臂到达目标点

微微菌

| 2024-04-23 10:35 410 0 0

Unity+ML-Agents训练机械臂到达目标点
环境搭建:
训练效果:

首先你需要从Unity官方Github下载 ML-Agents机器学习代理,然后进行安装。然后还需要在你的电脑上配置Tensorflow,因为以前跑过一些深度学习的东西,Tensorflow已经配置好了,还没有装的小伙伴可以参考 这篇教程,推荐使用Anaconda进行安装,安全快捷无痛苦。
环境搭建:
首先最基础的,按照流程创建Academy和Brain。新建一个空物体,命名随意,最好具有辨识度;然后添加一个C#脚本,同样命名随意,然后把继承类改为Academy,其他不用修改。

在这里插入图片描述

在这里插入图片描述

然后点击Add component,输入brain,添加Brain组件:

在这里插入图片描述

然后开始设置智能体,其创建流程跟Academy一样,然后将继承类改为Agent。补充一点,Academy和agent脚本中都要添加using MLAgents。因为设计多智能体并行训练,所以我将机械臂模型放在agent组件下作为它的子物体

在这里插入图片描述


机械臂一定要按层级关系设置好父子关系:


在这里插入图片描述


然后在Agent脚本中设置机械臂各关节和目标物体然后再agent组件指定各关节。


在这里插入图片描述

在这里插入图片描述

上面东西设置好后就可以开始训练了,agent训练代码

using System.Collections;
using System.Collections.Generic;
using UnityEngine;
using MLAgents;

public class all_baxter_agent : Agent {
public GameObject S0;
public GameObject S1;
public GameObject E0;
public GameObject E1;
public GameObject W0;
public GameObject W1;

public GameObject endJoint;
public GameObject target;

private float previousDistance = float.MaxValue;
public bool goal = false;
public void Start()
{
Done();
}
public override void AgentReset()
{
previousDistance = float.MaxValue;
if (goal)
{
target.transform.localPosition = new Vector3(Random.Range(-22f, -17f), 7f, Random.Range(-16f, -12f)); //目标物体初始化范围
goal = false;
}
else
{
S0.transform.localRotation = Quaternion.Euler(new Vector3(0f, 0f, 0f));
S1.transform.localRotation = Quaternion.Euler(new Vector3(60f, 0f, 0f));
E0.transform.localRotation = Quaternion.Euler(new Vector3(0f, 0f, 0f));
E1.transform.localRotation = Quaternion.Euler(new Vector3(-60f, 0f, 0f));
W0.transform.localRotation = Quaternion.Euler(new Vector3(0f, 0f, 0f));
W1.transform.localRotation = Quaternion.Euler(new Vector3(-60f, 0f, 0f));
}
}
public override void CollectObservations()
{
Vector3 relativePosition = gameObject.transform.position - target.transform.position;
float distanceToTarget = Vector3.Distance(target.transform.position, endJoint.transform.position);//计算机械臂末端和目标点的距离

AddVectorObs(S0.transform.rotation.y);
AddVectorObs(S1.transform.rotation.x);
AddVectorObs(E0.transform.rotation.z);
AddVectorObs(E1.transform.rotation.x);
AddVectorObs(W0.transform.rotation.z);
AddVectorObs(W1.transform.rotation.x);
AddVectorObs(relativePosition.x);
AddVectorObs(relativePosition.y);
AddVectorObs(relativePosition.z);
AddVectorObs(distanceToTarget); //获取的状态观察量,作为PPO网络的输入
}
public override void AgentAction(float[] vectorAction, string textAction)
{
float distanceToTarget = Vector3.Distance(target.transform.position, endJoint.transform.position);
var action_s0 = Mathf.Clamp(vectorAction[0], -1f, 1f);
var action_s1 = Mathf.Clamp(vectorAction[1], -1f, 1f);
var action_e0 = Mathf.Clamp(vectorAction[2], -1f, 1f);
var action_e1 = Mathf.Clamp(vectorAction[3], -1f, 1f);
var action_w0 = Mathf.Clamp(vectorAction[4], -1f, 1f);
var action_w1 = Mathf.Clamp(vectorAction[5], -1f, 1f); //取[-1,1]之间的随机动作,是PPO网络的输出

if(Mathf.Abs(S0.transform.localRotation.y)>0.5f|| S1.transform.localRotation.x > 0.85f ||
S1.transform.localRotation.x < -0.17f || E1.transform.localRotation.x>0f ||
E1.transform.localRotation.x < -0.85f||Mathf.Abs(W1.transform.localRotation.x)>0.72) //限制机械臂各关节转动范围
{
AddReward(-5.0f);
Done();
}

if (endJoint.transform.position.y < 3.2 || endJoint.transform.position.y > 9)
{
AddReward(-5.0F);
Done();
}

if (distanceToTarget < previousDistance)//靠近目标点,给予奖励
{
AddReward(0.5f);
}
else
{
AddReward(-0.5f);
}
if(distanceToTarget<0.2f)//机械臂末端与目标物体距离小于阈值时,给予奖励
{
goal = true;
AddReward(25.0f);
Done();
}
previousDistance = distanceToTarget;

S0.transform.Rotate(new Vector3(0, 1, 0), action_s0); //旋转需要使用四元数
S1.transform.Rotate(new Vector3(1, 0, 0), action_s1);
E0.transform.Rotate(new Vector3(0, 0, 1), action_e0);
E1.transform.Rotate(new Vector3(1, 0, 0), action_e1);
W0.transform.Rotate(new Vector3(0, 0, 1), action_w0);
W1.transform.Rotate(new Vector3(1, 0, 0), action_w1);
}
}


训练效果:

训练初期,机械臂在状态空间中乱窜:

在这里插入图片描述


大概经过了4个小时训练,发现效果还不错:


在这里插入图片描述


另外,我还使用了多智能体并行训练来提高训练效果,发现很有用:


在这里插入图片描述

————————————————

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。

原文链接:https://blog.csdn.net/qq_41074580/article/details/84990557

收藏 0
分享
分享方式
微信

评论

游客

全部 0条评论

10603

文章

12.03W+

人气

19

粉丝

1

关注

官方媒体

轻松设计高效搭建,减少3倍设计改稿与开发运维工作量

开始免费试用 预约演示

扫一扫关注公众号 扫一扫联系客服

©Copyrights 2016-2022 杭州易知微科技有限公司 浙ICP备2021017017号-3 浙公网安备33011002011932号

互联网信息服务业务 合字B2-20220090

400-8505-905 复制
免费试用
微信社区
易知微-数据可视化
微信扫一扫入群