1.在使用训练输出的策略进行仿真时,如何输出这个过程中的各个关节的扭矩大小以及速度位置等参数?如何对关节进行扭矩位置的限制?如何在仿真中可视化质心轨迹和摆动腿轨迹? 2.如果我想要进行奖励函数的修改,对应的源码位置在哪? PS:README文件中,有一句话可能有点点问题(当然也可能是我功夫较浅),就是第三步、训练机器人中的第3小点,应该是返回到终端的gewu的conda环境,而不是返回anaconda界面