有两个问题

1.在使用训练输出的策略进行仿真时，如何输出这个过程中的各个关节的扭矩大小以及速度位置等参数？如何对关节进行扭矩位置的限制？如何在仿真中可视化质心轨迹和摆动腿轨迹？


2.如果我想要进行奖励函数的修改，对应的源码位置在哪？


PS：README文件中，有一句话可能有点点问题（当然也可能是我功夫较浅），就是第三步、训练机器人中的第3小点，应该是返回到终端的gewu的conda环境，而不是返回anaconda界面