Back
没有奖励函数怎么办?详解模仿学习的三大流派:行为克隆 (BC) 的简单粗暴与局限、逆强化学习 (IRL) 的理论推导,以及生成式对抗模仿学习 (GAIL) 的对抗博弈思想。
强化学习
rl笔记
模仿学习