Research Technical Daily Life Game

Academic Projects Links About Travellings 🚇

Back

Tags: #mbpo

Dec 27, 2025

RL笔记（18）：基于模型的策略优化 (MBPO)

Model-Based RL 的集大成者：深度解析 MBPO 的理论边界。从单调性保证到分支推演 (Branched Rollout)，论证如何通过控制推演步长来解决模型偏差带来的二次误差累积问题。

9 min read

© 2026 菊花花 & Site policy Astro theme powered