Research Technical Daily Life Game

Academic Projects Links About Travellings 🚇

Back

Tags: #离线强化学习

Dec 28, 2025

RL笔记（19）：离线强化学习 (Offline RL)

数据驱动的强化学习：当不能与环境交互时，如何从静态数据集中学习？深度解析分布偏移 (Distribution Shift) 问题，以及 BCQ 和 CQL 算法的理论推导。

8 min read

© 2026 菊花花 & Site policy Astro theme powered