Hana's Blog
Blog
Research
Technical
Daily Life
Game
Academic
Projects
Links
About
Travellings
🚇
Search
切换到English
中文
Dark Theme
Menu
Back
Tags:
#ddpg
Dec 22, 2025
RL笔记(13):DDPG
深度确定性策略梯度:将 DQN 扩展到连续动作空间。详解 DDPG 的软更新与噪声探索,以及 TD3 如何通过双 Q 网络和延迟更新解决过估计问题。
9 min read
强化学习
rl笔记
ddpg