Research Technical Daily Life Game

Academic Projects Links About Travellings 🚇

Back

Tags: #ddpg

Dec 22, 2025

RL笔记（13）：DDPG

深度确定性策略梯度：将 DQN 扩展到连续动作空间。详解 DDPG 的软更新与噪声探索，以及 TD3 如何通过双 Q 网络和延迟更新解决过估计问题。

9 min read

© 2026 菊花花 & Site policy Astro theme powered