Research Technical Daily Life Game

Academic Projects Links About Travellings 🚇

Back

Tags: #sql

Dec 23, 2025

RL笔记（14）：SQL

深入解析 Soft Q-Learning (SQL)：从最大熵强化学习原理出发，详细推导 Soft Bellman 方程、策略提升定理及收敛性证明，并探讨基于能量模型的策略采样与实现细节。

10 min read

© 2026 菊花花 & Site policy Astro theme powered