Hana's Blog
Blog
Research
Technical
Daily Life
Game
Academic
Projects
Links
About
Travellings
🚇
Search
切换到English
中文
Dark Theme
Menu
Back
Tags:
#mdp
Dec 12, 2025
RL笔记(3):马尔可夫决策过程
梳理从马尔可夫过程(MP)、奖励过程(MRP)到决策过程(MDP)的演变,详解价值函数、贝尔曼方程推导、占用度量及最优策略定义。
11 min read
强化学习
rl笔记
mdp