DDPG

【深度强化学习】(5) DDPG 模型解析,附Pytorch完整代码

深度强化学习(Deep Reinforcement Learning, DRL)是深度学习和强化学习相结合的产物,近年来在自动化控制、游戏等领域取得了显著的成果。深度确定性策略梯度(Deep Deterministic Policy Gradient, DDPG)是一种结合了价值函数方法和策略梯度方