深度强化学习入门系列合集40篇推文已完成
深度强化学习系列1--值函数方法和策略梯度方法:链接
深度强化学习系列2--深度确定性策略梯度算法的代码实现(DDPG):链接
深度强化学习系列3--Deep Reinforcement Learning(DQN):链接
深度强化学习系列4-- Double Deep Q-Learning(Double DQN):链接
深度强化学习系列5-- DQN和DDPG的主要区别:链接
深度强化学习系列6-- DQN代码实现:链接
深度强化学习系列7 -- Double DQN代码:链接
深度强化学习系列8--使用DDQN训练一个“跳跳鸟”游戏(附源代码):链接
深度强化学习系列9--基于深度强化学习的柔性作业车间动态多目标调度:链接
深度强化学习系列10--基于深度强化学习的新作业插入柔性作业车间动态调度:链接
深度强化学习系列11--组会讨论--深度强化学习基础概念介绍PPT(学生投稿):链接
深度强化学习系列12--阅读DDPG算法论文所产生的七个问题:链接
深度强化学习系列13--用DQN玩“寻找宝藏”游戏(附源代码):链接
深度强化学习系列14--近端策略有话PPO算法完整推导过程:链接