强化学习算法的分类,按照是否使用环境模型分为基于模型算法和无模型算法,两类算法各有千秋。强化学习需要学习的内容包含,策略Policy参数、动作评估函数Q-function 、价值函数V-function 、环境模型(根据算法类型可选)。强化学习智能体的训练方法有两种,策略优#强化学习算法分类 化(Policy Optimization) 和Q学习(Q-learning)。#ModelFree vs ModelBased RL #无模型与基于模型对比 #强化学习算法分类
微信扫一扫赞赏作者喜欢作者