在AI领域的模型学习训练阶段,强化学习(RL)是一项重要技术,可用于很多行业。“强化学习笔记”系列文章,将陆续发布一些强化学习知识点。本文主要解释一些强化学习的基本概念,包含:状态与观察、动作空间、策略、价值、轨迹、奖励与回报、RL问题、贝尔曼方程、优势方程。#强化学习笔记 #RL基本概念解析 #动作空间与策略 #价值函数V(s)