当前位置：首页>学习笔记>AI入门学习笔记01:什么是 Agent(智能体)

AI入门学习笔记01:什么是 Agent(智能体)

2026-05-22 09:02:25

Part.01

先记住一句最核心的话

智能体（Agent）= 大模型 + 工具 + 与环境交互 + 为目标执行动作

更正式一点：

智能体是一个系统，它利用 AI 模型与环境交互，以实现用户定义的目标。它会结合推理、规划和动作执行（通常借助外部工具）来完成任务。

你可以把它理解成：

大脑：AI 模型，负责理解、思考、判断

身体：工具和能力，负责真正去做事

如果只有“大脑”没有“身体”，它只能“说”；如果有了工具，它才可能“做”。

Part.02

为什么普通聊天模型不等于智能体？

很多新手会把 ChatGPT、Claude、Gemini 这种模型直接理解成智能体，其实不完全对。

1）普通大模型本质上擅长“生成内容”

比如：

回答问题

写文案

总结文章

解释概念

这些都主要是“输出文字”。

2）智能体是在大模型基础上，再加上“行动能力”

比如让 AI：

搜网页

发邮件

查数据库

调接口

生成图片

控制软件

连续执行多步任务

这时它就不只是“回答”，而是在“执行”。

一句话区分：

大模型：会想、会说

智能体：会想、会说、还会做

Part.03

智能体的两个核心组成

1. 大脑：AI 模型

这是智能体做判断的地方，主要负责：

理解用户的需求

分析当前情况

推理下一步该做什么

制定简单或复杂的计划

当前最常见的是 LLM（大语言模型），比如：

Llama

Gemini

它们通常：

输入：文字

输出：文字

也可以扩展成多模态模型，比如 VLM（视觉语言模型），能理解图片。

2. 身体：工具和能力

这部分决定智能体“能做什么”。

比如一个智能体可以拥有这些工具：

网络搜索

发邮件

查询日历

调用数据库

图像生成

控制代码或脚本执行

重点：智能体能力的上限，取决于它拥有什么工具。

比如人类没有翅膀，所以不能飞；同样，一个 AI 如果没有“发邮件工具”，它就不能真的帮你发邮件。

Part.04

AI 是怎么“采取行动”的？

这是这部分内容里非常关键的一点。

大模型本身通常不能直接操作现实世界，它本质上只会生成文本。

比如你问：帮我给经理发邮件，说今天会议能不能改期？

模型自己其实不会直接发邮件。它需要调用一个“发邮件工具”。

过程可以这样理解：

用户提出目标
模型理解需求
模型判断：需要调用哪个工具
模型生成调用工具所需的参数
工具执行动作
执行结果返回给模型
模型再决定下一步

这就是智能体的基础运行逻辑。

Part.05

动作（Action）和工具（Tool）不是一回事

这个点很容易混淆，必须记住。

工具（Tool）

是具体能力，例如：

搜索工具

发邮件工具

地图工具

数据库查询工具

查日历

找空闲时间

发邀请邮件

创建会议链接

Part.06

第1级：简单输出
AI 只负责给出答案，不影响程序流程。例子：你问问题，它回答；你让它总结，它输出总结
第2级：路由/选择
AI 的输出决定走哪条流程。例子：判断这是售前问题还是售后问题；决定把工单分配给哪个部门
第3级：工具调用
AI 决定调用哪个函数或工具。例子：查天气；搜网页；发邮件；调接口
第4级：多步执行
AI 不止做一步，而是连续执行多个步骤，直到任务完成。例子：先搜索信息 → 再整理重点 → 再生成报告 → 再发送给用户
第5级：多智能体系统

一个智能体还能触发另一个智能体协作。

例子：一个负责搜集资料 → 一个负责分析 → 一个负责写总结 → 最后统一输出结果

对新手来说，先理解前3级最重要。

Part.07

智能体能做哪些任务？

理论上，只要有合适工具，智能体就可以完成很多任务。

常见场景包括：

1）个人助理

比如 Siri、Alexa、Google Assistant 这类

能做的事：

理解你的指令

查信息

设提醒

发消息

操作设备

2）客服机器人

企业里很常见

能做的事：

回答用户问题

引导处理故障

查询订单

创建工单

在部分场景中完成交易

3）游戏里的 AI NPC

比传统脚本 NPC 更灵活

能做的事：

根据上下文和玩家互动

生成更自然的对话

随玩家行为动态调整反应

Part.08

适合0基础学习者的通俗理解

你可以把三者这样区分：

1. 模型（Model）

像一个知识很多、理解力很强的人但他只是“坐着说话”。

2. 工具（Tool）

像这个人手边的设备：

手机

浏览器

邮箱

计算器

数据库

画图软件

3. 智能体（Agent）

像一个接到任务后，真的会：理解任务 → 思考步骤 → 拿工具做事 → 根据结果继续推进的人。

Part.09

一张最简单的理解框架

你可以直接记这个：

用户目标 → 模型理解 → 选择工具 → 执行动作 → 读取结果 → 继续下一步 → 完成任务

这就是智能体最基础的闭环。

Part.10

给0基础同学的学习建议

如果你刚开始学 AI，不要一上来就钻很深的技术细节，先建立下面这个顺序：

第一步：先搞清楚 3 个概念

什么是大模型

什么是工具调用

什么是智能体

第二步：重点理解智能体的工作流程

搞明白它不是魔法，而是：

理解

决策

调工具

执行

反馈

第三步：开始接触简单实践

比如：

用大模型做问答

给模型接入搜索工具

做一个简单的“查资料并总结”的 Agent

最后总结下今天的学习内容：

智能体不是单纯会聊天的 AI，而是一个围绕目标进行推理、规划、调用工具并执行任务的系统。

【必须记住的重点】

- 智能体 = 模型 + 工具 + 行动能力

- LLM 是大脑，不是全部

- 工具决定 AI 能不能真正做事

- 动作不等于工具

- 智能体的核心价值是完成任务，而不是只生成答案

本文来自网友投稿或网络内容，如有侵犯您的权益请联系我们删除，联系邮箱：wyl860211@qq.com 。

AI入门学习笔记01:什么是 Agent(智能体)

最新文章

热门文章

随机文章

AI入门学习笔记01:什么是 Agent(智能体)

Power Up 0 U8 L1学习资料

《黄帝内经》学习笔记14:过食五味的影响

最新文章

热门文章

随机文章