AI入门学习笔记01:什么是 Agent(智能体)
智能体(Agent)= 大模型 + 工具 + 与环境交互 + 为目标执行动作智能体是一个系统,它利用 AI 模型与环境交互,以实现用户定义的目标。它会结合推理、规划和动作执行(通常借助外部工具)来完成任务。如果只有“大脑”没有“身体”,它只能“说”; 如果有了工具,它才可能“做”。很多新手会把 ChatGPT、Claude、Gemini 这种模型直接理解成智能体,其实 不完全对 。也可以扩展成多模态模型,比如 VLM(视觉语言模型) ,能理解图片。比如人类没有翅膀,所以不能飞; 同样,一个 AI 如果没有“发邮件工具”,它就不能真的帮你发邮件。大模型本身通常不能直接操作现实世界,它本质上只会生成文本。比如你问:帮我给经理发邮件,说今天会议能不能改期?模型自己其实不会直接发邮件。 它需要调用一个“发邮件工具”。
- 第1级:简单输出
AI 只负责给出答案,不影响程序流程。例子:你问问题,它回答;你让它总结,它输出总结 - 第2级:路由/选择
AI 的输出决定走哪条流程。例子:判断这是售前问题还是售后问题;决定把工单分配给哪个部门 - 第3级:工具调用
AI 决定调用哪个函数或工具。例子:查天气;搜网页;发邮件;调接口 - 第4级:多步执行
AI 不止做一步,而是连续执行多个步骤,直到任务完成。例子:先搜索信息 → 再整理重点 → 再生成报告 → 再发送给用户
例子:一个负责搜集资料 → 一个负责分析 → 一个负责写总结 → 最后统一输出结果理论上,只要有合适工具,智能体就可以完成很多任务。比如 Siri、Alexa、Google Assistant 这类像一个知识很多、理解力很强的人 但他只是“坐着说话”。像一个接到任务后,真的会:理解任务 → 思考步骤 → 拿工具做事 → 根据结果继续推进的人。用户目标 → 模型理解 → 选择工具 → 执行动作 → 读取结果 → 继续下一步 → 完成任务如果你刚开始学 AI,不要一上来就钻很深的技术细节,先建立下面这个顺序:智能体不是单纯会聊天的 AI,而是一个 围绕目标进行推理、规划、调用工具并执行任务的系统 。