当前位置：首页>学习笔记>偷懒的模型学习笔记(1)|最强开源!Kimi K2.5发布:首创“智能体蜂群”模式,100个Agent并行干活,速度提升4.5倍

偷懒的模型学习笔记(1)|最强开源!Kimi K2.5发布:首创“智能体蜂群”模式,100个Agent并行干活,速度提升4.5倍

2026-05-20 19:26:34

核心速览：

• 新旗舰：Kimi K2.5 正式发布，基于 15T 混合图文Token训练，是目前最强的开源多模态模型。
• 黑科技：首创 Agent Swarm（智能体蜂群） 模式，单次任务可调度 100 个子智能体并行工作，执行 1500 次工具调用。
• 速度革命：通过并行编排，复杂任务执行速度提升 4.5倍，彻底告别“串行等待”。
• 视觉编程：支持视频/图像转代码，具备视觉自主调试能力，甚至能复刻动态网页效果。

在 AI 助手的进化史上，我们习惯了“一对一”的对话模式。但如果面对一个超复杂的任务，一个 Agent 干不过来怎么办？

今天，月之暗面（Moonshot AI）发布了 Kimi K2.5，给出了一个震撼的答案：搞一支“军队”！

Kimi K2.5 不仅是一个原生多模态模型，更引入了全新的 Agent Swarm（智能体蜂群） 范式。它不再是一个人在战斗，而是一个能指挥百人团队的“指挥官”。

01 蜂群战术：Scaling Out, Not Just Up

这是 Kimi K2.5 最大的看点。传统的 Agent 往往是串行执行任务（做完一步再做下一步），效率低下且容易出错。

Kimi K2.5 引入了 Agent Swarm 模式：

• 百团大战：模型可以根据任务需求，自动创建并指挥多达 100个子智能体（Sub-agents）。
• 海量调用：支持跨工作流执行高达 1500次工具调用，且无需预定义角色或流程。
• 极致并行：通过并行处理，相比单 Agent 模式，执行时间缩短了 4.5倍。

背后的技术原理：PARL为了训练出这种能力，团队采用了 并行智能体强化学习（PARL）。传统的训练容易导致“串行崩溃”（Serial Collapse），即指挥官因为反馈延迟而退化回单兵作战。Kimi 团队引入了 关键步骤（Critical Steps） 指标，通过奖励机制强制模型探索并行策略，只有缩短了任务“关键路径”的操作才会获得高分。

02 视觉编程：看懂视频写代码

作为原生多模态模型，Kimi K2.5 在 Coding with Vision 上展现了恐怖的统治力。

• 视频转代码：你给它一段网页操作视频，它能直接复刻出网站代码。
• 交互式前端：不仅仅是静态页面，K2.5 能生成包含滚动特效、丰富动画的交互式布局。
• 自主视觉调试：这是真正的“闭环”。在复刻马蒂斯名画《舞蹈》风格的 App 时，K2.5 能通过视觉检查自己的输出，查阅文档，并自主修正样式错误，无需人类干预。

为了方便开发者，这些能力已集成在 Kimi Code 中，支持 VSCode、Cursor 等 IDE，甚至能自动迁移你现有的环境配置。

03 办公生产力：干掉繁琐杂活

在处理高密度的“脏活累活”上，Kimi K2.5 同样表现出色。

• 超长待机：支持 256k 上下文，轻松处理 100 页文档或 10 万字论文。
• 复杂格式通吃：在 Word 中添加批注、在 Excel 中构建透视表（Pivot Tables）、在 PDF 中编写 LaTeX 公式，统统不在话下。
• 效率飞跃：内部评测显示，在 AI Office Benchmark 上，K2.5 相比 K2 Thinking 提升了 59.3%，将原本需要数小时的任务压缩至几分钟。