Skip to content

Agent 基础

Agent 可以简单理解成:把模型放进一个“观察 -> 决策 -> 行动 -> 再观察”的循环里。

Agent 和普通问答有什么区别

普通问答通常是一轮输入、一轮输出。Agent 则会:

  • 根据任务拆下一步
  • 选择是否调用工具
  • 根据结果调整策略
  • 持续推进直到完成或停止

一个最小 Agent 通常包含什么

目标

系统要完成什么任务,以及什么状态算完成。

状态

当前知道什么、做过什么、还缺什么。

策略

下一步该问、该查、该算,还是该调用工具。

工具

搜索、查询、执行、读写文件、调用 API 等外部能力。

停止条件

什么时候停止,否则 agent 很容易一直循环。

为什么 Agent 容易“看起来很强,实际不稳”

  • 目标模糊
  • 工具太多且边界重叠
  • 没有状态约束
  • 没有中间结果校验
  • 没有停止条件

什么时候值得上 Agent

当任务满足这些特征时,agent 才更可能有价值:

  • 步骤不固定
  • 需要根据中间结果动态调整
  • 需要多轮工具调用
  • 任务目标明确但路径不确定

如果任务本来就是固定流程,很多时候工作流比 agent 更稳。

建议的学习顺序

  1. 先理解 tool calling
  2. 再理解 state 和 planning
  3. 最后再看 multi-agent

不要一上来就追求复杂架构。

对应示例

  • 实战项目总览
  • examples/systems/simple-agent:最小循环骨架
  • examples/systems/travel-agent:带真实工具调用的 Python 单 agent 示例

Built with VitePress and deployed via GitHub Actions.