Agent 基础
Agent 可以简单理解成:把模型放进一个“观察 -> 决策 -> 行动 -> 再观察”的循环里。
Agent 和普通问答有什么区别
普通问答通常是一轮输入、一轮输出。Agent 则会:
- 根据任务拆下一步
- 选择是否调用工具
- 根据结果调整策略
- 持续推进直到完成或停止
一个最小 Agent 通常包含什么
目标
系统要完成什么任务,以及什么状态算完成。
状态
当前知道什么、做过什么、还缺什么。
策略
下一步该问、该查、该算,还是该调用工具。
工具
搜索、查询、执行、读写文件、调用 API 等外部能力。
停止条件
什么时候停止,否则 agent 很容易一直循环。
为什么 Agent 容易“看起来很强,实际不稳”
- 目标模糊
- 工具太多且边界重叠
- 没有状态约束
- 没有中间结果校验
- 没有停止条件
什么时候值得上 Agent
当任务满足这些特征时,agent 才更可能有价值:
- 步骤不固定
- 需要根据中间结果动态调整
- 需要多轮工具调用
- 任务目标明确但路径不确定
如果任务本来就是固定流程,很多时候工作流比 agent 更稳。
建议的学习顺序
- 先理解 tool calling
- 再理解 state 和 planning
- 最后再看 multi-agent
不要一上来就追求复杂架构。
对应示例
- 实战项目总览
examples/systems/simple-agent:最小循环骨架examples/systems/travel-agent:带真实工具调用的 Python 单 agent 示例