智能体基础

从 LLM 到 Agent：工具、记忆、规划、反思、多 Agent、MCP 与安全边界的基础知识梳理。

这篇笔记把三本资料放在同一张学习地图里：先用《智能体设计模式》整理常见模式，再用《Claude Code Harness Engineering》补足工程边界，最后把这些概念映射到 Claude Code 的源码实践。

引句：“Agent = LLM + Tools + Memory + Planning。” 来源：《Claude Code Harness Engineering：从入门到实战》，p. 9。

一句话定义

Agent 不是“更会聊天的模型”，而是一个能在循环中使用工具、观察结果、维护状态并持续推进目标的系统。《Claude Code Harness Engineering》把 LLM 的局限概括为三类：不能直接行动、缺少跨会话记忆、难以完成需要多步反馈的任务；Agent 的核心动机，就是给模型补上工具、记忆和行动-观察循环。来源：《Claude Code Harness Engineering：从入门到实战》，pp. 8-11。

层次	作用	典型问题	关键来源
LLM	生成、推理、语言理解	容易停留在单轮建议	《Claude Code Harness Engineering：从入门到实战》，pp. 8-10
Tool Use	连接外部 API、文件、命令、数据库	权限、失败、超时、参数校验	《智能体设计模式》，pp. 49-62
Memory	保存会话状态、长期偏好、项目经验	记什么、何时过期、如何纠错	《智能体设计模式》，pp. 87-98
Planning	把目标拆成步骤并动态调整	计划漂移、失败后重规划	《智能体设计模式》，pp. 65-74
Reflection	检查输出、纠错、降低幻觉	评审标准、迭代成本	《智能体设计模式》，pp. 294-295
Multi-Agent	用专业角色分工	通信、冲突、级联失败	《智能体设计模式》，pp. 75-85；《Claude Code Harness Engineering：从入门到实战》，pp. 107-116

ReAct 是最小执行循环

《Claude Code Harness Engineering》将 ReAct 拆成思考、行动、观察三步：模型先判断下一步，随后调用工具，再根据工具结果调整后续动作。真正关键的是“观察”：如果模型不认真解释工具结果，Agent 就会退化成盲目执行脚本的程序。来源：《Claude Code Harness Engineering：从入门到实战》，pp. 10-11。

正在渲染图表…

这个循环和 Chain-of-Thought 的差别在于是否有外部反馈。CoT 更像脑内推演，ReAct 则把每一步落到环境里，用真实返回值修正下一步。来源：《Claude Code Harness Engineering：从入门到实战》，p. 11。

工具让模型接触外部世界

《智能体设计模式》把工具使用拆成六步：定义工具、让 LLM 判断是否调用、生成结构化参数、由编排层执行、返回观察结果、再让 LLM 处理结果。这个模式让模型越过静态训练数据，访问实时信息、执行计算、调用 API 或触发现实动作。来源：《智能体设计模式》，pp. 49-50。

工具设计不是“给模型一个函数名”这么简单。一个可上线的工具至少要定义输入 schema、输出格式、超时、错误语义、权限等级和是否需要人工审批。Claude Code 的工具系统也采用统一接口，让 Bash、Read、Edit、Grep、Agent 等工具都能经过同一条查找、验证、Hook、权限、执行、格式化链路。来源：《Demystifying Claude Code v1.8》，pp. 83-87。

规划把目标变成可执行路径

规划模式解决的问题是：复杂目标不能靠单步回答完成。一个成熟 Agent 应该先把高层目标拆成步骤，在执行过程中跟踪进度，并在步骤失败或环境变化时重新规划。来源：《智能体设计模式》，pp. 65-74；《智能体设计模式》，p. 295。

计划是否展示给用户，是产品设计问题。高风险任务、长链路任务和会改动真实系统的任务，应优先让用户确认计划；这与人机协同模式一致，能在执行前给用户透明度和控制权。来源：《智能体设计模式》，pp. 295-296。

记忆是状态，不是资料堆积

记忆管理的目标不是把所有历史塞进 prompt，而是让 Agent 在有限上下文中保留必要信息。《智能体设计模式》区分了短期记忆、长期记忆和 RAG 式知识检索；《Claude Code Harness Engineering》进一步强调跨会话记忆能避免 Agent 每次都像新手一样重新学习。来源：《智能体设计模式》，pp. 87-98；《Claude Code Harness Engineering：从入门到实战》，pp. 96-106。

记忆类型	保存什么	常见风险	推荐边界
会话上下文	当前目标、工具结果、临时推理状态	上下文爆炸	压缩和摘要
项目记忆	项目约定、当前阶段、未完成事项	过期信息污染决策	标注时间和适用范围
用户反馈	偏好、禁忌、协作方式	过度泛化	只注入与当前任务相关的部分
审计轨迹	工具输入输出、审批记录	隐私和成本	结构化、可检索、可清理

先阅读模型基础知识：弄清 LLM 能力边界、Token 预算和结构化输出，再进入 Agent 模式。
先理解 ReAct：思考、行动、观察、再行动。
再理解工具：schema、权限、失败和可观察输出。
然后理解上下文与记忆：什么进入窗口，什么沉淀为长期状态。
接着理解规划与反思：如何把目标拆开，并在失败后修正。
最后理解多 Agent、MCP 和 Harness：当单 Agent 不够时，如何分层扩展。

最小可运行 Agent

一个最小可运行 Agent 不需要复杂框架，但必须具备五个组件：

组件	最小实现	不做会怎样
目标解释	把用户输入转成可验证目标	模型容易输出漂亮但不可验收的回答
Loop 控制	限制步数、维护状态、决定继续或停止	容易无限循环或提前结束
工具注册表	列出可用工具、schema、权限和描述	模型会猜工具或生成非法参数
观察回填	把工具结果结构化放回上下文	工具执行和后续推理断开
交付验证	运行测试、检查 diff、引用证据	无法证明任务真的完成

这个最小形态已经能覆盖大多数入门项目。框架的价值应体现在让这些组件更稳定、更可观测，而不是把概念藏起来。

与普通自动化脚本的区别

普通脚本擅长固定流程：输入明确、步骤固定、异常可枚举。Agent 适合目标明确但路径不固定的任务，例如跨文件排查、开放式检索、动态网页操作、需要根据工具结果不断调整的工作流。

但这不意味着所有自动化都该变成 Agent。下面这些场景优先使用普通程序：

规则稳定、输入输出严格、失败代价高的流程。
可以用 SQL、正则、AST、工作流引擎直接表达的问题。
不需要自然语言理解、策略选择或多步反馈的批处理任务。
合规要求必须完全可解释、可证明、可重放的核心链路。

Agent 的价值来自不确定环境中的动态决策；确定性部分仍应交给确定性代码。

工程落地检查清单

是否把目标拆成了可验收结果，而不是只给模型一个宽泛角色。
是否限制了每轮可用工具，避免工具列表过大、权限过宽。
是否把工具结果当成事实来源，而不是让模型自行回忆事实。
是否记录了每一步行动、观察、决策和停止原因。
是否为高风险工具设置人工确认或沙箱。
是否能在任务失败后恢复，而不是只能重新开始。

一句话定义

ReAct 是最小执行循环

工具让模型接触外部世界

规划把目标变成可执行路径

记忆是状态，不是资料堆积

多 Agent 不是越多越好

MCP 是工具层标准化

安全是基础能力

学习顺序

最小可运行 Agent

与普通自动化脚本的区别

工程落地检查清单

参考来源

On this page