工程实践

AI Agent 工程化实践索引：上下文工程、Harness 构件、评测回归和安全边界。

智能体能跑只是起点。真正进入工程阶段，需要把行为、成本、失败和权限都变得可观察、可回放、可约束。

阅读入口

主题	解决的问题
Harness 工程构件	用 Session、Harness、Sandbox 拆分状态、编排和执行边界。
上下文工程	把任务背景、约束、工具结果和历史状态组织成稳定输入。
RAG 与知识系统	处理外部知识的采集、切分、索引、召回、重排和引用。
可观测性与轨迹回放	记录 trace、日志、指标、错误和成本，让任务可以复盘。
评测与回归	用样例集、轨迹回放和指标看住 Agent 的质量变化。
安全、权限与人类接管	管住工具权限、敏感信息、高风险动作和事故处理。

上线前至少要确认：

Agent 工程实践可以理解为一条闭环：

正在渲染图表…

这条闭环里的每一环都在回答同一个问题：模型输出怎样从“看起来合理”变成“可执行、可验证、可恢复、可治理”。

本站第一阶段文档重点覆盖 Prototype 到 Beta：让读者能把“能跑”的 Agent 推进到“能维护”的 Agent。

一个 Agent 功能准备交付前，至少应留下这些证据：

缺少这些证据时，Agent 功能即使演示成功，也不应被当作可维护交付。