工程实践
AI Agent 工程化实践索引:上下文工程、Harness 构件、评测回归和安全边界。
智能体能跑只是起点。真正进入工程阶段,需要把行为、成本、失败和权限都变得可观察、可回放、可约束。
阅读入口
| 主题 | 解决的问题 |
|---|---|
| Harness 工程构件 | 用 Session、Harness、Sandbox 拆分状态、编排和执行边界。 |
| 上下文工程 | 把任务背景、约束、工具结果和历史状态组织成稳定输入。 |
| 评测与回归 | 用样例集、轨迹回放和指标看住 Agent 的质量变化。 |
工程判断
上线前至少要确认:
- 工具调用是否有输入 schema、权限和失败语义。
- 长任务是否能恢复、回放和审计。
- 输出质量是否有可重复的评测方式。
- 高风险动作是否需要人工确认。