Damn Agent

工程实践

AI Agent 工程化实践索引:上下文工程、Harness 构件、评测回归和安全边界。

智能体能跑只是起点。真正进入工程阶段,需要把行为、成本、失败和权限都变得可观察、可回放、可约束。

阅读入口

主题解决的问题
Harness 工程构件用 Session、Harness、Sandbox 拆分状态、编排和执行边界。
上下文工程把任务背景、约束、工具结果和历史状态组织成稳定输入。
评测与回归用样例集、轨迹回放和指标看住 Agent 的质量变化。

工程判断

上线前至少要确认:

  1. 工具调用是否有输入 schema、权限和失败语义。
  2. 长任务是否能恢复、回放和审计。
  3. 输出质量是否有可重复的评测方式。
  4. 高风险动作是否需要人工确认。

On this page