Damn Agent

研究型 Agent 案例

研究型 Agent 从问题澄清、检索、证据整理到结论输出的链路拆解。

研究型 Agent 的难点不是“能不能搜索”,而是能不能持续保持问题边界、引用可靠来源,并区分事实、推断和建议。

流程拆解

sequenceDiagram
  participant U as 用户
  participant A as Agent
  participant S as Search
  participant R as Reviewer
  U->>A: 提出研究问题
  A->>A: 澄清范围和成功标准
  A->>S: 检索资料
  S-->>A: 返回候选来源
  A->>A: 提取证据并去重
  A->>R: 自检事实与引用
  R-->>A: 返回风险点
  A-->>U: 输出结论、证据和限制

关键设计

  • 检索 query 要可记录。
  • 来源要保留标题、URL、发布时间和访问时间。
  • 摘要必须区分原文事实和 Agent 推断。
  • 对不确定结论要显式标注。
  • 高风险主题需要人工复核。

最小数据结构

export type SourceEvidence = {
  title: string;
  url: string;
  quote?: string;
  summary: string;
  confidence: "low" | "medium" | "high";
};

export type ResearchState = {
  question: string;
  scope: string[];
  sources: SourceEvidence[];
  openQuestions: string[];
};

评测重点

研究型 Agent 的评测要特别关注编造来源、过度推断、遗漏反例和引用过期。最终答案看起来流畅并不代表它可信。

On this page