最窒息的Bug:Agent循环搜索原地打转?SGR Agent用「双阶段认知」破局 精华

发布于 2025-9-3 00:12
浏览
1收藏

一、项目定位与核心价值

Hybrid Schema-Guided Reasoning(SGR)是一个革命性的 AI 研究智能体框架,它通过独创的「两阶段推理-执行架构」和「持久化上下文记忆系统」,解决了当前 AI 助手在复杂研究任务中的三大核心痛点:推理黑箱化、上下文遗忘症、工具调用僵化。

该项目不仅仅是一个简单的问答机器人,而是一个完整的「AI 研究操作系统」,它具备:

  • 认知透明性:每个决策都有完整的思维链可追溯
  • 记忆持续性:跨会话保存用户交互历史与研究成果
  • 行为适应性:根据新信息动态调整研究策略
  • 工具灵活性:自然语言驱动的多工具协同调用

二、架构创新:双阶段认知革命

最窒息的Bug:Agent循环搜索原地打转?SGR Agent用「双阶段认知」破局-AI.x社区

2.1 传统架构的局限性

当前主流 AI 研究工具存在两种极端:

  • 函数优先型:如 LangChain 的链式调用,完全黑箱操作
  • 提示依赖型:如 AutoGPT,过度依赖提示工程导致不稳定

SGR 通过「模式引导推理」(Schema-Guided Reasoning) 开创了第三种可能:

2.2 双阶段架构详解

阶段一:元认知层(Metacognition Layer)

  • 工具强制:通过​​tool_choice="generate_reasoning"​​ 强制 LLM 进入「反思模式」
  • 结构化输出:使用 Pydantic 模型确保推理格式一致性
  • 认知审计:生成包含「假设-验证-风险」的三维推理框架
  • 记忆检索:自动调用上下文记忆系统获取相关历史

阶段二:执行层(Execution Layer)

  • 自然选择:​​tool_choice="auto"​​ 让 LLM 像人类研究员一样「想到什么做什么」
  • 动态编排:根据阶段一的推理结果,自主决定工具组合顺序
  • 错误恢复:当工具返回异常时,自动回到阶段一重新推理
  • 渐进式构建:支持「搜索→阅读→再搜索」的迭代式研究

2.3 认知架构的哲学意义

这种设计模拟了人类专家的研究过程:

  1. 问题分解(类似阶段一的推理)
  2. 假设形成(结构化输出中的假设字段)
  3. 证据收集(阶段二的工具调用)
  4. 结论修正(基于新信息的动态重规划)

三、记忆系统:超越会话的永恒记忆

3.1 三层记忆架构

工作记忆(Working Memory)

  • 当前会话的完整对话历史
  • 实时维护的工具调用轨迹
  • 正在处理的文件内容快照
  • 临时计算结果缓存

情景记忆(Episodic Memory)

  • 跨会话的任务摘要(自动压缩为 500 字以内)
  • 用户偏好模式(如回答风格、文件命名习惯)
  • 失败案例记录(避免重复犯错)
  • 成功策略模板(可复用的研究范式)

语义记忆(Semantic Memory)

  • 已验证的事实知识库(带置信度评分)
  • 文件系统的持久化映射(记录所有创建/修改的文件)
  • 工具使用经验(特定场景下的最佳实践)
  • 领域知识图谱(从研究报告中提取的实体关系)

3.2 记忆压缩算法

采用「重要性加权衰减」策略:

记忆保留概率 = 基础权重 × 访问频率 × 时效衰减系数 × 情感强度

其中:

  • 成功完成任务的策略获得 1.5 倍权重加成
  • 导致错误的操作被标记为「负面记忆」降低复现概率
  • 关键文件操作(如创建重要报告)获得永久记忆保护

3.3 记忆检索机制

当用户提问「我之前关于区块链的研究有什么发现?」时:

  1. 语义搜索:在记忆库中匹配「区块链」相关摘要
  2. 时间过滤:优先返回最近 30 天的研究
  3. 重要性排序:按记忆的「价值评分」降序排列
  4. 上下文重构:将相关记忆注入新的对话上下文

四、使用场景

4.1 学术研究场景

案例:量子计算论文调研

用户:我需要关于量子纠错的最新研究,特别是表面码实现

系统执行:

1. 推理阶段:识别需要 2024-2025 年文献,重点关注实验实现

2. 搜索阶段:执行「surface code quantum error correction 2025」等 3 个查询

3. 文件阶段:创建 bibliography.bib(BibTeX 格式)和 summary.md(分方法比较)

4. 记忆更新:记录「用户偏好:偏重实验而非理论」

4.2 商业分析场景

案例:竞品分析报告

用户:分析特斯拉和比亚迪的 2025 年 Q2 财报对比

系统执行:

1. 获取当前日期(确保获取最新财报)

2. 搜索两家公司的官方财报 PDF

3. 提取关键指标(营收、毛利率、交付量)

4. 生成带图表的对比报告(自动保存为可分享的 HTML)

4.3 开发辅助场景

案例:代码项目理解

用户:解释我新下载的这个 Python 项目的结构

系统执行:

1. 扫描整个目录结构(最大深度 3 级)

2. 分析 requirements.txt 的依赖关系

3. 读取主要模块的 docstring 生成架构说明

4. 创建 PROJECT_GUIDE.md(包含运行步骤和关键文件说明)

​https://github.com/vakovalskii/sgr-deep-research​

本文转载自​CourseAI​,作者:CourseAI

已于2025-9-3 00:12:23修改
1
收藏 1
回复
举报
回复
相关推荐