最窒息的Bug：Agent循环搜索原地打转？SGR Agent用「双阶段认知」破局精华

发布于 2025-9-3 00:12

浏览

1收藏

一、项目定位与核心价值

Hybrid Schema-Guided Reasoning（SGR）是一个革命性的 AI 研究智能体框架，它通过独创的「两阶段推理-执行架构」和「持久化上下文记忆系统」，解决了当前 AI 助手在复杂研究任务中的三大核心痛点：推理黑箱化、上下文遗忘症、工具调用僵化。

该项目不仅仅是一个简单的问答机器人，而是一个完整的「AI 研究操作系统」，它具备：

认知透明性：每个决策都有完整的思维链可追溯
记忆持续性：跨会话保存用户交互历史与研究成果
行为适应性：根据新信息动态调整研究策略
工具灵活性：自然语言驱动的多工具协同调用

二、架构创新：双阶段认知革命

最窒息的Bug：Agent循环搜索原地打转？SGR Agent用「双阶段认知」破局-AI.x社区

2.1 传统架构的局限性

当前主流 AI 研究工具存在两种极端：

函数优先型：如 LangChain 的链式调用，完全黑箱操作
提示依赖型：如 AutoGPT，过度依赖提示工程导致不稳定

SGR 通过「模式引导推理」(Schema-Guided Reasoning) 开创了第三种可能：

2.2 双阶段架构详解

阶段一：元认知层（Metacognition Layer）

工具强制：通过tool_choice="generate_reasoning" 强制 LLM 进入「反思模式」
结构化输出：使用 Pydantic 模型确保推理格式一致性
认知审计：生成包含「假设-验证-风险」的三维推理框架
记忆检索：自动调用上下文记忆系统获取相关历史

阶段二：执行层（Execution Layer）

自然选择：tool_choice="auto" 让 LLM 像人类研究员一样「想到什么做什么」
动态编排：根据阶段一的推理结果，自主决定工具组合顺序
错误恢复：当工具返回异常时，自动回到阶段一重新推理
渐进式构建：支持「搜索→阅读→再搜索」的迭代式研究

2.3 认知架构的哲学意义

这种设计模拟了人类专家的研究过程：

问题分解（类似阶段一的推理）
假设形成（结构化输出中的假设字段）
证据收集（阶段二的工具调用）
结论修正（基于新信息的动态重规划）

三、记忆系统：超越会话的永恒记忆

3.1 三层记忆架构

工作记忆（Working Memory）

当前会话的完整对话历史
实时维护的工具调用轨迹
正在处理的文件内容快照
临时计算结果缓存

情景记忆（Episodic Memory）

跨会话的任务摘要（自动压缩为 500 字以内）
用户偏好模式（如回答风格、文件命名习惯）
失败案例记录（避免重复犯错）
成功策略模板（可复用的研究范式）

语义记忆（Semantic Memory）

已验证的事实知识库（带置信度评分）
文件系统的持久化映射（记录所有创建/修改的文件）
工具使用经验（特定场景下的最佳实践）
领域知识图谱（从研究报告中提取的实体关系）

3.2 记忆压缩算法

采用「重要性加权衰减」策略：

记忆保留概率 = 基础权重 × 访问频率 × 时效衰减系数 × 情感强度

其中：

成功完成任务的策略获得 1.5 倍权重加成
导致错误的操作被标记为「负面记忆」降低复现概率
关键文件操作（如创建重要报告）获得永久记忆保护

3.3 记忆检索机制

当用户提问「我之前关于区块链的研究有什么发现？」时：

语义搜索：在记忆库中匹配「区块链」相关摘要
时间过滤：优先返回最近 30 天的研究
重要性排序：按记忆的「价值评分」降序排列
上下文重构：将相关记忆注入新的对话上下文

四、使用场景

4.1 学术研究场景

案例：量子计算论文调研

用户：我需要关于量子纠错的最新研究，特别是表面码实现

系统执行：

1. 推理阶段：识别需要 2024-2025 年文献，重点关注实验实现

2. 搜索阶段：执行「surface code quantum error correction 2025」等 3 个查询

3. 文件阶段：创建 bibliography.bib（BibTeX 格式）和 summary.md（分方法比较）

4. 记忆更新：记录「用户偏好：偏重实验而非理论」

4.2 商业分析场景

案例：竞品分析报告

用户：分析特斯拉和比亚迪的 2025 年 Q2 财报对比

系统执行：

1. 获取当前日期（确保获取最新财报）

2. 搜索两家公司的官方财报 PDF

3. 提取关键指标（营收、毛利率、交付量）

4. 生成带图表的对比报告（自动保存为可分享的 HTML）

4.3 开发辅助场景

案例：代码项目理解

用户：解释我新下载的这个 Python 项目的结构

系统执行：

1. 扫描整个目录结构（最大深度 3 级）

2. 分析 requirements.txt 的依赖关系

3. 读取主要模块的 docstring 生成架构说明

4. 创建 PROJECT_GUIDE.md（包含运行步骤和关键文件说明）