腾讯开源了一个通用智能体,又刷榜了GAIA!

发布于 2025-9-1 00:12
浏览
0收藏

腾讯优图实验室悄摸摸开源了 ​​Youtu-agent​​, 在较复杂的的深度搜索和工具使用benchmark上表现不错,今天给家人们分享一下他的亮点。

腾讯开源了一个通用智能体,又刷榜了GAIA!-AI.x社区

不依赖GPT/Claude的SOTA

最值得一提的是,上面的评测都是使用的DeepSeek !!!!

以后不能随便说,现在的Agent离开Claude,啥也不是了?

所以他的框架到底有些什么亮点呢?

腾讯开源了一个通用智能体,又刷榜了GAIA!-AI.x社区

最大的亮点:像聊天一样生成Agent

对新手来说,配置Agent很烦人。

他们搞了一个自动智能体生成的功能。

别的框架是,你可能要适配一些类代码,或者比较复杂的yaml配置。

在youtu-agent里边,只需要运行一个脚本,它就会像聊天一样,通过问答交互来理解你的需求,然后自动为你生成并保存一个配置好的Agent。

就类似下面这样,很简单。

# 运行这个脚本,开始和元智能体对话
python scripts/gen_simple_agent.py

# 对话结束后,运行它为你生成好的Agent配置
python scripts/cli_chat.py --stream --config generated/xxx

腾讯开源了一个通用智能体,又刷榜了GAIA!-AI.x社区

用AI来创建AI的模式,应该能大幅降低上手门槛,让大伙可以把精力真正聚焦在任务本身,而不是繁琐的配置上。

示例

wide research:

腾讯开源了一个通用智能体,又刷榜了GAIA!-AI.x社区

数据分析:

腾讯开源了一个通用智能体,又刷榜了GAIA!-AI.x社区

粗看架构

提供了单、多智能体两种模式。

可以处理直接的、单一目标的任务,也能通过编排多个专用Agent来解决复杂的多步骤问题,也就是扩展性不错。

腾讯开源了一个通用智能体,又刷榜了GAIA!-AI.x社区

工具以工具包的形式存在。一个工具包,可以有多个工具,支持MCP。

toolkits:
  search:
    mode: builtin
    name: search_toolkit
    activated_tools: [web_search, local_search]
  document:
    mode: builtin
    name: document_toolkit

对外的环境感知,可以从简单的 shell 环境到复杂的基于浏览器的系统。 浏览器环境的架构比较复杂。浏览器工具自带了,search_google、go_to_url、click_element、scroll_down/up等等常用工具

from utu.env import BrowserEnv
 
browser_env = BrowserEnv(trace_id="unique_session_id")

上下文管理模块,也做了比较细致的,输入处理、记忆管理、状态追踪的工作。

腾讯开源了一个通用智能体,又刷榜了GAIA!-AI.x社区

特色,分析平台

同时集成了 OpenTelemetry(用于对接Phoenix等实时监控前端)和 DBTracingProcessor(用于将追踪数据持久化到数据库)。

可以实时调试,也可以做长期的离线分析。

结果会保存到本地,并可在分析平台中进一步查看。

腾讯开源了一个通用智能体,又刷榜了GAIA!-AI.x社区

腾讯开源了一个通用智能体,又刷榜了GAIA!-AI.x社区

最后

感兴趣的小伙伴,可以自行体验:​​​https://github.com/Tencent/Youtu-agent/tree/main​

本文转载自​探索AGI​,作者:猕猴桃


已于2025-9-1 00:12:17修改
收藏
回复
举报
回复
相关推荐