
腾讯开源了一个通用智能体,又刷榜了GAIA!
腾讯优图实验室悄摸摸开源了 Youtu-agent
, 在较复杂的的深度搜索和工具使用benchmark上表现不错,今天给家人们分享一下他的亮点。
不依赖GPT/Claude的SOTA
最值得一提的是,上面的评测都是使用的DeepSeek !!!!
以后不能随便说,现在的Agent离开Claude,啥也不是了?
所以他的框架到底有些什么亮点呢?
最大的亮点:像聊天一样生成Agent
对新手来说,配置Agent很烦人。
他们搞了一个自动智能体生成的功能。
别的框架是,你可能要适配一些类代码,或者比较复杂的yaml配置。
在youtu-agent里边,只需要运行一个脚本,它就会像聊天一样,通过问答交互来理解你的需求,然后自动为你生成并保存一个配置好的Agent。
就类似下面这样,很简单。
# 运行这个脚本,开始和元智能体对话
python scripts/gen_simple_agent.py
# 对话结束后,运行它为你生成好的Agent配置
python scripts/cli_chat.py --stream --config generated/xxx
用AI来创建AI的模式,应该能大幅降低上手门槛,让大伙可以把精力真正聚焦在任务本身,而不是繁琐的配置上。
示例
wide research:
数据分析:
粗看架构
提供了单、多智能体两种模式。
可以处理直接的、单一目标的任务,也能通过编排多个专用Agent来解决复杂的多步骤问题,也就是扩展性不错。
工具以工具包的形式存在。一个工具包,可以有多个工具,支持MCP。
toolkits:
search:
mode: builtin
name: search_toolkit
activated_tools: [web_search, local_search]
document:
mode: builtin
name: document_toolkit
对外的环境感知,可以从简单的 shell 环境到复杂的基于浏览器的系统。 浏览器环境的架构比较复杂。浏览器工具自带了,search_google、go_to_url、click_element、scroll_down/up等等常用工具
from utu.env import BrowserEnv
browser_env = BrowserEnv(trace_id="unique_session_id")
上下文管理模块,也做了比较细致的,输入处理、记忆管理、状态追踪的工作。
特色,分析平台
同时集成了 OpenTelemetry(用于对接Phoenix等实时监控前端)和 DBTracingProcessor(用于将追踪数据持久化到数据库)。
可以实时调试,也可以做长期的离线分析。
结果会保存到本地,并可在分析平台中进一步查看。
最后
感兴趣的小伙伴,可以自行体验:https://github.com/Tencent/Youtu-agent/tree/main
本文转载自探索AGI,作者:猕猴桃
