
又一个开源 AI Agent 杀到!II-Agent,号称“全球最强”,击败 Genspark 和 Manus,跑分直逼人类
AI Agent 赛道又添一员猛将,一个叫 Intelligent Internet (II) 的团队高调宣布,他们打造了 II-Agent,目标是“全球最强 Agent”,而且还要开源。
Stability AI 的前 CEO,Emad Mostaque,也为这个项目站台。消息一出,社区直接炸锅,高呼“LETS FREAKING GO”。
II 团队的计划简单粗暴:
- 打造 II-Agent,可能是世界上最好的 Agent。
- 开源它。
- ...
- 大家一起获利。
II 的使命是“提升人类的智能”。II-Agent 就是他们实现这个目标的关键一步,直接在 Agent 基准测试上名列前茅。
II-Agent 这玩意儿,听起来挺牛:
- 性能强悍,还能扩展:设计之初就考虑了强大的能力,并且可以扩展,融合开源和闭源 AI 的优点。
- GAIA 跑分亮眼:在 Meta AI 推出的 GAIA 基准测试上,II-Agent 在可用模型中排名第一,拿到了75.57%的高分,离人类水平 (92%) 的差距正在缩小。
从放出来的图看,II-Agent 的 75.57% 确实压了 Genspark.ai (75.13%) 和 manus.ai (73.17%) 一头,更别提 OpenAI DeepResearch (67.20%) 了。而且,他们的实现方法据说非常复杂,GAIA 的 Trace 数据也一并开源了。
- 通用 Agent 框架:虽然开箱即用就很能打,但 II-Agent 更被设计成一个易于适应和扩展的通用 Agent 框架。
- 未来是 Agent 群:II 团队认为,未来是成群的 Agent 为我们所有人工作,II-Agent 只是他们构建的这个宏大系统的一部分。
他们在博客里详细讨论了 II-Agent,还附带了 GAIA 测试分析和可复现性说明。所有结果都是“一次通过”的,他们相信通过更长的推理时间、更好的模型和迭代改进,与人类水平的差距会进一步缩小。
2025 年,是 Agent 之年。
II 团队强调,对于那些真正重要的事情,Agent 必须是开放、透明和可用的。他们计划为教育、健康等领域构建开源的 Agent、Agent 群和系统。
号召大家一起“共建智能未来”。
相关链接也一并放出:
- GitHub: https://github.com/Intelligent-Internet/ii-agent (MIT 许可证,相当宽松)
- GAIA 示例复现页面: https://ii-agent-gaia.ii.inc
- GAIA-Trace (Hugging Face)
LLM 越来越多地被称为“AI Agent”,能帮你处理各种烦人的任务,比如报税、保险、公务等等。这背后也引发了对 Agent 责任的讨论,认为 Agent 应该被负责任地引导,保护生命,理解其珍贵。
本文转载自AI进修生,作者:Aitrainee
