忘掉 ChatBots, 智能体 (AI Agents) 将是未来
随着AI Agents技术的不断发展和成熟,我们可以期待在未来看到更多令人兴奋的创新和应用。这些技术有望成为推动人类进步和提高生活质量的重要工具。
本周,一家名为Cognition AI的初创公司引起了轰动,他们发布了一个演示,展示了一个名为Devin的人工智能程序执行通常由高薪软件工程师完成的工作。像ChatGPT和Gemini这样的聊天机器人可以生成代码,但Devin更进一步,规划解决问题的方法,编写代码,然后测试和实施。
Devin的创建者将其定位为“AI软件开发人员”。当被要求测试Meta的开源语言模型Llama 2在通过不同公司主机访问时的性能时,Devin生成了一个逐步的项目计划,生成了访问API并运行基准测试所需的代码,并创建了一个总结结果的网站。
评估经过策划的演示总是很困难,但Cognition展示了Devin处理各种令人印象深刻的任务。它在推特上让投资者和工程师们赞叹不已,获得了许多认可,甚至激发了一些预测Devin将很快导致技术行业裁员浪潮的到来。
Devin只是我一直在追踪的趋势的最新、最精致的例子——即出现了能够采取行动来解决问题,而不仅仅是提供人类所提出问题的答案或建议的AI Agents。几个月前,我试驾了Auto-GPT,这是一个开源程序,试图通过在用户的计算机和网络上采取行动来完成有用的任务。最近,我测试了另一个名为vimGPT的程序,以了解新的AI模型的视觉技能如何帮助这些Agents更高效地浏览网络。
我对这些Agents的实验结果印象深刻。然而,就像为它们提供动力的语言模型一样,它们现在还存在相当多的错误。当一款软件正在采取行动,而不仅仅是生成文本时,一个错误可能意味着彻底失败——并可能带来昂贵或危险的后果。将Agents能够执行的任务范围缩小到特定的软件工程任务集合,似乎是降低错误率的聪明方式,但仍然存在许多潜在的失败方式。
不仅仅是初创公司在构建AI Agents。本周早些时候,我写了一篇关于由Google DeepMind开发的名为SIMA的Agents的文章,该Agents玩的视频游戏包括真正疯狂的标题《Goat Simulator 3》。SIMA通过观察人类玩家学会了如何执行600多项相当复杂的任务,例如砍树或击中小行星。最重要的是,即使在陌生的游戏中,它也能成功地执行许多这些动作。Google DeepMind称之为“通才”。
我怀疑Google希望这些Agents最终能够在视频游戏之外的领域发挥作用,也许是帮助用户代表他们使用网络或操作软件。但视频游戏为开发和测试Agents提供了一个良好的沙盒环境,因为它们提供了复杂的环境,可以在其中对Agents进行测试和改进。“使它们更加精确是我们正在积极努力的事情,”Google DeepMind的研究科学家Tim Harley告诉我。“我们有各种各样的想法。”
在接下来的几个月里,你可以期待更多关于AI Agents的新闻。Google DeepMind的CEO Demis Hassabis最近告诉我,他计划将大型语言模型与公司先前训练AI程序玩视频游戏的工作相结合,以开发更具能力和可靠性的Agents。“这绝对是一个巨大的领域。我们正在大力投资这个方向,我想其他公司也在这样做,”Hassabis说道。“当它们开始变得更像Agents时,这将是这些类型系统能力的一个重大飞跃。”
本文转载自 MoPaaS魔泊云,作者: Will Knight