字节跳动开源多模态AI Agent—UI-TARS-1.5
社区头条 字节跳动开源了多模态AIAgentUITARS的最新1.5版本。与上一代相比,1.5版本在计算机使用、浏览器使用和手机使用等基准测试中均表现非常出色。在计算机使用方面,OSworld测试得分为42.5,高于OpenAICUA的36.4、Claude3.7的28以及之前的最高水平38.1(200步);WindowsAgentArena(50步)得分为42.1,远超之前的29.8。浏览器使用方面,WebVoyager得分为84.8,接近OpenAICUA和之前最高水平的87,OnlineMind2web得75.8,优于OpenAICU...