Aceryt
LV.7
这个用户很懒,还没有个人简介
声望 1745
关注 0
粉丝 1
私信
主帖 196
回帖
今天凌晨1点30,OpenAI发布了全新图像模型GPTimage1,已经通过API向全球开发者开放使用。GPTimage1与ChatGPT版本有很大不同,可以控制生成图像的敏感度、生成效率、背景、输出格式、渲染质量、压缩质量等,并且支持全网爆火的吉卜力模式。目前,Adobe、Figma、HeyGen、Wix等知名企业已经将该模型集成在产品中。需要注意的是,OpenAI已经对新模型的API使用了全新身份验证。如果无法通过验证的小伙伴,可以使用微软的Azure云服务...
2025-04-24 09:57:36 1266浏览 0点赞 0回复 0收藏
字节跳动开源了多模态AIAgentUITARS的最新1.5版本。与上一代相比,1.5版本在计算机使用、浏览器使用和手机使用等基准测试中均表现非常出色。在计算机使用方面,OSworld测试得分为42.5,高于OpenAICUA的36.4、Claude3.7的28以及之前的最高水平38.1(200步);WindowsAgentArena(50步)得分为42.1,远超之前的29.8。浏览器使用方面,WebVoyager得分为84.8,接近OpenAICUA和之前最高水平的87,OnlineMind2web得75.8,优于OpenAICU...
2025-04-23 11:55:00 1618浏览 0点赞 0回复 0收藏
今天凌晨,微软在官网开源了DeepSeekR1魔改版MAIDSR1,在保留原有推理性能的基础上进行了大幅度增强。尤其是在响应和屏蔽词方面有了显著改进:MAIDSR1可以响应99.3%的敏感话题提示,比原版R1提升了2倍,这对于政治学术研究、社会问题、伦理道德研究等帮助巨大;但在安全风险大幅度降低,比原版R1降低了50%。那些想体验一下“放飞自我”版R1的小伙伴们可以试试这个,非常有意思打开全新世界。开源地址:​​https:huggingface.co...
2025-04-18 09:47:15 2936浏览 0点赞 0回复 0收藏
今天凌晨1点,OpenAI进行了技术直播,发布了最强、最智能模型o4mini和满血版o3。o4mini和o3是两款多模态模型,能同时处理文本、图像和音频,并且能作为Agent智能体自动调用网络搜索、图像生成、代码解析等工具以及深度思考模式(思维链中可以思考图像)。根据OpenAI公布的测试数据显示,o4mini在AIME2024和2025中,分别达到了93.4%和92.7%,比满血版o3还强,成为目前准确率最高的模型;在Codeforces测试中达到了2700分,成为全...
2025-04-17 09:50:34 1733浏览 0点赞 0回复 0收藏
今天凌晨1点,谷歌DeepMind终于将大家期待已久的Veo2整合到GeminiApp应用中,全面开放使用。Veo2可以最高生成8秒720P电影级视频,在运镜、文本语义还原、物理模拟、动作一致性等方面非常优秀,同时支持图片转视频功能。根据谷歌公布的测试数据显示,Veo2在用户偏好和提示还原方面已经超过了Sora、可灵1.5、MetaMovieGen和Minimax。此外,从今天开始开发人员可以在GoogleAIStudio中通过API使用Veo2。API详细地址:​​https:ai.g...
2025-04-16 10:18:21 1472浏览 0点赞 0回复 0收藏
今天凌晨1点,OpenAI进行了技术直播发布了最新模型——GPT4.1。除了GPT4.1之外,还有GPT4.1Mini和GPT4.1Nano两款模型,在多模态处理、代码能力、指令遵循、成本方面实现大幅度提升。特别是支持100万token上下文,这对于金融分析、小说写作、教育等领域帮助巨大。由于GPT4.1的发布,OpenAI宣布将会淘汰刚发布不久的GPT4.5,其能力可见一斑。目前,如果想体验GPT4.1而无法通过API身份验证的小伙伴,微软已经在AzureOpenAI上线了该...
2025-04-15 09:44:25 1062浏览 0点赞 0回复 0收藏
斯坦福大学、耶鲁大学、南加州大学等研究人员联合开源了,专用于代码定位的智能体LocAgent。在软件开发和维护领域,代码定位是开发者日常工作中的核心任务之一,需要开发者根据问题描述,例如,错误报告、功能请求或性能问题等,快速、准确地找到需要修改的代码片段。但传统代码定位方法在处理复杂代码库时,面临复杂代码库导航困难,问题描述与代码实体之间的语义鸿沟,多跳推理的困难等。而LocAgent可以有效解决这些难题,能...
2025-04-10 10:24:08 1561浏览 0点赞 0回复 0收藏
昨晚,谷歌在GoogleCloudNext25大会上,开源了首个标准智能体交互协议——Agent2AgentProtocol(简称A2A)。A2A将彻底打破系统孤岛,对智能体的能力、跨平台、执行效率产生质的改变,支持Atlassian、Box、Cohere、Intuit、Langchain、MongoDB、PayPal、Salesforce、SAP、ServiceNow、UKG和Workday等主流企业应用平台。简单来说,这个A2A交互协议有点当年谷歌牵头80多家企业搞安卓系统的味道,因为首批就有50多家著名企业加入。...
2025-04-10 10:19:24 1629浏览 0点赞 0回复 0收藏
全球AI领导者英伟达开源了,用于实体机器人和自动化驾驶的超大训练数据合集——NVIDIAPhysicalAIDataset。这个数据集一共15T,涵盖了超过320,000个机器人训练轨迹,以及多达1,000个通用场景描述,还包括一个SimReady集合。此外,用于支持端到端自动驾驶汽车(AV)开发的专用数据即将推出,这些数据将包括来自美国1,000多个城市和欧洲二十多个国家的多样化交通场景的20秒剪辑,这对于训练自动化驾驶非常珍贵。开源地址:​​http...
2025-04-09 10:26:34 1562浏览 0点赞 0回复 0收藏
今天凌晨4点,著名大模型训练平台TogetherAI和智能体平台Agentica,联合开源了新模型DeepCoder14BPreview。该模型只有140亿参数,但在知名代码测试平台LiveCodeBench的测试分为60.6%,高于OpenAI的o1模型(59.5%),略低于o3mini(60.9%)。在Codeforces、AIME2024上的评测数据同样非常出色,几乎与o1、o3mini差不多。值得一提的是,TogetherAI不仅开源了DeepCoder14B模型权重,还把训练数据集、训练方法、训练日志和优化方法全...
2025-04-09 10:23:50 1357浏览 0点赞 0回复 0收藏
今天凌晨1点半,Meta生成式AI领导者AhmadAlDahle在社交平台发布了一篇长文,对前天刚开源的Llama4质疑进行了官方回应。Ahmad表示,Llama4一开发完就发布了,所以,不同服务中模型质量难免会有一些差异。Meta很快会修复这些漏洞提升性能。同时否认在测试集上进行了预训练。但Meta在官网发布时特意点名DeepSeek,说他们新开源的Llama4Maverick在代码能力可以比肩其新开源的V3模型,国内不少知名媒体也以此为噱头来写标题。现在看...
2025-04-08 09:27:16 1713浏览 0点赞 0回复 0收藏
上周四,OpenAI宣布其AgentSDK支持MCP之后,在智能体赛道产生了巨大影响,功能、开发流程都有了质的改变。并且OpenAI的桌面版ChatGPT、API也很快支持MCP。但很多人不知道去哪里找这些高效、实用的MCP服务。今天「AIGC开放社区」就为大家盘一盘,包括浏览器、数据库、文件系统、论文搜索、金融分析、游戏、知识检索、定位服务、网络安全等100多个开源MCP,无限扩展智能体武器库,打造自己的Manus。目前,这个开源MCP合集算是gith...
2025-03-31 09:41:43 3791浏览 0点赞 0回复 0收藏
微软、清华的研究人员联合发布了SECOM,一种专用于个性对话Agent的记忆构建和检索的创新方法。研究人员在LOCOMO和LongMTBench+两个超复杂数据集上进行了综合评估。LOCOMO数据集的对话平均长度超过300轮,包含约9000个标记的对话片段,是目前最长的对话数据集之一。LongMTBench+则通过合并多个会话构建更长的对话,平均包含约65轮对话。结果显示,LOCOMO数据集上,SECOM的GPT4Score达到71.57,比全历史方法高出17.42分,比轮次级...
2025-03-31 09:34:59 1235浏览 0点赞 0回复 0收藏
加州大学伯克利分校、苏黎世联邦理工学院等多所高校的研究人员,深入剖析了大模型在执行Agent任务时面临的困境——过度思考。为了量化这种行为,研究人员开发了一套系统评估框架,并通过4018条轨迹分析发现,高推理努力配置的模型虽然解决了29.1%的问题,但成本高达1400美元;而低推理努力配置则以3.5倍更低的成本达到了21.0%的成功率。此外,生成两个低推理解决方案并选择其中一个具有较低过度思考得分的方法,实现了27.3%的解...
2025-03-26 10:58:20 1409浏览 0点赞 0回复 0收藏
今天凌晨2点,OpenAI进行了技术直播,对GPT4o和Sora进行了重大更新,提供了全新文生图模型。除了文生图之外,该模型还支持自定义操作、连续发问、风格转换、图像PPT等超实用功能,例如,更改图片的宽高比、图像物体中的角度,用十六进制代码指定精确颜色等。尤其是生成图像的逼真度,肉眼几乎看不出任何破绽,在精细度、细节和文本遵循方面非常出色,可以媲美甚至在某些功能超过该领域的头部平台Midjourney。新图像模型功能展示...
2025-03-26 10:54:54 1702浏览 0点赞 0回复 0收藏
昨晚,国内著名大模型平台DeepSeek开源了V3模型的最新版本0324。不过DeepSeek相当低调,国内的公众号、国外的社交平台没有做任何宣传,就是“悄悄”地把模型上传到huggingface。根据国外网友测试显示,V30324最大亮点之一就是代码能力,只需要简单的文本提示就能快速开发各种网站、App,可以比肩目前全球最强的闭源代码模型Claude3.7Sonnet思维链版本。但V30324是开源且免费的,推理效率更快。开源地址:https:huggingface.code...
2025-03-25 10:35:10 1547浏览 0点赞 0回复 0收藏
全球AI领导者英伟达在“GTC2025”开发者大会上宣布,开源人形机器人通用大模型GR00TN1。该模型能够处理多模态数据,包括语言、图像、视频,可在家务、工厂等多样化环境中执行复杂操作任务。值得一提的是,GR00TN1的核心架构采用了模拟人类思维的“快慢思考”模式,可以让机器人的做法、思维更像人类,从而提升动作指令准确率。开源地址:https:huggingface.convidiaGR00TN12BGR00TN1的核架构的设计灵感来源于人类的快慢思维处理...
2025-03-20 10:39:11 1787浏览 0点赞 0回复 0收藏
今天凌晨,知名大模型训练、开发平台Predibase发布了,首个端到端强化微调平台(RFT)。与传统的监督式微调相比,RFT不依赖大量的标注数据,而是通过奖励和自定义函数来完成持续的强化学习,同时支持无服务器和端到端训练方法,从数据管理、训练模型到应用部署可以在同一个平台全部完成。也就是说,你只需要一个浏览器,设定微调目标、上传数据、就能完成以前非常复杂的大模型微调流程。在线体验地址:https:predibase.comreinf...
2025-03-20 10:36:16 1772浏览 0点赞 0回复 0收藏
AMD在官网开源了最新小参数模型Instella3B。比较特别的是,这是一个基AMDInstinct™MI300XGPU从头训练的模型。根据测试数据显示,Instella3B的性能超过了Llama3.23B、Gemma22B,可以媲美阿里开源的Qwen2.53B,这也证明了AMD的GPU也能训练出高性能的大模型。开源地址:https:huggingface.coamdInstella3BInstella3BSFT是经过监督微调的模型,使用了89.02亿tokens的数据,增强了遵循指令的能力。Instella3BInstruct则是经过直接偏...
2025-03-19 12:06:37 1508浏览 0点赞 0回复 0收藏
今天凌晨,全球AI领导者英伟达(Nvidia)在美国圣何塞举办了“GTC2025”全球产品、开发者大会,涵盖大模型、AIAgent、实体机器人、AI专用芯片、量子计算等技术分享。其中,英伟达在官网宣布与Oracle(甲骨文)达成技术合作,提供160多种原生AI工具和100多个微服务,帮助企业构建超复杂、无缝衔接的Agent应用,将复杂、重复的数字业务实现自动化。还开源了一个专用于Agent的基础模型LlamaNemotron,目前,微软、埃森哲、德勤、SA...
2025-03-19 12:02:26 1702浏览 0点赞 0回复 0收藏
获得成就
已积累 11.1w 人气
获得 1 个点赞
获得 0 次收藏