十一月雨_55
LV.4
这个用户很懒,还没有个人简介
声望 481
关注 0
粉丝 1
私信
主帖 44
回帖
当你看到一张立方体展开图时,只需几秒的心理模拟(mentalsimulation)就能判断它能否折叠成完整立方体;面对三个点电荷的受力分析,随手画个受力图就能理清力的方向与大小关系——这些人类与生俱来的视觉推理能力,却曾是多模态大模型的“致命短板”。GPT4o曾在立方体折叠推理中混淆相邻面与对面的关系,在点电荷受力计算中错判力的方向,核心问题在于:如何让智能体像人类一样,将“看见”与“思考”真正结合?我们解读最新技...
3天前 1647浏览 0点赞 0回复 0收藏
你有没有过这样的经历?让手机助手帮你在购物APP里搜个耳机,它却反复点错广告弹窗;想让智能音箱联动灯光,它要么没反应,要么把空调也打开了。明明这些AI能看懂图片、听懂文字,怎么一到“动手做事”就掉链子?我们解读最新技术,文末有相关信息。最近在研究视觉语言模型(VLM)做智能体(Agent)的论文时,发现了一个让我眼前一亮的解法——来自南洋理工和阿里巴巴团队发表在ICML2025的新方法CoSo。它就像给AI装了个“智能导...
2025-09-25 06:54:36 4413浏览 0点赞 0回复 0收藏
当你结束一天的工作,期待AI能自主整理杂乱的桌面、按照需求烹饪简单的餐食,甚至协助完成家电维修时,是否曾疑惑:为何现有AI多局限于屏幕交互,难以真正“走进”物理世界?这一问题的核心,指向了AI领域的关键方向——具身智能体(EmbodiedAIAgent)。Meta超级智能实验室的JianweiYang团队CVPR2025发布的教程系统梳理了多模态具身智能体从“感知环境”到“逻辑思考”再到“自主行动”的技术路径,为我们揭示了多模态具身智能...
2025-09-25 06:51:29 4720浏览 0点赞 0回复 0收藏
随着人工智能尤其是大模型技术的快速发展,基于大型语言模型(LLM)的智能体(Agent)正成为研究和应用的新焦点。NeurIPS2025会议收录了大量围绕智能体架构设计、多智能体协作、具身推理、安全对齐等方向的前沿工作。这些研究不仅在理论上推动了对智能体行为与认知的建模,也在实际应用中展现出广泛潜力。本文将系统梳理会议中具有代表性的智能体相关论文,分类综述其核心贡献,并总结关键技术趋势。一、基础架构与优化方法该类...
2025-09-25 06:45:53 6082浏览 0点赞 0回复 0收藏
你是否曾想象过,某天你的私人AI助理不仅能帮你规划一整天的行程,还能替你处理那些繁琐的邮件往来,甚至帮你砍价购物,而你只需要说一句“搞定它”?等等,这听起来是不是有点像科幻电影?别急,我最近在研读一份来自红杉资本的内部资料时发现,这样的未来可能比我们想象的要近得多,而且,它所蕴含的经济潜力,甚至可能比蒸汽机和流水线带来的工业革命还要宏大!这份资料揭示了人工智能正在开启一场“认知革命”,它不仅仅是...
2025-09-15 07:53:08 1250浏览 0点赞 0回复 0收藏
你有没有过这样的经历?让AI帮你写一篇行业报告,它倒是很快凑出了几千字,但里面的数据还是2022年的;让它改,它只会在句子里加几个“综上所述”,不会自己去查最新资料;甚至让它帮你订一张周末的高铁票,它能写出订票步骤,却不会真的打开12306操作——这时候你可能会吐槽:AI啥时候能像个“真助理”,主动把事办明白?最近,牛津大学、新加坡国立大学、帝国理工、上海AI实验室、UCL等机构的研究员们,联合发布了一篇名为《T...
2025-09-14 12:09:59 4205浏览 0点赞 0回复 0收藏
我最近一直在思考一个问题:我们现在看到的那些“智能”AI,比如能写诗、能画画的大语言模型,它们真的很“智能”吗?它们能不能像我们人类一样,真正地在未知世界中“学习”和“成长”,而不是仅仅“记住”和“模仿”?这个问题触及到了人工智能领域的“圣杯”——实现真正的强人工智能。我们渴望的,不是一个知道一切的百科全书,而是一个能自主探索、自主学习、自我提升的“心智”。最近,当我深入研读强化学习之父RichSutto...
2025-09-02 06:38:34 1280浏览 0点赞 0回复 0收藏
最近我在整理大模型数学推理的实验数据时,发现一个特别“离谱”的现象:为了让AI解对一道AIME(美国数学邀请赛,难度接近奥数)题目,我们得让它生成512条完整的解题思路,最后再用“少数服从多数”的方式投票选答案。这就像请512个学生做同一道题,不管有人写得颠三倒四、有人明显算错,你都得把所有答卷看完——既浪费时间,又耗“笔墨”(对应AI的token生成量),最后正确率还卡在97%上不去。直到读到MetaAI和UCSD团队刚发...
2025-09-02 06:37:41 1291浏览 0点赞 0回复 0收藏
当671B参数的DeepSeekR1仍被视为数学推理领域的“重量级选手”时,一款仅14B参数的模型却以更短的推理路径实现了性能超越——微软研究院推出的rStar2智能体(rStar2Agent),通过智能体强化学习(AgenticReinforcementLearning)技术,让小模型摆脱了“靠长度堆性能”的传统路径,具备了“更聪明思考”的能力。这款模型仅用64张MI300XGPU、510步强化学习训练,便在AIME24数学竞赛中取得80.6%的pass1准确率,超越OpenAIo3mini、C...
2025-09-02 06:37:23 2129浏览 0点赞 0回复 0收藏
你有没有过这种体验?第一次学做番茄炒蛋,妈妈没说“油热到冒烟再下蛋”,只在你炒糊时皱眉,炒嫩时点头;第一次学骑车,没人给你列“平衡公式”,摔了几次后,身体自己就记住了怎么调整车把。我最近在读强化学习奠基人Barto和Sutton的访谈,突然意识到:原来我们每天都在经历的“试错学习”,正是AlphaGo能打败世界冠军、AI能自己摸索出最优策略的核心密码。这篇文章就带你拆透这个让机器学会“从经验中成长”的神奇逻辑——...
2025-08-20 07:18:13 890浏览 0点赞 0回复 0收藏
当机器人能像人类一样在复杂家居环境中自主整理杂物,当智能体可在未知场景中快速学习新技能——这些曾经的科幻场景,正因大模型与具身智能的结合逐渐逼近现实。然而,大模型究竟如何赋予具身智能“思考”与“学习”的能力?当前研究又面临哪些阻碍通用智能实现的瓶颈?这篇综述将为你揭开谜底。我们解读最新技术,文末有相关信息。摘要&解读具身智能旨在开发具有物理形态的智能系统,能够在真实世界环境中进行感知、决策、行动...
2025-08-20 07:13:07 3665浏览 0点赞 0回复 0收藏
当你用手机问AI"今天天气如何",或是让它写一段工作总结时,有没有想过背后发生了什么?这些看似简单的交互,其实是千亿级参数的大模型在高速运转——它们就像一个个"超级大脑",但"大脑"越大,消耗的计算资源就越多。一、你手机里的AI,可能正在"负重前行"你可能遇到过这样的情况:AI回答突然变慢,手机开始发烫,甚至有时候还会出现"内存不足"的提示。这不是AI"偷懒",而是它的"思考过程"太耗费资源了。就像一辆满载货物的卡...
2025-08-20 07:00:07 2105浏览 0点赞 0回复 0收藏
当AI被要求写一份关于“2025年生物医学突破”的深度报告时,它为何总是东拼西凑、漏洞百出?谷歌团队发现,问题出在AI不会像人类一样“反复打磨”——而他们新提出的TTDDR框架,竟让AI学会了“先写初稿、再查资料、逐句修改”的研究员式工作法,性能直接碾压现有系统。这个框架究竟是如何运作的?摘要&解读在大型语言模型(LLMs)的驱动下,深度研究智能体正在迅速发展;然而,当使用通用的测试时缩放算法生成复杂、长篇的研究...
2025-08-06 07:30:03 1487浏览 0点赞 0回复 0收藏
你有没有试过这样的经历:网购遇到问题想找客服,排队等了半小时,好不容易接通,对方却告诉你“这个问题需要转接到专门的同事”;去超市买东西,货架上常缺你想要的品牌,店员说“库存没及时跟上”;甚至担心手机里的健康数据,会不会一不小心就跑到了国外的服务器上?如果我告诉你,未来两年,这些麻烦可能都会被AI解决,你信吗?最近,德勤发布了一份关于AI趋势的报告,提到了三个听起来有点“高冷”的词:智能体AI、物理AI...
2025-08-06 07:15:24 3648浏览 0点赞 0回复 0收藏
当AI不仅能帮你写代码、答问题,还能悄悄“升级”自己——昨天解决不了的难题,今天突然找到新方法,甚至自己发明工具来突破局限时,它是否已经悄悄踏上了超越人类智能的道路?这篇综述撕开了“自进化智能体”的神秘面纱,从三个核心密码揭秘AI如何自主进化,或许藏着人工超级智能的终极答案。我们常用的大语言模型(比如ChatGPT、GPT4)虽然很能干,但就像“出厂设置”固定的机器——学会的东西不会自己更新,遇到新问题也不会...
2025-08-06 07:11:04 3281浏览 0点赞 0回复 0收藏
你有没有过这种经历?让AI画一只"戴红围巾的黑猫",出来的却是只"穿红衣服的黑猫"。明明AI已经能写论文、编代码,怎么看个图、画个画还这么不靠谱?最近突然想通了这个问题,未来23年,多模态领域会迎来两个堪比GPT4的"大爆发"时刻——这可能意味着,过不了多久,AI不仅能看懂你的图、听懂你的话,甚至能像人一样"边想边画"、"自主学习"。为什么多模态理解生成难突破?先从一个奇怪的现象说起:现在的AI,语言能力和视觉能力像...
2025-07-22 06:48:09 2026浏览 0点赞 0回复 0收藏
你有没有发现,当你给AI输入很长的内容时,它常常会“忘记”中间的关键信息?或者明明给了正确资料,它却还是编出错误答案?其实,这些问题的根源,不在于模型不够强,而在于我们给模型的“上下文”没管好。现在,一门叫“上下文工程”的新学科正在崛起,它不仅能让AI记住百万字的内容,还能让多个AI协作解决复杂任务。但这门技术背后,还隐藏着一个让研究者头疼的“能力不对称”难题——AI能看懂复杂信息,却写不出同等复杂的...
2025-07-22 06:46:07 1970浏览 0点赞 0回复 0收藏
昨天给孩子讲数学题,发现一个有趣的现象:我自己算的时候,脑子里飞快过了好几个思路,最后才得出答案;但给孩子讲时,必须把"先算括号里的""再乘除后加减"这些步骤一个个说出来。这让我想起最近读到的一篇论文,突然意识到:AI的"思考"方式,居然也在经历类似的转变——从必须"大声说出"每一步,到学会在心里"默默盘算"。你可能用过ChatGPT解复杂问题,它会一条条列步骤,比如"第一步算总量,第二步求比例",这种"说出来"的思...
2025-07-22 06:27:52 994浏览 0点赞 0回复 0收藏
在信息爆炸的时代,我们早已习惯了遇到问题就打开搜索引擎:想知道月球车项目何时取消,搜索;辨认传统戏曲种类,搜索;甚至连历史战役的细节,也能通过搜索找到答案。但你是否想过,我们寄予厚望的AI大模型,在面对这些问题时可能会「瞎编」答案?最近,字节跳动与新加坡南洋理工大学的研究员们带来了一项突破性技术——MMSearchR1,它让大型多模态模型(LMMs)学会了像人类一样「按需搜索」,彻底改变了AI处理未知信息的方式...
2025-07-01 06:10:48 1874浏览 0点赞 0回复 0收藏
一、市场概况与研究背景AI智能体(Agent)作为当前人工智能领域的前沿方向,正在从实验室概念迅速崛起为科技巨头的战略核心。2025年被业内普遍视为"AI智能体元年",标志着这一技术从基础研究迈向大规模商业化应用的关键转折点(16)。在这一背景下,全球科技巨头纷纷加大在智能体领域的投入,推出各具特色的产品和技术,形成了激烈的市场竞争格局。本报告聚焦于2024年6月至2025年6月期间,Google、OpenAI、Grok、Apple、字节跳动、...
2025-07-01 06:07:44 4984浏览 0点赞 0回复 0收藏
获得成就
已积累 3.7w 人气
获得 0 个点赞
获得 1 次收藏