十一月雨_55
LV.4
这个用户很懒,还没有个人简介
声望 444
关注 0
粉丝 1
私信
主帖 38
回帖
我最近一直在思考一个问题:我们现在看到的那些“智能”AI,比如能写诗、能画画的大语言模型,它们真的很“智能”吗?它们能不能像我们人类一样,真正地在未知世界中“学习”和“成长”,而不是仅仅“记住”和“模仿”?这个问题触及到了人工智能领域的“圣杯”——实现真正的强人工智能。我们渴望的,不是一个知道一切的百科全书,而是一个能自主探索、自主学习、自我提升的“心智”。最近,当我深入研读强化学习之父RichSutto...
2025-09-02 06:38:34 829浏览 0点赞 0回复 0收藏
最近我在整理大模型数学推理的实验数据时,发现一个特别“离谱”的现象:为了让AI解对一道AIME(美国数学邀请赛,难度接近奥数)题目,我们得让它生成512条完整的解题思路,最后再用“少数服从多数”的方式投票选答案。这就像请512个学生做同一道题,不管有人写得颠三倒四、有人明显算错,你都得把所有答卷看完——既浪费时间,又耗“笔墨”(对应AI的token生成量),最后正确率还卡在97%上不去。直到读到MetaAI和UCSD团队刚发...
2025-09-02 06:37:41 961浏览 0点赞 0回复 0收藏
当671B参数的DeepSeekR1仍被视为数学推理领域的“重量级选手”时,一款仅14B参数的模型却以更短的推理路径实现了性能超越——微软研究院推出的rStar2智能体(rStar2Agent),通过智能体强化学习(AgenticReinforcementLearning)技术,让小模型摆脱了“靠长度堆性能”的传统路径,具备了“更聪明思考”的能力。这款模型仅用64张MI300XGPU、510步强化学习训练,便在AIME24数学竞赛中取得80.6%的pass1准确率,超越OpenAIo3mini、C...
2025-09-02 06:37:23 1554浏览 0点赞 0回复 0收藏
你有没有过这种体验?第一次学做番茄炒蛋,妈妈没说“油热到冒烟再下蛋”,只在你炒糊时皱眉,炒嫩时点头;第一次学骑车,没人给你列“平衡公式”,摔了几次后,身体自己就记住了怎么调整车把。我最近在读强化学习奠基人Barto和Sutton的访谈,突然意识到:原来我们每天都在经历的“试错学习”,正是AlphaGo能打败世界冠军、AI能自己摸索出最优策略的核心密码。这篇文章就带你拆透这个让机器学会“从经验中成长”的神奇逻辑——...
2025-08-20 07:18:13 643浏览 0点赞 0回复 0收藏
当机器人能像人类一样在复杂家居环境中自主整理杂物,当智能体可在未知场景中快速学习新技能——这些曾经的科幻场景,正因大模型与具身智能的结合逐渐逼近现实。然而,大模型究竟如何赋予具身智能“思考”与“学习”的能力?当前研究又面临哪些阻碍通用智能实现的瓶颈?这篇综述将为你揭开谜底。我们解读最新技术,文末有相关信息。摘要&解读具身智能旨在开发具有物理形态的智能系统,能够在真实世界环境中进行感知、决策、行动...
2025-08-20 07:13:07 3068浏览 0点赞 0回复 0收藏
当你用手机问AI"今天天气如何",或是让它写一段工作总结时,有没有想过背后发生了什么?这些看似简单的交互,其实是千亿级参数的大模型在高速运转——它们就像一个个"超级大脑",但"大脑"越大,消耗的计算资源就越多。一、你手机里的AI,可能正在"负重前行"你可能遇到过这样的情况:AI回答突然变慢,手机开始发烫,甚至有时候还会出现"内存不足"的提示。这不是AI"偷懒",而是它的"思考过程"太耗费资源了。就像一辆满载货物的卡...
2025-08-20 07:00:07 1749浏览 0点赞 0回复 0收藏
当AI被要求写一份关于“2025年生物医学突破”的深度报告时,它为何总是东拼西凑、漏洞百出?谷歌团队发现,问题出在AI不会像人类一样“反复打磨”——而他们新提出的TTDDR框架,竟让AI学会了“先写初稿、再查资料、逐句修改”的研究员式工作法,性能直接碾压现有系统。这个框架究竟是如何运作的?摘要&解读在大型语言模型(LLMs)的驱动下,深度研究智能体正在迅速发展;然而,当使用通用的测试时缩放算法生成复杂、长篇的研究...
2025-08-06 07:30:03 1197浏览 0点赞 0回复 0收藏
你有没有试过这样的经历:网购遇到问题想找客服,排队等了半小时,好不容易接通,对方却告诉你“这个问题需要转接到专门的同事”;去超市买东西,货架上常缺你想要的品牌,店员说“库存没及时跟上”;甚至担心手机里的健康数据,会不会一不小心就跑到了国外的服务器上?如果我告诉你,未来两年,这些麻烦可能都会被AI解决,你信吗?最近,德勤发布了一份关于AI趋势的报告,提到了三个听起来有点“高冷”的词:智能体AI、物理AI...
2025-08-06 07:15:24 2926浏览 0点赞 0回复 0收藏
当AI不仅能帮你写代码、答问题,还能悄悄“升级”自己——昨天解决不了的难题,今天突然找到新方法,甚至自己发明工具来突破局限时,它是否已经悄悄踏上了超越人类智能的道路?这篇综述撕开了“自进化智能体”的神秘面纱,从三个核心密码揭秘AI如何自主进化,或许藏着人工超级智能的终极答案。我们常用的大语言模型(比如ChatGPT、GPT4)虽然很能干,但就像“出厂设置”固定的机器——学会的东西不会自己更新,遇到新问题也不会...
2025-08-06 07:11:04 2677浏览 0点赞 0回复 0收藏
你有没有过这种经历?让AI画一只"戴红围巾的黑猫",出来的却是只"穿红衣服的黑猫"。明明AI已经能写论文、编代码,怎么看个图、画个画还这么不靠谱?最近突然想通了这个问题,未来23年,多模态领域会迎来两个堪比GPT4的"大爆发"时刻——这可能意味着,过不了多久,AI不仅能看懂你的图、听懂你的话,甚至能像人一样"边想边画"、"自主学习"。为什么多模态理解生成难突破?先从一个奇怪的现象说起:现在的AI,语言能力和视觉能力像...
2025-07-22 06:48:09 1751浏览 0点赞 0回复 0收藏
你有没有发现,当你给AI输入很长的内容时,它常常会“忘记”中间的关键信息?或者明明给了正确资料,它却还是编出错误答案?其实,这些问题的根源,不在于模型不够强,而在于我们给模型的“上下文”没管好。现在,一门叫“上下文工程”的新学科正在崛起,它不仅能让AI记住百万字的内容,还能让多个AI协作解决复杂任务。但这门技术背后,还隐藏着一个让研究者头疼的“能力不对称”难题——AI能看懂复杂信息,却写不出同等复杂的...
2025-07-22 06:46:07 1576浏览 0点赞 0回复 0收藏
昨天给孩子讲数学题,发现一个有趣的现象:我自己算的时候,脑子里飞快过了好几个思路,最后才得出答案;但给孩子讲时,必须把"先算括号里的""再乘除后加减"这些步骤一个个说出来。这让我想起最近读到的一篇论文,突然意识到:AI的"思考"方式,居然也在经历类似的转变——从必须"大声说出"每一步,到学会在心里"默默盘算"。你可能用过ChatGPT解复杂问题,它会一条条列步骤,比如"第一步算总量,第二步求比例",这种"说出来"的思...
2025-07-22 06:27:52 707浏览 0点赞 0回复 0收藏
在信息爆炸的时代,我们早已习惯了遇到问题就打开搜索引擎:想知道月球车项目何时取消,搜索;辨认传统戏曲种类,搜索;甚至连历史战役的细节,也能通过搜索找到答案。但你是否想过,我们寄予厚望的AI大模型,在面对这些问题时可能会「瞎编」答案?最近,字节跳动与新加坡南洋理工大学的研究员们带来了一项突破性技术——MMSearchR1,它让大型多模态模型(LMMs)学会了像人类一样「按需搜索」,彻底改变了AI处理未知信息的方式...
2025-07-01 06:10:48 1601浏览 0点赞 0回复 0收藏
一、市场概况与研究背景AI智能体(Agent)作为当前人工智能领域的前沿方向,正在从实验室概念迅速崛起为科技巨头的战略核心。2025年被业内普遍视为"AI智能体元年",标志着这一技术从基础研究迈向大规模商业化应用的关键转折点(16)。在这一背景下,全球科技巨头纷纷加大在智能体领域的投入,推出各具特色的产品和技术,形成了激烈的市场竞争格局。本报告聚焦于2024年6月至2025年6月期间,Google、OpenAI、Grok、Apple、字节跳动、...
2025-07-01 06:07:44 4095浏览 0点赞 0回复 0收藏
一、为什么你的智能音箱总像个"失忆症患者"?"嘿,Siri,推荐一部类似《星际穿越》的电影。""为你推荐《变形金刚》系列,科幻动作大片哦~"如果这样的对话让你血压飙升,别急,这不是你的错觉。现在的AI助手就像刚认识三天的室友:表面客气,实则对你的喜好只有模糊的"大众印象"。它们要么用一套模板应付所有人(比如永远推荐热门电影),要么像金鱼一样只有七秒记忆——上次你明明说过讨厌机器人题材,这次依然给你推《变形金...
2025-06-17 06:50:11 1713浏览 0点赞 0回复 0收藏
一、你的智能助手为啥总说胡话?LLM的三大"阿喀琉斯之踵"上周我让家里的智能音箱查"2025年NBA总冠军预测",它一本正经地说:"根据数据分析,纽约尼克斯队概率最高"——但凡关注篮球的都知道,尼克斯这赛季连季后赛门槛都没摸到。这不是个例,我的研究员朋友曾收到AI生成的论文综述,里面引用了2028年才发表的文献——这就是当前大语言模型(LLMs)的尴尬现状:能说会道却常犯迷糊,像个"笨蛋天才"。独立LLMs的三大硬伤正在暴露...
2025-06-17 06:47:26 1348浏览 0点赞 0回复 0收藏
2025年春天,戛纳电影节公布史上首个AI驱动电影长片单元——五部由生成式AI完成核心剧情框架的作品引发行业震动。这些电影采用“人类创意+生成式AI”混合模型(HyGenAI),号称节省75%成本与时间。中国导演齐磊的AI科幻电影《星际郎中》正是典型代表:其利用贵州算力集群,将3个月影视后期压缩至3小时,超算中心取代横店实景搭建,小团队操作算法即可替代百人剧组。这不是科幻小说。2025年的AI视频生成工具正以“月抛式”速度进...
2025-06-05 06:04:56 4052浏览 0点赞 0回复 0收藏
作者介绍:本文作者来自通义实验室RAG团队,致力于面向下一代RAG技术进行基础研究。该团队的WebWalker工作也被ACL2025mainconference录用。在当今信息爆炸的时代,如何高效地从海量的网络数据中获取有价值的信息,成为了人们面临的一大挑战。传统的搜索引擎虽然能够提供大量的信息,但在处理复杂的多步推理任务时往往显得力不从心。来自阿里巴巴通义实验室的研究员提供了WebDancer,一个原生的信息检索的AgenticModel,使之能够...
2025-06-05 06:02:01 1785浏览 0点赞 0回复 0收藏
当AI能自己“想”出国际奥数题解法,当智能体不再需要人类“喂饭”就能自主学习,一场颠覆认知的AI革命已悄然拉开帷幕。告别“抄作业”的时代,人工智能正在学会“自己动手”——但这究竟是开启了新文明的钥匙,还是打开了潘多拉魔盒?今天我们将深入探讨这场改变AI本质的“体验革命”。一、从“人类数据依赖症”到“自我成长觉醒”:AI发展的十字路口在人工智能的世界里,曾经有一个“抄作业”的时代。就像学生抱着教辅书刷题...
2025-05-22 00:01:10 1477浏览 0点赞 0回复 0收藏
当AI不仅能生成逼真视频,还能“理解”物理规则、“预测”社会互动时,世界模型正在重塑人工智能的边界。从自动驾驶中实时路况模拟,到机器人通过“认知地图”规划路径,再到虚拟社会中智能体的策略博弈——这项技术如何让机器像人类一样“思考世界”?本文将揭开世界模型的核心原理与未来图景,带你看看AI如何从“数据驱动”走向“世界理解”。随着GPT4、Sora等多模态模型的兴起,人工智能正从单一任务向“理解和模拟真实世界...
2025-05-22 00:00:15 8572浏览 0点赞 0回复 0收藏
获得成就
已积累 2.9w 人气
获得 0 个点赞
获得 1 次收藏