Syrupup
LV.5
这个用户很懒,还没有个人简介
声望 898
关注 0
粉丝 1
私信
主帖 102
回帖
市场调研每年花费企业数十亿美元,却始终受困于样本偏差和规模限制。有没有好且经济的办法呢?来自PyMCLabs和高露洁棕榄的团队发现了一件有意思的事:让大语言模型扮演特定人群的消费者,给它看个产品,让它说说感受,再用另一个AI来评分,就能预测真实的购买意图,准确率高达90%。他们测试了57个个人护理产品概念,收集了9300份真实消费者反馈。最令人意外的是,这种方法不需要任何训练数据就打败了传统机器学习。直接让AI打分...
2天前 212浏览 0点赞 0回复 0收藏
最近一阶段,网络上大量吐槽ChatGPT过于机械保守,回复谨小慎微,刻板无趣。不过情况要改变了,ChatGPT即将放松内容限制。OpenAICEOSamAltman透露,ChatGPT将在未来几周内推出新版本,允许更加人性化的对话方式。12月将进一步开放,经过年龄验证的成年用户可以访问包括情色内容在内的更多功能。Altman表示,此前为防范心理健康风险,ChatGPT的限制设置过于严格,影响了大多数正常用户的使用体验。经过技术改进,现在可以在保证...
2天前 424浏览 0点赞 0回复 0收藏
GoogleResearch最近公布了一项研究进展:他们的开源模型Gemma家族新成员Cell2SentenceScale(C2SScale)27B,在与耶鲁大学和GoogleDeepMind的合作中,发现了一种新的癌症治疗途径,并已在活细胞实验中验证。这个27B参数模型的核心创新在于将单细胞基因表达数据转换成语言模型可理解的"细胞句子"。耶鲁大学DavidvanDijk实验室通过标记化处理,把每个细胞的基因表达模式以及数千个基因的活跃程度及相互关系编码成类似自然语言的序...
2天前 160浏览 0点赞 0回复 0收藏
你的RAG系统慢,可能是因为在做太多无用功。最近,Meta的研究团队发布了REFRAG框架,证明了一个关键发现:在RAG系统中,99%的跨段落注意力计算都是浪费的。随着上下文窗口不断增长,首个token的生成延迟呈二次方增长,这成为了RAG系统的性能瓶颈。REFRAG通过一种新的压缩策略,实现了30.85倍的首token生成加速,同时保持了模型的准确性。核心技术方案传统RAG流程很简单:查询来了,编码成向量,从向量数据库里找相似的文本块,...
2天前 142浏览 0点赞 0回复 0收藏
OpenAI的AgentBuilder消息先在网上传开,TestingCatalog爆料已经试用过这个可视化工作流工具。就在大家都在等凌晨OpenAIDevDay正式发布时,Anthropic突然宣布把ClaudeCodeSDK改名为ClaudeAgentSDK,抢先发布了完整的智能体开发框架。这个时机选得很微妙,颇有点“截胡”的味道。Anthropic显然不想让OpenAI独占智能体平台的话语权。AgentfeedbackloopClaudeAgentSDK的核心理念是"给AI一台电脑"。整个工作流程遵循一个循环:收集...
2025-10-09 07:52:12 913浏览 0点赞 0回复 0收藏
想要学习如何实现类似于ChatGPTPulse那种主动式、实时响应的AI助手的能力,这个名叫Pepper的项目可以学习一下。从架构图可以看出,与传统的请求响应模式完全不同,Pepper采用了主动式的智能体循环,它能够:主动抓取并总结新邮件提前准备相关背景信息持续跟进分配的任务技术亮点Pepper的几个核心特性让它脱颖而出:实时事件驱动架构:不是等你来问,而是主动监听各种事件并作出响应。比如新邮件到了,它会立即开始处理。异步工...
2025-10-09 07:51:18 1150浏览 0点赞 0回复 0收藏
当下机器学习应用开发就像是接力赛:从数据库取数据,传到应用服务器,再送到ML服务,处理完原路返回。每一棒都是延迟。更别提,开发者还需在SQL和应用代码之间不断“翻译”,这无形中增加了认知负荷和工程的复杂度。这时候,生态无比繁荣的开源数据库Postgres再次带来了惊喜,PostgresML团队直接让AI模型跑在数据库中。今天我们就介绍这个体系的两个关键项目:PostgresML和Korvus。这两个项目的关系很清晰,PostgresML作为底层...
2025-09-23 07:03:16 1136浏览 0点赞 0回复 0收藏
关于AI记忆的项目很多,之前我们介绍过Mem0之类的产品(​​mem0推出王炸mcp工具OpenMemory,打造用户私有、跨应用的共享记忆层​​)。今天我们来介绍一个新的项目Memori,它在技术选型上做了个有趣的选择:当大家都在追捧向量数据库和图数据库时,它选择了回归SQL。Memori是Gibson团队开发的开源记忆引擎,专门给大语言模型和AIAgent加上持久记忆。简单说,就是让AI能记住你们之前的对话,不用每次都从头开始。目前主流的AI记忆...
2025-09-23 07:03:01 1010浏览 0点赞 0回复 0收藏
NVIDIA发布RubinCPX,这是一款专门为大规模上下文AI推理设计的新型GPU。RubinCPX采用30petaflops算力和NVFP4精度,配备128GBGDDR7内存。与现有的GB300NVL72系统相比,性能提升7.5倍,attention处理速度快3倍。这款芯片将视频编解码器和长文本推理处理集成在单个芯片中。新推出的VeraRubinNVL144CPX平台将8exaflopsAI算力、100TB快速内存和1.7petabytes秒内存带宽装入单个机架。该平台支持NVIDIAQuantumX800InfiniBand和Spectrum...
2025-09-11 22:34:43 1812浏览 0点赞 0回复 0收藏
有人做了个简单又复杂的实验:让11个当前最先进的多模态大模型和5个普通人一起看钟表认时间。结果人类平均准确率89.1%,最好的AI只有13.3%——还不如闭着眼睛瞎猜。这个叫ClockBench的测试包含36种定制钟面,180个钟表样本,每个钟表要回答4个问题。设计者刻意加入了罗马数字、环形数字等非常规样式,结果AI在复杂钟面上的表现尤其糟糕。但当被要求"把时针逆时针转90度"这类衍生问题时,某些模型反而能100%答对。这说明AI擅长处...
2025-09-11 22:34:23 919浏览 0点赞 0回复 0收藏
a16z发布了第五期消费级AI应用排行榜。两年半的数据积累,这个榜单已经成为观察AI日常使用趋势的重要指标。生态正在稳定最明显的信号是新面孔在减少。网页版只有11个新入榜,比上次的17个还少。移动端倒是活跃一些,有14个新进入者,主要是因为应用商店开始清理ChatGPT“马甲”,给原创应用让出了空间。Google终于发力了Google第一次把各个AI产品分开统计,结果四个产品都进了网页前50:Gemini排第2,网页访问量约是ChatGPT的12...
2025-08-28 10:05:15 3323浏览 0点赞 0回复 0收藏
95%的企业AI试点项目产生零回报。MIT发布的《2025年商业AI现状》报告显示,尽管企业在GenAI上投入了300400亿美元,但95%的组织获得的回报为零。只有5%的AI项目真正产生了可衡量的商业价值。这种巨大的差异被研究者称为"GenAI鸿沟"——大部分企业停留在"试点阶段",而少数成功者已经从AI中获得了数百万美元的价值。为什么ChatGPT很好用,但企业AI工具很糟糕?报告揭示了一个有趣的矛盾:80%的组织都在使用ChatGPT等通用工具,但...
2025-08-28 06:54:09 3237浏览 0点赞 0回复 0收藏
OpenAI发布了GPTOSS,这是他们六年来第一个开源的大语言模型。自GPT2以来,LLM的能力确实有了巨大的飞跃,但这个模型本身相比DeepSeek、通义千问等开源模型,并没有带来特别的性能惊喜。真正有意思的,是OpenAI通过这次发布展现出的一些设计思路。JayAlammar新发布的《TheIllustratedGPTOSS》用信息图对其做了拆解分析。我们来看看都讲了什么。架构层面没什么新鲜事GPTOSS延续了自回归Transformer的经典架构,逐个生成token。相...
2025-08-28 06:42:27 1703浏览 0点赞 0回复 0收藏
Google前两天正式推出了新的原生图像生成和编辑功能,官方名称是Gemini2.5flashimagepreview,但社区都叫它"NanoBanana"。Google宣称这是"世界排名第一"的图像生成模型,并且免费向所有人开放。图片图片功能特点这个模型主要有几个亮点:风格转换:一句话就能把照片改成emo、goth、学院风等不同风格背景编辑:可以在自拍中添加各种背景元素,包括外星人发型预览:尝试不同发型效果,比如波波头和刘海照片修复:给老照片"重新焕...
2025-08-28 06:40:28 4597浏览 0点赞 0回复 1收藏
最近,国内大学有一项研究《HowChainofThoughtWorksTracingInformationFlowfromDecoding,Projection,andActivation》回答了一个困扰AI研究者很久的问题:为什么让模型"一步步思考"会显著提升推理能力?它们拆解了ChainofThought(思维链)提示的内部机制。过去大家都知道它有效,但没人说得清楚具体原因。研究团队选了6个不同规模的模型(LLaMA3.23B,LLaMA3.1(8B,70B),Gemma2(2B,9B,27B)),在9个数据集上做了全面测试,涵盖...
2025-08-14 08:15:37 1467浏览 0点赞 0回复 0收藏
上下文管理是AI智能体开发的核心难题。即使大模型有了千万级token窗口,也不意味着可以无脑塞信息——垃圾进,垃圾出的铁律依然有效。在此之前我们刊载了Manus在上下文工程上的心得。近日,DrewBreunig也分享了它对于上下文管理层面的见解。这是一个完整的上下文管理指南,分为问题诊断《HowLongContextsFailDrewBreunig[1]》和解决方案《HowtoFixYourContextDrewBreunig[2]》两部分。第一部分分析了四种长上下文失效模式:污染...
2025-08-14 08:11:21 1851浏览 0点赞 0回复 0收藏
OpenAI跳票开源模型,却在昨夜发布了ChatGPT智能体,能够像人类一样在网页上点击、输入、操作,真正从"副驾驶"跃升为"真正的助手"。三大核心能力完美融合ChatGPT智能体将三项强大功能有机整合:Operator的网站交互能力可以在网页上滚动、点击、输入深入研究的信息整合优势擅长分析和总结网络信息ChatGPT的对话交互能力自然流畅的人机对话这种融合让AI能够智能选择最优路径完成任务:快速通过API获取数据,同时与人类设计的网页...
2025-07-31 00:40:29 1946浏览 0点赞 0回复 0收藏
有关于LLM到底与人思维是否一样,LLM能否走向AGI的科学哲学探讨不断。OpenAIo3系统提示词泄漏!Hinton的观点再次被印证!​LeCun有了新证据!大模型思考与人类思考存在本质差别​笔者看来,这是不同视角,不同时间轴上的争论,它还会持续存在,直到AGI实现。这不有传言在本月末或者8月初GPT5发布,X上就有一个有趣的帖子,博主发帖警告说:"GPT5mightjustrevealhowmuchhuman'creativity'isactuallypatternrecognition."(GPT5可...
2025-07-31 00:35:07 1024浏览 0点赞 0回复 0收藏
扎克伯格刚发布了一篇关于"个人超级智能"的愿景文章。最震惊的信息在开头:过去几个月里,他们观察到AI系统开始自我改进。虽然速度还慢,但"不可否认"。同时,对外官宣了自己的愿景,驳斥了samaltman等人,称:与其让超级AI集中化地自动化所有工作、人类"吃救济金",不如让每个人都拥有自己的个人超级智能。一个超懂你的AI助手,帮你实现目标、创造想要的东西、成长为理想的自己。而到底如何发展,扎克伯格认为未来五年是决定性...
2025-07-31 00:29:07 1205浏览 0点赞 0回复 0收藏
AI视频领域的“核武器”已经正式引爆。一家名为Decart的AI创业公司,刚刚扔出了一颗足以改变行业的重磅炸弹:全球首个实时、无限长度的AI视频模型——MirageLSD。这项基于其独创的“实时流扩散”(LiveStreamDiffusion,LSD)技术的模型,能将你的想象力实时注入任何视频流中。这不再是看屏幕上的魔法,而是让你亲手创造魔法。这一步棋,直接宣告了对传统视频制作、直播乃至游戏行业的“战争”。创始人亲自“下场”:<40毫秒延迟...
2025-07-18 15:07:29 2923浏览 0点赞 0回复 0收藏
获得成就
已积累 9.2w 人气
获得 1 个点赞
获得 4 次收藏