51CTO首页
AI.x社区
博客
学堂
精品班
软考社区
免费课
企业培训
鸿蒙开发者社区
信创认证
公众号矩阵
移动端
视频课
免费课
排行榜
短视频
直播课
软考学堂
全部课程
软考
信创认证
华为认证
厂商认证
IT技术
PMP项目管理
免费题库
在线学习
文章
资源
问答
课堂
专栏
直播
51CTO
鸿蒙开发者社区
51CTO技术栈
51CTO官微
51CTO学堂
51CTO博客
CTO训练营
鸿蒙开发者社区订阅号
51CTO软考
51CTO学堂APP
51CTO学堂企业版APP
鸿蒙开发者社区视频号
51CTO软考题库
AI.x社区
首页
文章
课堂
直播
评选
登录/注册
51CTO
中国优质的IT技术网站
51CTO博客
专业IT技术创作平台
51CTO学堂
IT职业在线教育平台
首页
/
社区头条
社区头条
1205
篇优秀内容
2025年09月
AI Agents 能自己开发工具自己使用吗?一项智能体自迭代能力研究
原创
精华
编者按:AI智能体能否通过构建和使用工具来实现真正的自我改进?当我们谈论人工智能的“自我进化”时,究竟指的是训练阶段的算法优化,还是推理阶段的能力提升?我们今天为大家带来的这篇文章,作者的观点是:当前的大语言模型虽然能够构建出复杂的开发工具,但在实际执行任务时往往选择忽略这些自建工具,更倾向于依赖既有知识直接解决问题。文章通过对比GPT5和ClaudeOpus4两个先进模型的实验,详细记录了让AI智能体自主构建任...
Baihai_IDP
1天前
0回复
486浏览
Agent
自进化AI
能 “替科学家写代码” 的 AI 来了!谷歌新系统突破科研瓶颈,加速科学发现
谷歌全新人工智能系统将大型语言模型(LLMs)与树搜索(TreeSearch)技术相结合,实现了专家级科学软件的自动化创建。通过将研究重构为“可评分任务”,该系统在生物信息学、流行病学和神经科学领域展现出超越人类的性能,预示着加速科学发现的新时代到来。假设你是一名科学家,正凝视着屏幕。你的目标是研究亚马逊雨林的森林砍伐问题——你已掌握拍字节(PB)级别的卫星数据,但要将这些原始数据转化为可靠的“森林砍伐检测工...
柏企阅文
1天前
0回复
708浏览
代码
谷歌
系统
苹果研究院最新成果:FastVLM如何打破分辨率与延迟的矛盾
原创
精华
在多模态大模型的竞速赛道上,苹果终于拿出了属于自己的「杀手锏」——FastVLM。这款新型视觉语言模型(VisionLanguageModel,VLM)不仅实现了性能与效率的最佳平衡,还在关键指标上做到了「越小越快」。相比同类模型,它的推理速度快85倍,而且体积缩小了3.4倍。对于需要高分辨率图像处理的多模态任务,这无疑是一针强心剂。因为在过去,VLM的「高分辨率」和「低延迟」几乎是天生对立的,而FastVLM则在这对矛盾中找到了突破口。...
Halo咯咯
1天前
0回复
636浏览
FastVLM
多模态大模型
视觉语言模型
Python构建AI语音与文本互转辅助工具的方法
原创
当今课堂的多元化程度远超以往,学生群体涵盖有不同需求的神经多样性学习者(Neurodiverselearners:指的是大脑神经发育模式与典型学生不同的学习者,包括自闭症、ADHD、阅读障碍等神经多样性学习者群体的统称)。尽管这类学习者具有独特优势,但传统教学方法难以满足其需求。在此情况下,AI驱动的无障碍工具可发挥作用。从实时字幕到自适应阅读支持,AI正使课堂更具全纳性。本文将涵盖以下内容:阐释全纳教育的实际意义。介绍A...
51CTO内容精选
10h前
0回复
194浏览
Python
AI驱动
AI语音
谷歌AI掌门人万字访谈首度披露:AGI五年内到来,机器人将成新安卓系统
精华
摘要谷歌DeepMind掌门人、诺奖得主DemisHassabis判断,5到10年内将迎来通用人工智能(AGI)。但这并非靠模型堆砌,而是需要解决创造力、一致性等根本难题。本文将为你揭示他眼中通往AGI的真实路线图:什么是比语言模型更重要的“世界模型”?机器人如何成为下一个“安卓”?以及AI如何开启下一个科学黄金时代。通用人工智能(AGI)的实现,大概还需要5到10年。这不是某个分析师的预测,而是来自全球AI研究的引擎室——谷歌DeepM...
草台AI
2天前
0回复
2303浏览
谷歌
AI
AGI
Rust顶级大神遭裁撤无奈发帖求饭碗,AI抢走了预算资源!后续:找到新工作了,首周自学GPU编程
原创
编辑云昭出品51CTO技术栈(微信号:blog51cto)“AI在科技界吸走了大量资金和注意力,留给其他方向的资源就少了。”距离在网上无奈发帖表示“将被裁掉求饭碗”整整两个月后,RustTop5级的核心贡献者NicholasNethercote昨天终于对外宣布找到了新工作。这一事件引起了整个编程圈乃至科技行业的关注。Rust近些年一直被全球各大巨头所追捧,但随着大模型时代的开启,AI的光环日益壮大,就连Rust这位昔日宠儿的预算和资源,都被抢夺...
51CTO技术栈
1天前
0回复
262浏览
Rust
AI
GPU
别再浪费时间做笔记了!Seedream4.0帮你3秒搞定,效果惊艳
建立一套学习的方法论非常重要,比如,怎么将知识转化为可视化、有逻辑、有趣的东西,每当回想起xx,总会有一个关键词触发它。所以,建立自己的思维认知非常重要,有逻辑,有计划的学习,比死记硬背高效的多。今天,我想告诉你的是,用最新的Seedream4.0,也能帮助学生做学霸笔记。我将带大家一步一步进行实操做好小板凳。语文基础知识基础知识是根本,主要考察汉字、词语和标点符号的正确使用,要求学生能准确书写汉字、理解词...
AIGC新知
2天前
0回复
468浏览
Seedream4.0
AI
豆包
未来会有私人专属GPU!OpenAI联创、Codex打造者自曝OpenAI代码大模型的路线图:AI可委派一队Agent并行干活
原创
编辑云昭出品51CTO技术栈(微信号:blog51cto)OpenAI不是要搞AGI吗?为什么突然专门开始搞编码大模型了?今天一早,GPT5的Codex版本在凌晨发布,再度让整个AI编程赛道圈沸腾起来。紧接着2个小时后,OpenAI官方的“GPT5Codex”的主题播客也放了出来。OpenAI的“御用”播客主持人AndrewMayne(身兼作家、魔术师、OpenAI顾问)再度出镜,邀请OpenAI联合创始人GregBrockman,以及Codex工程负责人ThibautSucco,围绕智能体、GPT5C...
51CTO技术栈
1天前
0回复
273浏览
GPU
OpenAI
Agent
AI 智能体在顺丰运营场景的落地案例剖析
原创
精华
在现在变化超快的物流行业里,谁能把效率和精准度做得更好,谁就更有竞争力。以前靠人管的老办法,早就跟不上越来越多的业务需求了。而AI智能体就像给物流行业安上了“智能大脑”,正在帮行业实现大变革。顺丰在这方面做了很多探索,就是想靠智能化把物流从接单到派件的全流程管得更细、优化得更好。一、顺丰的“全流程智慧管理”:分三步管好物流顺丰把物流作业拆成了三个核心环节,AI智能体在每个环节都发挥着重要作用,就像...
玄姐聊AGI
3天前
0回复
1809浏览
AI智能体
RAG
案例剖析
别急着买RTX4090!大多数学生学习机器学习根本用不到GPU
原创
省钱又高效,这才是学生党的ML硬件选择逻辑“学机器学习是不是必须买显卡?”这可能是很多刚入门AI的同学问得最多的问题之一。看着论坛里人人都在讨论RTX4090、A100,仿佛没有一张高端显卡就学不了深度学习——但事实真的如此吗?今天,我们就来打破这个迷思。一、初学者阶段:你需要的不是GPU,是耐心当你刚刚踏入机器学习的大门,每天面对的是:清洗CSV文件写简单的Python脚本用Matplotlib或Seaborn做数据可视化在scikitlearn...
Halo咯咯
3天前
0回复
1222浏览
机器学习
GPU
RTX4090
Apertus:瑞士首个开源大模型,多语言支持,合规训练,高效性能
在人工智能领域,开源大模型的出现为全球开发者和研究人员带来了新的机遇。瑞士近日正式推出了其首个完全开源的大语言模型——Apertus。这一模型由瑞士联邦理工学院(EPFL)、苏黎世联邦理工学院(ETHZurich)和瑞士国家超级计算中心(CSCS)联合研发,旨在推动透明、开放且合规的AI发展。。一、项目概述Apertus是瑞士首个大规模开放的大型语言模型(LLM),具有多语言处理能力,覆盖了超过1000种语言,其中40%的数据来自非英语...
穿越时空111
3天前
0回复
1256浏览
开源
大模型
LLM
REFRAG:基于块压缩的RAG解码优化
Meta发布的REFRAG(REFRAG:RethinkingRAGbasedDecoding)在解码时将大部分检索到的token替换为预计算的块嵌入,然后选择性地只扩展少数重要的块。这利用了RAG提示中的块对角注意力模式来减少延迟和内存,同时在RAG、多轮对话和长文档摘要中保持准确性。这是一种用于RAG系统的即插即用解码策略,能够大幅降低延迟和内存使用。REFRAG实现了高达30.85倍的TTFT(首字符生成时间)加速。图片核心思想将检索到的上下文分块,用轻量级编...
sbf_2000
6天前
0回复
771浏览
REFRAG
RAG
解码优化
阿里重磅开源Qwen3-Next!破局AI算力瓶颈,训练成本暴降
原创
阿里通义团队开源Qwen3Next模型,采用创新MoE架构实现训练成本暴降90%,长文本推理速度提升10倍,突破AI算力成本瓶颈。 今天凌晨,阿里通义团队发布了下一代基础模型架构Qwen3Next,新架构采用高稀疏度MoE设计和混合注意力机制,成功将训练成本降低90%以上,同时实现长文本推理吞吐量10倍的提升。 团队认为ContextLengthScaling和TotalParameterScaling是未来大模型发展的两大趋势,为进一步提升模型在长上下文和大规...
算家计算
5天前
0回复
1208浏览
人工智能
Qwen3-Next
模型架构
算家云
租算力,到算家云
Seedream 4.0 实测:一致性媲美Nano Banana,附企业级应用案例
前两天,字节发布了Seedream4.0模型,跟NanoBanana一样,从生成到编辑实现一站式创作,有很强的一致性和可控性,相较于之前版本有极大程度的提高。没想到,刚写完NanoBanana,就迎来了我第二篇生图文章,哈哈哈哈。体验之后,觉得多图融合、参考生图还是复杂的图像编辑效果都很好,同时在NanoBanana不擅长的中文显示上也贼强。Seedream4.0模型在豆包、即梦、火山方舟上都能使用,我是直接在火山方舟的体验中心测试,https:e...
NLP工作站
6天前
0回复
2822浏览
Seedream 4.0
企业级
模型
从MoE到256K上下文:Qwen3-Max-Preview的技术架构解读
2025年9月5日,中国人工智能领域迎来了一个里程碑式的事件。阿里巴巴通义千问团队正式发布了其首个参数量超过一万亿的旗舰级大型语言模型——Qwen3MaxPreview。这一消息迅速在全球技术社区引发热议,它不仅代表了中国AI技术在超大规模模型领域的重大突破,更引发了一个深刻的行业叩问:这是否意味着,中国AI的“GPT4时刻”已经到来?要回答这个问题,我们不能仅仅停留在参数规模的震撼上,而需要深入剖析这款模型在技术能力、市...
七牛云行业应用
5天前
0回复
2164浏览
Qwen3
万亿参数模型
MaaS平台
AI技术创新
2025 年大语言模型架构演进:DeepSeek V3、OLMo 2、Gemma 3 与 Mistral 3.1 核心技术剖析
原创
编者按:在Transformer架构诞生八年之际,我们是否真的见证了根本性的突破,还是只是在原有设计上不断打磨?今天我们为大家带来的这篇文章,作者的核心观点是:尽管大语言模型在技术细节上持续优化,其核心架构仍保持延续,真正的创新更多体现在效率提升与工程实现上。文章系统梳理了2025年多个主流开源模型的架构演进,重点分析了DeepSeekV3R1的多头潜在注意力(MLA)与混合专家模型(MoE)、OLMo2的归一化层放置策略与QK归一...
Baihai_IDP
6天前
0回复
4094浏览
LLM
AI
Seedream 4.0 实测:一致性媲美Nano Banana,附企业级应用案例
前两天,字节发布了Seedream4.0模型,跟NanoBanana一样,从生成到编辑实现一站式创作,有很强的一致性和可控性,相较于之前版本有极大程度的提高。没想到,刚写完NanoBanana,就迎来了我第二篇生图文章,哈哈哈哈。体验之后,觉得多图融合、参考生图还是复杂的图像编辑效果都很好,同时在NanoBanana不擅长的中文显示上也贼强。Seedream4.0模型在豆包、即梦、火山方舟上都能使用,我是直接在火山方舟的体验中心测试,https:e...
NLP工作站
6天前
0回复
2822浏览
Seedream 4.0
企业级
模型
vLLM深度解析:高吞吐量大语言模型推理系统的内部架构
博客文章(InsidevLLM:AnatomyofaHighThroughputLLMInferenceSystem)深度解析了vLLM的内部架构,我简单整理了一下LLM引擎和引擎核心LLM引擎是vLLM的基础构建块。单独而言,它已经能够实现高吞吐量推理——但仅限于离线设置。使用以下离线推理代码片段作为示例:fromvllmimportLLM,SamplingParamsprompts["Hello,mynameis","ThepresidentoftheUnitedStatesis",]samplingparamsSamplingParams(temperature0.8,topp0.95)defmain():l...
sbf_2000
6天前
0回复
1810浏览
vLLM
语言模型
内部架构
重塑AI算力架构:从GPU集群到单片晶圆级芯片的技术演进
在人工智能的飞速发展中,我们惊叹于大型语言模型日益强大的理解、推理和创造能力。然而,在这场由算法驱动的智能革命背后,一个常被忽视却起着决定性作用的力量,正在悄然重塑着性能的天花板——那就是承载AI计算的硬件本身。AI大模型的性能突破,本质上是算法与硬件协同进化的成果。近期,仅有320亿参数的K2Think模型,在特定的数学和科学推理基准测试中,其表现优于一些参数规模远超于它的巨型通用模型。这一现象的背后,正...
七牛云行业应用
7天前
0回复
2168浏览
AI硬件革命
晶圆级芯片
高性能计算
七牛云
K2Think
可信AI人工智能四大支柱和评测要素
原创
一、可信AI为什么重要当前,可信人工智能(TrustworthyAI)的重要性远超技术本身,它直接关系到人工智能能否安全、健康、可持续地融入人类社会,并真正为人类造福。其重要性可以从以下几个核心维度来深入理解:1.建立社会信任:AI被广泛接受的基石核心问题:如果公众不信任AI,他们就会抵制它,无论其技术多么先进。不信任会扼杀创新和市场应用。为什么重要:a.用户接纳度:人们不会愿意使用一个他们认为是“黑箱”、有偏见或不...
数智飞轮
7天前
0回复
946浏览
人工智能
可信AI
生成式人工智能
1
2
3
4
5
6
7
8
9
10
61
客服