51CTO首页
AI.x社区
博客
学堂
精品班
软考社区
免费课
企业培训
鸿蒙开发者社区
信创认证
公众号矩阵
移动端
视频课
免费课
排行榜
短视频
直播课
软考学堂
全部课程
软考
信创认证
华为认证
厂商认证
IT技术
PMP项目管理
免费题库
在线学习
文章
资源
问答
课堂
专栏
直播
51CTO
鸿蒙开发者社区
51CTO技术栈
51CTO官微
51CTO学堂
51CTO博客
CTO训练营
鸿蒙开发者社区订阅号
51CTO软考
51CTO学堂APP
51CTO学堂企业版APP
鸿蒙开发者社区视频号
51CTO软考题库
AI.x社区
首页
文章
课堂
直播
评选
登录/注册
51CTO
中国优质的IT技术网站
51CTO博客
专业IT技术创作平台
51CTO学堂
IT职业在线教育平台
我的关注
全部帖子
默认
发布时间
热度
原创
精华
热门标签
AI
DeepSeek
LLM
GPT-5 发明了新数学:这是通用人工智能吗?
山姆·奥特曼一直在大肆宣称GPT5具备博士级智能,如今初步迹象已经显现。一位推特用户称,GPT5展示了一些前所未见的新数学内容,互联网上找不到相关信息,且它能用新的数学算法和方法给出正确证明。实际情况是怎样的“塞巴斯蒂安·布贝克是微软的正统数学家,他给GPT5Pro出了一道凸优化领域的题目。这不是教科书上的题,也不在arXiv学术预印本平台上,不是自动补全的内容,而是一道开放性难题。具体来说:任务是改进优化领域中...
柏企阅文
0回复
962浏览
GPT-5
人工智能
数学
“他正在过马路” vs “他过了马路”:一个简单问题,为何却让GPT-4o等顶级AI模型集体“翻车”?
探究大型语言模型的“心智”——一项关于叙事中时间理解的认知评估在人工智能的前沿探索中,大型语言模型(LLMs)以其惊人的语言生成与交互能力,不断刷新着公众与学界的认知。然而,一个根本性的问题始终萦绕在研究者心头:这些模型展现出的流畅对话与复杂文本处理能力,究竟是源于一种类似人类的、基于概念和逻辑的“真正理解”,还是一种基于海量数据训练而成的、极其复杂的统计模式匹配?这一问题不仅关乎技术的未来走向,...
上堵吟1
0回复
1003浏览
GPT-4o
AI
模型
深度解析QVAC:Tether的AI乌托邦——一场技术远见与信誉原罪的世纪豪赌
深度解析QVAC:Tether的AI乌托邦——一场技术远见与信誉原罪的世纪豪赌在全球金融科技的版图上,Tether公司以其发行的稳定币USDT,扮演着一个举足轻重但又备受争议的角色。如今,这家加密世界的巨头将触角伸向了人工智能这一决定未来的领域,推出了其宏伟的战略项目——QVAC(QuantumVerseAutomaticComputer)。这并非一次简单的跨界尝试,而是一场精心策划的、旨在从根本上颠覆由大型科技公司主导的中心化AI格局的战略博弈。Te...
上堵吟1
0回复
1039浏览
QVAC
AI
Tether
ABack——RAG范式下的隐私保护思路
大型语言模型企业级隐私保护新范式:对AdaptiveBacktracking(ABack)技术的深度解读与评估随着大型语言模型(LLMs)的开源化和能力的飞速发展,企业正以前所未有的速度将其集成到核心业务流程中。其中,检索增强生成(RetrievalAugmentedGeneration,RAG)范式,通过将LLM与企业内部的私有知识库相结合,极大地提升了模型在专业领域的表现力。然而,这种深度融合也带来了一个尖锐且亟待解决的问题:企业数据的隐私安全。当模型为...
上堵吟1
0回复
1289浏览
ABack
RAG
隐私
【TVM 教程】Python Target 参数化
原创
社区头条
ApacheTVM是一个深度的深度学习编译框架,适用于CPU、GPU和各种机器学习加速芯片。更多TVM中文文档可访问→摘要对于任何支持的runtime,TVM都应该输出正确的数字结果。因此,在编写验证数字输出的单元测试时,这些单元测试应该在所有支持的runtime上都能正常运行。由于这是一个非常常见的用例,TVM的辅助函数可以对所有单元测试进行参数化,从而便于单元测试在所有启用并具有兼容设备的target上运行。测试套件的单个Python函数...
HyperAI超神经
0回复
1048浏览
CPU
TVM
GPU
参数化
Python
AI代码率是最蠢指标!AWS CEO狂怼“代码量崇拜”!3年后没有人手写Java!
原创
社区头条
在AI公司疯狂吹嘘“AI能写80%代码”时,AWSCEOMattGarman泼了一盆冷水。他的态度相当直接:“AI代码占比?这是最愚蠢的指标。”“衡量代码量从来不是好方法,很多时候,代码越少越好。所以我完全不理解,为什么有人喜欢用这个指标来炫耀。”这番言论迅速在HackerNews引发讨论:Garman在播客中还反驳了另一种流行观点——AI将取代初级工程师。Garman提到,AWS推出AI辅助编码工具Kiro后,有企业高管兴奋地告诉他:“AI工具可以取...
51CTO技术栈
0回复
1031浏览
AI
代码
Java
马斯克宣布开源Grok 2.5!点名中国公司是最强对手,Grok 3半年后开源
原创
马斯克旗下人工智能公司xAI今日宣布开源Grok2.5模型,并计划在未来六个月内开源更强大的Grok3模型。 昨晚,马斯克在X平台连续发布多条消息,宣布其人工智能公司xAI已正式开源Grok2.5模型。这款模型是xAI在2024年的主力模型,如今完全向公众开放。 与此同时,马斯克还预告了下一代模型Grok3的开源计划,预计将在约六个月后发布。  根据官方发布的信息,Grok2.5模型目前已经可以在HuggingFace平台下载。整个...
算家计算
0回复
1422浏览
马斯克
Grok 2.5开源
人工智能
算家云
租算力,到算家云
DeepSeek V3.1:低调发布,重磅发声
原创
社区头条
本文介绍了在HuggingFace平台低调发布的DeepSeekV3.1,该模型具有6850亿个参数,规模更庞大,更灵活,支持多种功能。本文将探讨DeepSeekV3.1的关键特性和能力,并提供操作指南。DeepSeekV3.1的发布并没有举办大张旗鼓的新闻发布会,也没有铺天盖地的宣传活动。它在HuggingFace平台上悄然发布,在短短数小时内就吸引了众人的目光。该模型拥有6850亿个参数,上下文窗口可扩展至128k个令牌,这不仅仅是增量更新,而是开源人工智...
51CTO内容精选
0回复
3303浏览
DeepSeek
人工智能
开源模型
DeepSeek 官方留言引爆AI圈!UE8M0 FP8是为哪款国产芯片量身打造的?
社区头条
这几天AI圈的热点几乎被DeepSeekV3.1包揽了。相比性能本身的提升——比如在编程基准上超越Claude4Opus,更让众多网友在意的是技术细节中藏着的彩蛋:它采用了一种叫UE8M0FP8的浮点格式,而官方明确说,这是为“下一代国产芯片”设计的机制。  FP8并不是新概念,NVIDIA、Meta早就布局,但DeepSeek这次用的UE8M0变体非常特别——8bit全分给指数,无符号、无尾数,只支持非负数,数值范围极大但精度极低。看起来有点极端...
算家计算
0回复
5234浏览
DeepSeek-V3.1
国产芯片
人工智能
算家云
租算力,到算家云
三观碎了!老鸟自曝某AI初创奇葩工作经历:代码全靠ChatGPT拼接,脚本命名憋笑,高危慎入!
原创
社区头条
编辑云昭出品51CTO技术栈(微信号:blog51cto)太狗血了!劝各位,如果正在找AI方面的工作,可得擦亮眼睛了!今天,小编碰到了一个荒诞得有点狗血的真实故事。一位技术非常厉害的独立开发者老哥最近自曝了一段在某家AI初创公司干项目的经历。这家公司据说刚刚融到了50万美金的Preseed,结果进到公司之后才发现,自己被忽悠了。整个公司竟然连技术合伙人都没有。这位开发者大吃一惊,问道:公司的技术栈用的是什么?创始人沉默了...
51CTO技术栈
0回复
1336浏览
AI
ChatGPT
OpenAI
RAG 文档解析工具选型指南
原创
社区头条
编者按:当你需要为RAG系统选择文档解析工具时,面对GitHub上数百个开源项目和各种商业解决方案,你是否感到无从下手?本文基于作者在实际项目中的工具使用经验,系统梳理了处理不同类型文档的工具选择。从知识图谱处理的GRAG、KGRAG、GNNRAG等工具,到表格解析的TableRAG、TA。从HTML处理的BeautifulSoup、HtmlRAG,到PDF解析的MinerU、GPTPDF、Marker,再到多模态处理的CLIP、Wav2Vec2.0等。期待本文能够帮助你快速找到最适合...
Baihai_IDP
0回复
1202浏览
LLM
RAG
键鼠操控未来!DiT模型秒变“世界模型”,昆仑万维Matrix-Game 2.0开源打造无限可能的虚拟世界!
社区头条
论文链接:https:arxiv.orgpdf2508.13009项目链接:https:matrixgamev2.github.io亮点直击MatrixGame2.0——一个专为实现实时性能与稳健泛化能力而设计的新型框架。其技术核心是一个集成动作控制模块的视频扩散Transformer,并通过SelfForcing技术蒸馏为一个因果性、少步长的自回归模型。该架构结合高效的KV缓存机制,支持训练与推理,在单张H100GPU上实现25帧秒的生成速度,同时在超出训练分布的复杂野外场景中保持...
zhangyannni
0回复
1379浏览
AI
模型
虚拟
LangGraph的stream_mode到底怎么选?我调了一下午终于搞明白了
原创
社区头条
最近在重构我们的AI对话系统,从简单的请求响应模式升级到实时流式处理。过程中发现LangGraph的streammode远比文档上写的复杂,今天把对应的实践经验分享出来。streammode到底是什么简单说,streammode就是控制你在流式处理时能拿到什么数据。简单理解就是你的Graph在执行时,每完成一个节点都会产生输出。streammode决定你能看到什么:是看到完整的状态快照?还是只看变化的部分?或者只关心LLM的输出?4种模式values这是默认...
AI博物院
0回复
3075浏览
LangGraph
AI对话系统
人工智能大模型训练框架和四阶段
原创
大模型训练框架大模型训练框架通常涵盖以下关键内容:自动微分与计算图优化支持梯度自动计算和高效的反向传播,优化计算图结构以提高训练效率。分布式训练策略提供数据并行、模型并行、流水线并行及混合并行等多种方式,允许在多GPU或多机环境下协同训练大模型。内存与计算优化通过混合精度训练、梯度累积、零冗余优化等技术,降低内存消耗并加速训练过程。高效数据加载与预处理包含高性能的数据管道,支持大规模数据集的实时预...
数智飞轮
0回复
2310浏览
人工智能
大模型
魔搭 ms-swift 框架
一、什么是msswift?为什么选它?二、核心能力:这些技术让微调效率翻倍2.1轻量训练技术全家桶2.2人类偏好对齐训练方法2.3推理与量化加速三、5分钟上手3.1安装3.2环境要求3.310分钟微调实战:以Qwen2.57B为例3.3.1命令行方式3.3.2训练后推理3.3.3模型推送到ModelScope33.3.4零代码微调:WebUI界面3.3.5使用python训练和推理四、从训练到部署完整流程4.1支持的训练方法4.2预训练4.2微调4.3RLHF4.4推理4.5界面推理4.6部署4.7采样4...
鸿煊的学习笔记
0回复
5239浏览
ms-swift
框架
大模型
大模型微调技术基础
一、微调基础概念1.1.什么是大模型微调?1.2全量微调与高效微调的区别1.3模型微调的优劣势分析二、高效微调核心技术:LoRA与QLoRA简介2.1LoRA:低秩适配的高效微调方法2.2QLoRA:量化与低秩结合的优化方案2.3LoRA与QLoRA对比三、高效微调的四大应用场景3.1对话风格微调3.2知识灌注3.3推理能力提升3.4Agent能力提升四、主流微调工具介绍4.1unsloth4.2LLamaFactory4.3msSWIFT4.4ColossalAI4.5其他微调框架五、模型性能评估框架:E...
鸿煊的学习笔记
0回复
2182浏览
大模型
微调
技术
上下文工程:AI新时代的核心竞争力
摘要在AI时代,“提示工程”正在让位于更强大的“上下文工程”。上下文工程不仅是写一个提示词,而是为模型设计、收集、组织所有必要的信息与工具,使其能在恰当的时间以最优的方式完成任务。这一理念正成为打造高效AI智能体的关键。1.从提示工程到上下文工程在过去,AI应用的核心技能是编写精确的提示词(PromptEngineering)。然而,随着大型语言模型(LLM)和自主智能体(Agents)的普及,我们发现,影响智能体成败的最大因...
知识图谱科技
0回复
1097浏览
AI
上下文工程
提示词
企业级数字人应用:七牛云详解视频采集SOP与最佳实践
社区头条
近年来,在市场需求与政策双重驱动下,数字人产业正经历高速增长。据艾媒咨询数据显示,中国虚拟人核心市场规模预计在2025年将达到480亿元。AI技术的赋能,不仅提升了数字人的交互智能,更关键的是,它正在推动生产门槛的降低,使“自助式”和规模化制作成为可能。然而,随着技术普及,一个核心问题也日益凸出:如何确保产出的数字人形象足够逼真、自然?在AI数字人领域,一个普遍的共识是:算法模型决定了效果的上限,而训练数...
七牛云行业应用
0回复
1909浏览
智能数字人
采集指南
七牛云
AI技术
AIGC
数字人集成避坑指南:API与私有化部署技术选型
社区头条
在北京等一线城市500亿产业政策的推动下,它已不再是营销部门的专属玩物,而是深入客服、金融、政务等核心业务线的生产力工具。对于开发者和技术决策者而言,问题不再是要不要用,而是如何正确地集成。当一个数字人服务摆在面前时,我们通常会遇到第一个,也是最关键的一个岔路口:是选择轻量快捷的API调用,还是选择安全可控的私有化部署?API调用vs.私有化部署这两种模式没有绝对的优劣,只有场景的适配度。●API(应用程序编...
七牛云行业应用
0回复
1477浏览
七牛云
API调用
私有化部署
数字人平台
开发者指南
人工智能时代下的WordPress开发形态
原创
社区头条
在过去,利用WordPress(一款功能强大的开源内容管理系统,广泛用于搭建网站和博客,支持用户通过直观界面进行内容创建、编辑和管理,且可通过插件和主题扩展功能与外观)搭建网站需投入大量时间成本。首先要完成平台的安装,接着从众多选项中挑选适配的主题,再添加各类插件,并且要手动撰写全部网站内容,同时还需保证各个组件之间能够协同且高效地运行。即便是经验丰富的开发者,搭建一个基础网站也至少需要耗费数小时。整个...
51CTO内容精选
0回复
1201浏览
WordPress
人工智能
网站搭建
暂无内容
1
41
42
43
44
45
46
47
48
49
客服