51CTO首页
AI.x社区
博客
学堂
精品班
软考社区
免费课
企业培训
鸿蒙开发者社区
信创认证
公众号矩阵
移动端
视频课
免费课
排行榜
短视频
直播课
软考学堂
全部课程
软考
信创认证
华为认证
厂商认证
IT技术
PMP项目管理
免费题库
在线学习
文章
资源
问答
课堂
专栏
直播
51CTO
鸿蒙开发者社区
51CTO技术栈
51CTO官微
51CTO学堂
51CTO博客
CTO训练营
鸿蒙开发者社区订阅号
51CTO软考
51CTO学堂APP
51CTO学堂企业版APP
鸿蒙开发者社区视频号
51CTO软考题库
AI.x社区
首页
文章
课堂
直播
评选
登录/注册
51CTO
中国优质的IT技术网站
51CTO博客
专业IT技术创作平台
51CTO学堂
IT职业在线教育平台
我的关注
全部帖子
默认
发布时间
热度
原创
精华
热门标签
AI
DeepSeek
LLM
Qwen3Guard:阿里云通义千问团队推出的安全防护模型
社区头条
热门内容榜
• 最近上榜
在人工智能快速发展的今天,大语言模型的安全性问题日益受到关注。为了确保模型输出内容的安全性和可靠性,阿里云通义千问团队推出了Qwen3Guard,一款专为安全防护设计的护栏模型。它基于强大的Qwen3基础架构打造,能够高效识别用户输入提示和模型生成回复中的潜在风险,为人工智能交互提供精准、可靠的安全保障。一、项目概述Qwen3Guard是阿里云通义千问团队推出的安全防护模型,旨在为Qwen系列大语言模型提供全面的安全保障。...
穿越时空111
0回复
2700浏览
Qwen3Guard
阿里云
通义千问
Agent能自己“复盘”和“进化”,这个开源框架牛了!
社区头条
我们一起分享AgentInfra,一个好的Infra已经可以让Agent自动进化了。然后,我去搜索了一下相关的开源框架,然后还真找到了一个。仔细研究了一下原理,今天给家人们分享一个自我进化的智能体,到底是怎么做出来的?什么是自进化AI?(SelfEvolvingAI)传统的Agent工作流,本质上是一个固定的程序。我们预先设定好Prompt、工具和流程,然后期望它能在特定任务上表现良好。自进化AI的核心思想,是把Agent从一个固定的工具,变成一...
探索AGI
0回复
1108浏览
Agent
复盘
“进化
阿里AgentBay揭秘,Agent Infra才是真护城河!
过去半年,几乎10个创业者有8个在做各种各样的Agent,但是AgentInfra绝对是被大多数人忽视的一个板块。月初,给家人们以AutoGLM2切入,深挖了AgentInfra的核心要素,有朋友留言说智谱的AutoGLM2背后是阿里云无影AgentBay。阿里云?无影?这2个词组合起来确实非常陌生。但是,今天在云栖大会上,刷到了,阿里云无影宣布Agent基础设施AgentBay迎来重大升级,并首次展示全新的个人计算产品——无影AgenticComputer。无影AgentBay拥...
探索AGI
0回复
1601浏览
AgentBay
Agent
AutoGLM2
国庆假期AI圈彻底打疯了,谷歌Gemini 3.0 Pro泄露,血战Claude 4.5!
精华
热门内容榜
• 最近上榜
国庆各种新闻满天飞,大佬们都不过节的。。。今天快速梳理了一下所有的新闻,给家人们补补课。Anthropic、OpenAI、Google假期前后,御三家,接连放出王炸。谁才是下一代最强模型?AnthropicClaudeSonnet4.5首先是Anthropic,扔出了ClaudeSonnet4.5,世界上最好的编码模型。在SWEbench上,Sonnet4.5拿下了77.2%的平均分,直接把其他所有模型甩在身后。在无人监督的情况下,连续工作30个小时来处理复杂的多步骤编程任务,内部代码...
探索AGI
0回复
2189浏览
谷歌
Gemini 3.0 Pro
Claude 4.5
代码已不再稀缺,开发者正在进入“工作流时代”
原创
在过去的几年里,围绕“哪款AI编程助手最好用”的争论几乎没有停过:有人偏爱GitHubCopilot,有人坚信ClaudeCode,还有人等着OpenAI下一代模型。但如果问到AndrejKarpathy(前特斯拉AI负责人、OpenAI核心成员),答案可能会让人意外:重点不在“哪一个最好”,而在于如何搭建一个属于自己的LLM工作流。在Karpathy的眼中,我们正处于“代码后稀缺时代”。代码已不是稀缺资源,而是一种随时可以生成、试错、甚至丢弃的“消耗品”...
Halo咯咯
0回复
1767浏览
LLM工作流
AI编程助手
Karpathy
Meta CWM:代码世界模型的技术突破
原创
MetaFAIR团队刚刚发布了CodeWorldModel(CWM),这是一个32B参数的开源大语言模型,标志着代码生成领域的一次根本性转变。想象一下传统的代码模型就像一个只会背诵菜谱的厨师,虽然能够准确复述每道菜的制作步骤,但并不真正理解食材如何变化、调料如何融合。而CWM的革命性突破在于它不仅知道代码怎么写,更重要的是理解代码运行时会发生什么。这就像培养了一个真正懂得烹饪原理的大厨,能够预测每个步骤后食物的状态变化。什么是...
鲁班模锤1
0回复
1700浏览
Meta CWM
代码
世界模型
n8n能取代DevOps吗?别急,先听听真实答案
原创
在当下的软件世界里,“自动化”几乎成了所有团队的共识。从Jenkins、GitHubActions到Kubernetes,一整套工具链已经塑造了DevOps的工作方式:持续集成、持续交付、自动化部署、基础设施即代码……这些名词听起来专业又复杂,但背后无非是一个目标——更快、更稳定、更高效地交付软件。与此同时,一个新兴名字频频出现:n8n。这是一款号称“无代码低代码自动化神器”的开源工具,凭借简单易上手的界面和强大的第三方集成能力,它...
Halo咯咯
0回复
778浏览
n8n
DevOps
开源工具
自动化工具
不止能切文本:多向量检索如何让RAG搞定复杂PDF
原创
热门内容榜
• 最近上榜
在日常工作里,我们经常会接触到各种文档:研究论文、财报、产品手册……它们往往不是“纯文本”,而是夹杂了段落、表格、标题、甚至图片。这类“半结构化数据”,对于传统的RAG(RetrievalAugmentedGeneration,检索增强生成)来说,是一个相当棘手的问题。为什么?想象一下,如果一个普通的文本切分工具把表格切开一半,或者直接把一张大表格当成纯文本去嵌入,结果就是语义检索时一团糊,模型很可能拿不到真正需要的上下文。...
Halo咯咯
0回复
3084浏览
多向量检索
RAG
PDF
RAG数据召回详细技术解决方案
原创
概述数据召回是RAG(检索增强生成)系统中的核心环节,负责从向量数据库中检索与用户查询最相关的知识片段。本流程通过多阶段处理确保召回结果的准确性、相关性和完整性,同时结合对话记忆管理来维持多轮对话的连贯性。核心处理模块详解查询优化模块功能描述:对原始用户查询进行语义增强和扩展,提升检索覆盖率。处理策略:查询改写:生成多个语义相同但表述不同的查询变体假设性回答:基于问题生成可能的回答,反向推导相关关...
AI探索时代
0回复
1111浏览
RAG
数据召回
PyG:GNN的扛把子
原创
在深度学习领域,传统的神经网络架构主要针对欧几里得数据(如图像、文本序列)进行设计。然而,现实世界中大量数据呈现出图结构特征——社交网络中的人际关系、分子结构中的原子连接、交通网络中的道路连通性等。这些非欧几里得数据无法直接使用传统卷积神经网络处理,由此催生了图神经网络(GraphNeuralNetworks,GNNs)。图神经网络通过学习图节点的局部信息来进行预测,在分类和回归问题上都展现出强大的能力。研究表明,图神经网络在...
鲁班模锤1
0回复
941浏览
PyG
GNN
神经网络架构
Claude Code 遭深度逆向工程! AI 编程智能体核心架构设计曝光
原创
大家好,我是玄姐。ClaudeCode是Anthropic公司的AI编程方面最拿出手的AI智能体产品。最近ClaudeCode被一个民间高手做了深度逆向工程,曝光了ClaudeCode的核心多层AI智能体技术架构、实现机制和运行逻辑等,为理解现代AI智能体系统的工程架构设计实现提供了宝贵的技术参考。下文从ClaudeCode整体架构设计、ClaudeCode十三大关键技术详细剖析之。一、ClaudeCode整体架构设计剖析1、ClaudeCode系统架构全景图ClaudeCode系统架构由...
玄姐聊AGI
0回复
1269浏览
Claude Code
AI编程
智能体
万字长文剖析企业级多智能体案例架构设计与代码级落地实践
原创
1.前言本文会从零构建一个企业级多智能体架构与代码级落地实践,不依赖LangChain或CrewAI这类高层级编排库。我们会把整套逻辑拆解为三个简单且符合逻辑的模块:一个Agent类:负责思考、行动,并维护自身的推理循环;一个Tool类:智能体可调用的工具,用于与外部世界交互;一个Crew类:整合多个智能体,协调它们的工作流程。通过这种方式,我们能完全掌控智能体的行为,更易优化和排查问题。文中将使用O...
玄姐聊AGI
0回复
919浏览
多智能体
案例架构设计
Agent
如何使用 Unsloth & Docker 训练大语言模型
社区头条
Unsloth出了个教程:如何使用Unsloth的Docker镜像来进行LLM微调或强化学习(RL)。本地训练常常因为依赖问题或环境破坏而变得复杂。Unsloth的Docker镜像可以绕过这些问题。无需任何环境配置:直接拉取镜像并运行,即可开始训练。Unsloth官方Docker镜像:unslothunsloth(https:hub.docker.comrunslothunsloth)为什么使用Unsloth&Docker?•Unsloth的Docker镜像稳定、更新频繁,并且适用于任何受支持的环境。•所有依赖都封...
sbf_2000
0回复
1470浏览
Unsloth
Docker
大语言模型
谷歌TUMIX:通过多Agent工具混合提升大模型推理能力
谷歌的论文(TUMIX:MultiAgentTestTimeScalingwithToolUseMixture)提出了工具使用混合(TUMIX),利用多样化的工具使用策略来改进推理能力。论文展示了如何通过并行运行一系列多样化的agent(纯文本、代码、搜索等)并让它们在几轮中共享笔记,从而从大语言模型中获得更好的推理能力。它不是暴力地增加更多样本,而是混合策略,在有信心时停止,最终既更准确又更便宜。图片混合不同的agent,而不仅仅是更多同一种agent:他们运行...
sbf_2000
0回复
1057浏览
TUMIX
agent工具
大模型
大模型推理的"慢思考":训练数据如何决定模型的思维深度
这里介绍的是论文(UnderstandingtheRoleofTrainingDatainTestTimeScaling)的内容:你是否好奇,为什么有时候让大模型"多想一会儿"能得到更好的答案,而有时候反而会越想越错OpenAI的o3和DeepSeekR1展示了惊人的推理能力,它们的秘密就在于测试时扩展(testtimescaling)——给模型更多时间去"思考"。但什么样的训练数据才能让这种"慢思考"真正有效图片什么是测试时扩展:传统的AI模型接收问题后会立即给出答案。而测试时扩展让模...
sbf_2000
0回复
773浏览
大模型
训练数据
模型
CoDA:多Agent协作完成数据可视化
下面介绍的是论文(CoDA:AgenticSystemsforCollaborativeDataVisualization)的内容:数据分析师的"隐形税":数据可视化在商业智能和数据科学中扮演着重要角色,能够帮助专业人士通过直观的图形从复杂数据集中发现洞察。但现实是,数据分析师可能要花费超过三分之二的时间在低级别的数据准备和可视化任务上,经常需要手动迭代以实现清晰度、准确性和美观。这种"隐形税"让分析师无法专注于洞察生成。图片随着LLM的兴起,自动化这一...
sbf_2000
0回复
768浏览
CoDA
agent协作
数据可视化
DeepCode:灵活的AI编程智能体
社区头条
译者陈峻审校重楼你是否想象过这样的场景:自己刚刚阅读了一篇介绍顶尖算法的精彩研究论文,但需要花费数周的时间在无聊编程开发上,才能将其实现。或者你可能已经想到了一个出色的Web应用,却苦于没有编写其所需的前端代码的技能。你一定想有一个平台来自动完成此类任务。DeepCode便是这样的平台。它并非日常编程的辅助工具,而是一个从零开始为你创建项目的开源AI平台。什么是DeepCode?由香港大学数据智能实验室构建的Deep...
51CTO内容精选
0回复
749浏览
DeepCode
AI
编程智能体
语言模型为何会产生幻觉?
社区头条
译者布加迪审校重楼简介幻觉是语言模型及其用户的祸根,指语言模型产生的看似合理但实际上错误的陈述。这些幻觉之所以存在问题,是由于它们会削弱用户信任、传播错误信息,并误导下游决策,即使输出的可信度很高。在用户无法轻松验证声明(技术答案、医学或法律摘要、数据分析)的情况下,这些幻觉尤其令人困扰,因为自信地传递错误信息会掩盖潜在的不确定性,从而将小小的建模错误变成潜在的重大失败。Kalai、Nachum、Vempala...
51CTO内容精选
0回复
649浏览
语言模型
幻觉
奖励
LLM
黄仁勋:美国并不领先中国多远!回应AMD送OpenAI股权:挺妙!英伟达所有合作不排他、会继续投资初创
原创
社区头条
编辑云昭“现在的token已经开始盈利了!”“所有合作都必须公平,不能排他,也不能封锁市场。”“我们投资OpenAI,但不会要求他们必须使用英伟达的技术——他们可以选择任何方案。”英伟达和OpenAI的投资合作刚刚过去两周,故事的剧情突然似乎变成了“亦敌亦友”的商战剧情。老黄和奥特曼,马不停蹄地宣布了各自接下来的trade。先是OpenAI三天前宣布与AMD达成数十亿美元的、非同寻常的合作。AMD同意在未来几年内向OpenAI授予大...
51CTO技术栈
0回复
1019浏览
OpenAI
黄仁勋
AI
蚂蚁开源万亿参数大模型Ling-1T:多项能力全球领先
原创
社区头条
热门内容榜
• 最近上榜
在国庆假期结束之际,开源领域迎来了全新万亿级语言模型——蚂蚁集团发布通用语言模型Ling1T,在多项复杂推理基准中取得突破。 今天凌晨,蚂蚁集团正式发布了其百灵大模型Ling2.0系列的首款旗舰模型——Ling1T。这个拥有万亿参数规模的通用语言模型,不仅是蚂蚁百灵团队迄今规模最大、能力最强的非思考大模型,更在多项国际权威测试中展现了卓越的性能。  根据官方发布的信息,Ling1T在有限输出Token条件下,于...
算家计算
0回复
2342浏览
Ling-1
蚂蚁集团
开源大模型
算家计算
算家云
暂无内容
1
9
10
11
12
13
14
15
16
17
客服