公众号矩阵

移动端

视频课免费课排行榜短视频直播课软考学堂

全部课程软考信创认证华为认证厂商认证 IT技术 PMP项目管理免费题库

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

AI.x社区

登录/注册
51CTO

中国优质的IT技术网站

51CTO博客

专业IT技术创作平台

51CTO学堂

IT职业在线教育平台

熵减AI

LV.2

科技类博客

帖子 14

声望 112

关注 0

粉丝 0

私信

关注

主帖 14

回帖

Anthropic最新研究Persona vector人格向量

今天本来就想更一期强化学习，但是突然看了Anthropic的personavector，所以又来写这一篇，因为我觉得这个很有价值。以往我们玩LLM比较怕的事就是他乱说话作为概率模型，它能说对，它也能乱编，乱编轻症就是所谓的幻觉，乱编的重症就严重了，比如输出一些有毒的内容，涉黄涉恐内容，虽然上线前都做过毒性测试，但是事实证明，几乎任何模型都在一定条件下可以被jailbreak。还有一个就是可解释性。神经网络尤其LLM一直被诟病就是不...

2025-08-11 06:51:42 1009浏览 0点赞 0回复 0收藏

用Dynamic chunk去干掉tokenizer？

图片一般你们下AR模型的时候，都有这个，也就是tokenzier，tokenizer是干啥的，其实就是你的分词字典不光有specal的token对应的还有实际的对应的分词对应的代码，比如：图片也有tokenzier没显示的，比如，为什么呢？因为它不是文本模型，人家输入是声音，因为它是ASR扯远了，回归主题tokenizer之所以总是个独立的model，因为它和transformer不是一个网络，它也不参与transformer训练时候的反向传播（和embedding层两回事，embed...

2025-07-28 00:36:21 859浏览 0点赞 0回复 0收藏

蒸馏出个MCP工具箱

图片清华，交大，普林斯顿和德州奥斯丁，港大等一堆学生联合完成的一篇论文（全华班）文章虽然被冠以Distill，但是严格说和我们理解的Distill没啥关系，最早的Distill要求有训练任务和损失的交互，后来Deepseek把抽COT数据来FT也叫Distill直到这个文章，连LLM的参数都被冻结了，也算是老词新用吧！AgentDistill实现知识蒸馏的机制与传统的大语言模型（LLM）蒸馏方法不同。它通过以下关键方式实现知识转移：训练无关的代理蒸馏：...

2025-07-07 06:58:39 895浏览 0点赞 0回复 0收藏

为什么用Qwen3 embedding和rerank

排名是真的挺好，开源闭源现在都是第一了，这个事embeddiing的，rerank应该也是第一，甚至4B的基本也除了8B以外就是它第一。它和普通的比如原来的我们常用的BGE之类的有啥区别？传统的embedding都是基于bert来弄模型，一般也就encoderonly，bert原来也就是干分类器的，给一句话到它，它给你进行embedding了，这里考虑到有些同学可以不理解整套流程，我就稍微说细点一般来讲用3层法就很好理解：第一层：词元嵌入（TokenEmbedding...

2025-06-23 06:46:29 1795浏览 0点赞 0回复 0收藏

Llama4我的理解

我觉得LLaMA4最值得看的技术就是iRoPE，他们自己没出说说明，所以我试着解读了一下：简单来说，iRoPE技术是对标准RoPE位置编码方式的升级，主要解决了在处理超长文本时出现的问题。交错式应用(InterleavedApplication):标准RoPE在模型的每一层Q和K都用旋转操作来编码PI页就是位置编码。iRoPE的做法是“交替进行”——有些层用带RoPE的注意力机制，有些层不用（或者用其他方法）。这样做的目的是为了防止在处理很长的文本时，位...

2025-06-10 06:42:53 1186浏览 0点赞 0回复 0收藏

如何设计Agent的记忆系统

最近看了一张画Agent记忆分类的图我觉得分类分的还可以，但是太浅了，于是就着它的逻辑，仔细得写了一下在不同的记忆层，该如何设计和选型先从流程，作用，实力和持续时间的这4个维度来解释一下这几种记忆：1.短期记忆（ShortTermMemory,STM）流程：Input（输入）→Encode（编码）→Store（存储）→Erase（清除）作用：在进行活动时保持临时细节，类似于我们在对话中临时记住的信息。示例：保存最近的交互信息，比如刚刚发送的...

2025-05-27 07:11:12 1563浏览 0点赞 0回复 0收藏

你理解的控制LLM幻觉的方法可能是错的

那什么是粗暴的控制LLM的幻觉的方法呢？正常你们大家学到的应该是temperature0topk1topp0.1类似这种的但是这种是不是能解决幻觉呢？很显然在做的各位试过，应该是没什么效果的。为什么呢正常来讲，我们不是把生成nexttoken的概率放到最大的那个token上了吗？今天先回忆个概念LLM是靠什么来决定nexttoken生成的，就是Logit，就是softmax你的前向计算的最后一层（这么表达不精确，但是你可以认为就算最后一层了）过了output之后呢...

2025-05-14 00:30:26 1357浏览 0点赞 0回复 0收藏

多模态MLLM都是怎么实现的—如何保持text2video的连续一致性

如果你玩过开源的Text2video，也就是文生视频，也会感慨AI越来越能整活儿了，但是如果你好奇去各大平台看一圈，基本上视频最大就是在810秒左右，甚至有35秒的。（sora能到20秒）当然有兄弟说是算力的问题，这个确实是一个问题，生成视频diffusion的算力确实要比纯text多，但是这个如果有钱也不是问题（后文我们发现其实就算有钱也是问题），但是现在我们谈论的是钱解决不了的问题，一致性。这个一致性指的是多帧一致性比如这个...

2025-04-28 00:07:45 2190浏览 0点赞 0回复 0收藏

解读DeepseekV3

我见过的最省的GPT4o，Claude，Gemini2级别的模型，而且是国内唯一有机会上桌的，其实海外目前和这三家有资格掰手腕的也只有它自己，可以负责任的说其他的模型不配上桌吃菜（Gemini上个月都没资格）。其实性能好就不说了，DeepseekR1就还不错，国内讲道理是第一家做inferencetimingscalinglaw的模型，阿里是第二家，其他的就不太值得谈论了，其实国外也只有GPT和Google有资格，没想到年底还能出个DeepseekV3，在传统scalinglaw...

2025-04-16 07:55:06 2591浏览 0点赞 0回复 0收藏

除了Rag和Train有没有其他方式给模型注入知识？

论文名称KBLAM:KNOWLEDGEBASEAUGMENTEDLANGUAGEMODELICLR2025的论文，MS系的这篇论文介绍了一种名为KBLAM（KnowledgeBaseaugmentedLanguageModel，知识库增强语言模型）的新方法，用于将外部知识库（KB）高效地集成到预训练的大型语言模型（LLM）中，以提升其在特定任务中的表现，同时避免传统方法的局限性。核心问题与背景LLM虽然在知识和推理方面表现优异，但当需要处理超出其参数存储知识的外部信息时，往往需要额外的增强手...

2025-04-03 07:30:02 2584浏览 0点赞 0回复 0收藏

手把手带你理解OpenManus

我之前演示过几个OpenManus的demo，其实也就是demo，包括manus，现在也就是demo阶段，复杂的plan和flow，现在的代码支撑和LLM的能力都有待改善，但是我们这期不是吐槽文章，是来把OpenManus给打开看看它的实现是怎么样的，其实Manus也都差不多，甚至OWL也都差不多，我们看一个就够了。其他的几个目录也没啥特别需要看的，就看app。app里面有这么几个结构：1agent没啥好解释的2flow就是来做multiagent的planning和管理任务框架的...

2025-03-25 00:31:21 3005浏览 0点赞 0回复 0收藏

如何正确看待GPT4.5

总结，模型门户留给GPT5去做了，4.5还是像Altman之前说的就是最后一代纯预训练。1一个超巨大的模型，grok3级别（10万卡），AK说每个0.5要提升10倍预训练算力，那对比GPT4的1.8T,也就说4.5是一个18T(18000B)级别的模型，所以必须跨多campus,异步梯度下降的训练方式(要求太高，这个目前只有grok,oai,gemini,3家真正严格实践过，anthropic都不行)。2拥有更多的知识(o3和人类比如博士生做题的合成数据)，比4o能力提升百分之50（其实...

2025-03-12 00:22:42 2605浏览 0点赞 0回复 0收藏

你为什么要用GraphGAG？

其实我这个问题不算瞎问。在你的项目里，你是真觉得GraphRAG有用，还是就图个新鲜劲，这个是非常重要的思考。RAG能干啥，其实不用复杂的解释了。传统的方式就是基于向量余弦近似度的查找，当然BM25其实也是传统RAG（别把它当新东西），常见一点的基本都有向量查找，或者向量+BM25关键字集成查找，为了方便我就画向量的了。如下图：通用LLM里不太存在专用领域的知识，RAG可以作为外挂知识库的补充，补充新的知识，另外有些问题，...

2025-02-27 13:11:25 2698浏览 0点赞 0回复 0收藏

纯研究O1的论文都发出来了，让我想起来研究红楼梦的红学

有点意思的论文2410.13639ACOMPARATIVESTUDYONREASONINGPATTERNSOFOPENAI’SO1MODEL简而言之就是曼彻斯特大学，浙大和中科大还有一些开源的项目组一些一起研究OpenAIO1的人，来发O1为什么牛B的论文。正常，研究红楼梦毕竟也有红学（我是一集红楼梦也没看过，书和电视都没看过)。。。文章主要讲分析猜测和评估OpenAI的推理模式在不同任务上的效果。同时也利用不同的模型比如GPT4o，Gemma，LLama,Qwen等尝试利用分析出来的O1的推...

2025-02-19 09:11:43 2462浏览 0点赞 0回复 0收藏

获得成就

已积累 5960 人气

获得 0 个点赞

获得 0 次收藏