九歌AI大模型
LV.3
专注大模型与智能体应用开发,探索AI技术前沿与实践
声望 298
关注 0
粉丝 0
私信
主帖 29
回帖
当今世界,大模型哪家强?我认为现在是群雄逐鹿的时候,虽然在编程等一些垂直领域,Claude4稳坐第一把交椅,但是最后的赢家,未必就是它。作为AI用户,当然要积极享受当前的AI红利,不要将自己局限在某个平台,尽量的多去了解每个大模型的脾气和秉性,为后面创建智能体或者打造自己的AI数字员工,选择合适的大脑引擎。我目前创意和文案的主力模型是Gemini2.5Pro和腾讯元宝的DeepSeekR1,编程主力是Trae国际版的Claude4。为了能够...
2天前 782浏览 0点赞 0回复 0收藏
今年的新词特别多,AI编程这个叫法都out了,时髦的说法是vibecoding(氛围编程)。最近上手体验了googleaistudio新上线的buildapp功能,不能说十分惊艳,那是相当得惊艳,真正我能想象出的所想所见即所得的编程方式,特别是对我这种靠嘴吃饭,需要设计产品原型的非程序开发人员来说。GoogleAIStudio(​​https:aistudio.google.com​​)是谷歌推出的云端AI开发平台,集成了最新的生成式AI模型(如Gemini系列),提供从原型设计...
2025-08-01 06:55:04 4848浏览 0点赞 0回复 0收藏
大家好,我是九歌。最近字节跳动开源了一款创新多模态文档图像解析模型——Dolphin,基于先解析结构后解析内容的两阶段方法,参数只有322M,16G显存就能流畅运行,而且效果比不输GPT4.1!目前支持Pdf和图片直接解析成Markdown和Json格式。官网直接给出了Demo在线地址,真的太良心了!直接上手体验!http:115.190.42.15:8888dolphin(1)15秒识别表格图片(2)30秒识别公式是不是很酷的感觉,我看了一下github项目文档,安装也非...
2025-08-01 06:51:37 1970浏览 0点赞 0回复 0收藏
大家好,我是九歌,一个智能体科普和实践者。做智能体最难的事情,并不是如何怎么学会做智能体,工具的学习往往是简单的,如何找到智能体真正有用的应用场景和业务需求才是核心能力。我们目前在各大智能体开发平台上的智能体,说实话,更多是玩具的属性。在AI大模型领域,企业端正在探索的方向主要有:1.企业的知识管理与数据治理老生常谈的方向2.垂域模型打造利用企业私有的数据、知识、通用大模型,训练极速的垂域模型3.智能...
2025-05-30 06:42:59 2344浏览 0点赞 0回复 0收藏
大家好,我是九歌。最近刷到最多的AI相关文章,就是一路好评的DeepWiki了!手痒难耐的我,也早早就上手体验了一下。整体体验下来,确实不错,对于想了解一个Github项目的新人来说,确实非常有帮助。但是有一说一,DeepWiki的缺点也是很明显的,一是只能局限于Github项目,对于个人私有代码仓库却爱莫能助!二是时间具有滞后性,项目代码不是最新的!如果公司有传承已久的代码库,新入职的同事看到那山一样高的代码,内心肯定是...
2025-05-30 06:42:20 2894浏览 0点赞 0回复 0收藏
大家好,我是九歌。今天我们聊一聊使用大模型进行数据分析。AI数据分析作为大模型应用的刚需,在各大平台上的表现却大相径庭。阿里百炼的析言、ChatGPT、商汤的小浣熊、豆包,用了一圈,发现能打的只有豆包。但是豆包只提供大模型接口,AI数据分析却没有对应的接口。首先定义一下“AI数据分析”,本文所说的AI数据分析,专指大模型对数据表格的处理能力,默认数据超过2000行!2000行的表格直接喂给大模型让其分析,可想而知,这...
2025-05-30 06:41:32 2318浏览 0点赞 0回复 0收藏
在前几天的文章​​《论MCPServer与工作流在智能体开发场景中的作用和区别》​​,我提到了一个观点,MCP和工作流的关系将是你中有我,我中有你。Dify工作流可以将MCPServer作为工作流中的某个关键节点;同样,Dify工作流可以发布为McpSever,由大模型选择和使用。同样,对于各大智能体开发平台来说,不管是生态庞大的Coze还是开源界的扛把子Dify,在将来也是这种互联互通的状态,只要他们各家的API足够开放就行。比如,因为Coze...
2025-04-25 06:46:24 4487浏览 0点赞 0回复 0收藏
今天讨论的是个很无聊的话题意义,但是却困扰我很长时间。最近突然顿悟了,有种开窍的感觉,下面我把最近关于智能体开发中工作流、Mcpserver的一些思考分享给大家,希望得到大家的指正。阅读本文前,默认大家已经对智能体开发、Mcp工作流、Dify有了一定的认识,如果还没了解过,可以看我以前的文章。​​智能体(Agent)的3种表现类型:聊天助手、工作流与对话流​​​​不再混淆了!一文揭秘MCPServer、FunctionCall与Agent的...
2025-04-25 06:45:25 2148浏览 0点赞 0回复 0收藏
我集中精力,花2个多小时把DifySandbox官方源码研究了一下,终于理清了Sandbox执行代码的逻辑,顺便实现了在不修改官方difysandboxdocker镜像,用户上传文件后路径的获取和对Excel文件的数据处理。话不多说,先看效果。一个有9406条数据的Excel文件瞬间完成了数据处理工作。下面我来说一下,这个如何实现。Dify安装成功后,会有10个Docker容器,其中dockersandbox的作用是用来执行工作流中”代码“这个节点运行的代码。这样就保...
2025-04-16 07:12:40 4488浏览 0点赞 0回复 0收藏
智能体主要由大语言模型(LLM)+提示词(Prompt)+知识库(RAG)+工作流(WorkFlow)+工具(Tools)等若干元素组成。今天我们开启《人人都会做智能体》公开课第2节:智能体(Agent)的3种表现类型——聊天助手类型、工作流类型、对话流类型。「本文配图主要来源于我的长篇图文写作助手」​​让DeepSeek聊天记录秒变长篇图文和PPT的智能体,Claude3.7手把手喂饭教程!​​与智能体的组成不同,所谓的智能体表现模式,就是智能体...
2025-04-02 07:50:35 3084浏览 0点赞 0回复 0收藏
文章生成的工作流由简单的大模型直接生成文章改为按章节段落迭代生成,并在段落生成时由Claude3.7大模型根据段落内容,直接总结凝练后,绘制成一张张网页版的PPT配图,最后再拼成一个完整的网页。这个工作流还是蛮大的,消耗的token数量也是肉疼,好在结果让人欣慰,我们先来看一下智能体的实现效果。怎么样?效果还是蛮不错吧,这个智能体能很大程度上解决我们做PPT的一些难点,因为市面上一些做AIPPT的工具,都是直接套的模板...
2025-04-02 07:49:17 2310浏览 0点赞 0回复 0收藏
我们都知道智能体开发的平台非常多,Dify是开源的智能体开发平台中用户比较多的一款。但是跟Coze平台相比,很多想使用Dify的用户,第一个难关就是Dify的本地部署。很多小白可能对Linux、Docker一窍不通,所以我之前写过一篇怎么借助WSL完成windows下Dify的部署,其实没有解决痛点,Dify的主要用户还是只局限于程序员这个群体。​为了能够更好的完成智能体的科普,让更多人无门槛使用Dify这种开源的智能体开发平台,经过这两天的...
2025-04-01 13:14:10 2457浏览 0点赞 0回复 0收藏
前几天《人人都会做智能体》社区的成员提问,OA请假可以用智能体实现吗?我第一反应是这种问题有点太简单了,但是转念一想,越是这种简单的任务,反而更有科普价值,因为很多人还没深入了解过智能体(Agent)到底是什么,我不能先入为主的将其定义为没有必要的简单。想了解智能体是什么,可以先看我之前的这篇文章。【人人都会做智能体】Agent是什么,简单中等复杂商用的智能体又是什么所以今天我们一起来实现一个基于对话流的请...
2025-03-21 10:03:46 3965浏览 0点赞 0回复 0收藏
今天我将开启《人人都会做智能体》公开课的第1节课。《人人都会做智能体》公开课以智能体的小白科普和初级制作为目标,将从智能体基础认知(LLM+RAG+WorkFlow+Agent)、智能体拆解复原、开发环境部署、智能体项目实战等几个部分,按照学习习惯,迭代式递进式的,采用图文结合的方式,循序渐进带领大家一步步掌握智能体制作的方法、技巧和经验。智能体项目实战部分,现在初步定了两个,我之前的文章已经开始写了。一个是长篇图文...
2025-03-21 09:58:24 2442浏览 0点赞 0回复 0收藏
想象一下,如果普通AI是一个只会机械执行指令的机器人,那么采用ReAct策略的智能体就像是一个会先思考后行动的侦探。在解决问题时,它不会匆忙跳入结论的深渊,而是沿着"观察思考行动观察"的螺旋阶梯,一步步接近真相。这就是ReAct(Reasoning+Acting)策略的魅力所在。ReAct策略:智能体的"内心独白"与"外在行动"ReAct就像给AI装上了"内心独白"和"行动执行器"两个齿轮,让它们交替转动:观察环境:智能体睁大眼睛,感知周围世...
2025-03-14 13:10:12 2879浏览 0点赞 0回复 0收藏
一、技术背景与设计目标当前内容生成系统普遍面临三个技术挑战:多源异构数据处理效率低下、长文本生成的结构连贯性不足、多模态内容协同生成能力薄弱。本研究提出一种基于LangGraph框架的解决方案,旨在构建模块化、可扩展的智能文章生成系统,其核心设计目标包括:实现端到端的自动化内容生产流水线支持动态工作流调整与错误恢复机制确保多模态内容的一致性验证提供可插拔的第三方服务集成接口二、系统架构设计2.1整体架构概...
2025-03-14 13:04:01 3153浏览 0点赞 0回复 0收藏
一、大模型知识库战略架构(耗时:初始8小时月度迭代)1.知识价值密度评估四维筛选模型(Ec业务关键度,Fa调用频率,Fh历史价值,Ct维护成本)知识类型处理策略工具链配置高频核心知识向量化+微调GPT4Turbo+PGVector中频场景知识RAG增强检索LlamaIndex+Pinecone低频长尾知识压缩存储ZSTD+MinIO知识热力分析fromlangchain.analyticsimportKnowledgeHeatmapheatmapKnowledgeHeatmap(querylogsloadlogs("searchlogs.json"),docmeta...
2025-03-14 13:00:54 4080浏览 0点赞 0回复 0收藏
你有没有想过,为什么当红炸子鸡DeepSeek这样的大语言模型能够又快又好地回答各种问题,而且成本又那么低?秘密之一就在于它使用的"混合专家"(MixtureofExperts,简称MoE)架构。本文将用通俗易懂的语言,解释MoE是什么,它如何工作,以及为什么它如此重要。MoE是什么?想象一下一所大学:传统模型就像一位超级教授,必须精通所有学科,从文学到物理,从历史到计算机科学。每个问题都由这位教授独自解答。MoE模型则像一所设有...
2025-03-13 12:48:33 4055浏览 0点赞 0回复 0收藏
引言:LangChain的背景与意义在人工智能快速发展的时代,大型语言模型(LLM)如OpenAI的GPT系列,已成为生成自然语言文本的核心技术。然而,将这些模型应用于实际应用(如聊天机器人或虚拟助手)时,开发者常常面临提示管理、外部数据集成和上下文保持的挑战。LangChain作为一个开源框架,旨在简化这些复杂性,提供模块化工具,帮助开发者高效构建LLM驱动的应用。LangChain于2022年10月由HarrisonChase在RobustIntelligence启动...
2025-03-13 12:43:13 4262浏览 0点赞 0回复 0收藏
一、环境准备1.1安装框架全功能安装(RAG代码解释器GUI支持)pipinstallU"qwenagent[rag,codeinterpreter,pythonexecutor,gui]"简约安装版本pipinstallUqwenagent1.2模型服务配置方法1:官方服务exportDASHSCOPEAPIKEY'yourapikey'方法2:本地部署(vLLM示例)fromvllmimportLLM,SamplingParamsllmLLM(model"Qwen27BChat")二、核心功能开发2.1工具定义与使用fromqwenagent.tools.baseimportBaseTool,registertoolimportjson5reg...
2025-03-13 12:39:52 6253浏览 0点赞 0回复 0收藏
获得成就
已积累 2.5w 人气
获得 0 个点赞
获得 0 次收藏