ermulong
LV.3
这个用户很懒,还没有个人简介
声望 322
关注 0
粉丝 0
私信
主帖 42
回帖
什么是Transformer?Transformer是一种新颖的神经网络架构,它在2017年由Google的研究人员提出,用于解决机器翻译等自然语言处理的任务。Transformer的特点是,它完全摒弃了传统的循环神经网络(RNN)和卷积神经网络(CNN),而是采用了一种称为自注意力机制(SelfAttention)的方法,来捕捉文本中的长距离依赖关系,提高了模型的效率和准确性。今天本文将围绕自注意力机制,介绍Transformer的三个主要概念,位置编码、注意力机...
2天前 85浏览 0点赞 0回复 0收藏
随着AI应用工程的飞速发展,我们不难发现为大语言模型(LLMs)提供额外工具能大大增强其功能。举例来说,GPT3.5版本通过集成Bing搜索和Python解释器实现了能力的跃迁。GPTs则直接将api调用作为工具进行了集成,LLM会决定是直接作出回应,还是先调用它提供的工具。这些工具不仅限于获取额外信息,它们还能发挥其他功能,比如帮用户订餐。尽管OpenAI已经用它的专门模型让我们享受了工具使用的便捷,大多数其他LLM在函数调用和工具...
4天前 86浏览 0点赞 0回复 0收藏
图检索增强生成(GraphRAG)正逐渐流行起来,成为传统向量搜索方法的有力补充。这种方法利用图数据库的结构化特性,将数据以节点和关系的形式组织起来,从而增强检索信息的深度和上下文关联性。示例知识图谱图在表示和存储多样化且相互关联的信息方面具有天然优势,能够轻松捕捉不同数据类型间的复杂关系和属性。而向量数据库在处理这类结构化信息时则显得力不从心,它们更擅长通过高维向量处理非结构化数据。在RAG应用中,结合...
9天前 191浏览 0点赞 0回复 0收藏
在AI的发展中,大规模语言模型已经取得了令人瞩目的成果,然而,随之而来的是模型质量和不确定性的问题。如何衡量和改进模型的质量,一直是我们面临的一个挑战。为了解决这些问题,我们将在这篇文章中,介绍LangChain框架和TruLens工具,它们将帮助我们评估模型的质量,提高模型质量,并能够用量化的方法对抗不确定。什么是TruLensTruLens是面向神经网络应用的质量评估工具,它可以帮助你使用反馈函数来客观地评估你的基于LLM(...
2024-10-16 15:56:13 219浏览 0点赞 0回复 0收藏
你是否想过,有一天,你可以只给一个主题,让AI自动搜集资料并写出一本电子书?你是否想过,有一天,你可以不用动笔,就能成为畅销书作者?你是否想过,有一天,你可以利用AI的智慧和创造力,轻松赚取被动收入?如果你的答案是肯定的,那么恭喜你,你的梦想已经成为现实!今天,我要向你介绍一种最新的玩法,它可以让你利用3个ChatGPT插件,实现AI自动写书的神奇功能。这种玩法不仅简单易用,而且效果惊人,你只需要花费很少的...
2024-10-12 14:36:13 248浏览 0点赞 0回复 0收藏
什么是LangChain?LangChain是一个用于开发基于语言模型的应用程序的框架。我们相信,最强大和最有差异化的应用程序不仅会通过API调用语言模型,而且还会:数据感知:将语言模型连接到其他数据源自主:允许语言模型与其环境交互因此,LangChain框架的设计目标是使这些类型的应用程序成为可能。LangChain框架提供了两个主要的价值主张:组件:LangChain提供了与语言模型工作所需的组件的模块化抽象。LangChain还有这些抽象的实现...
2024-09-29 15:46:51 273浏览 0点赞 0回复 0收藏
上次​​《科普神文,一次性讲透AI大模型的核心概念》​​一文中,我基于结合大量示例及可视化的图形手段给大家科普了AI大模型的相关算法和核心概念。但是收到不少非技术背景的小伙伴反馈,相关的算法内容的解释技术性还是太强,很难完全理解。所以这次,题主从最基础的概念“token”着手,跳过了复杂的算法逻辑,这次一定让你建立起对AI大模型工作原理的清晰认知。什么是token?最小的语义单元你可能会好奇,大规模语言模型是...
2024-09-25 12:41:17 523浏览 0点赞 0回复 0收藏
AI最大的想象力不在手机屏幕,而是接管数字世界,改变物理世界AI技术的发展速度已经超越了历史上的任何时期,但目前我们仍处于AGI(人工通用智能)变革的早期阶段。吴泳铭在演讲中提到,AI的真正潜力不在于创造几个新的超级应用,而在于其能够渗透并接管数字世界,最终改变物理世界。AI技术的发展现状技术迭代速度:AI技术,尤其是大模型技术,正在快速迭代,其可用性大幅提升。大模型已经具备了文本、语音、视觉的多模态能力,...
2024-09-23 10:10:22 381浏览 0点赞 0回复 0收藏
引言随着科技公司及国际竞争的不断推进,AI大模型已经越来越多融入我们的生活。作为一个普通人或许不需要研究高深的AI算法,但想在这次AI浪潮中不被抛弃,必须对LLM原理有一个基本的理解。理解LLM(即LargeLanguageModel,大语言模型)如何生成文本也就意味着理解这些模型为什么是如此通用的认知引擎——以及它们还能帮助创造什么。令牌化和向量化(Token&Vectorization)首先,让我们从令牌化和向量化开始,这一部分内容将为大...
2024-09-11 11:24:58 590浏览 0点赞 0回复 0收藏
你好呀,我是小智!相信大家最近一定都被《黑神话:悟空》刷屏了吧。小智作为一个手残党,也被大头虐的死去活来。游戏已经被讲得很多了,所以我们聊点别的。此次我们聚焦在一个特别的故事上——全盲女玩家诺子喵呜挑战《黑神话:悟空》。她依靠实时弹幕指导和听声辨位的方式,成功击败了游戏中的第一个Boss。这一事件不仅引发了社会广泛关注,也提出了一个新的问题:在AI技术日新月异的今天,我们能否利用AI为视障玩家提供更好的...
2024-09-06 14:58:23 494浏览 0点赞 0回复 0收藏
大多数人以为写清楚指令是再简单不过的事情,但其实绝大部分人都无法正确描述自己的想法和意图。这对于使用OpenAI的GPT4这样的强大的语言模型来说,是一个很大的障碍。GPT4是一个可以接受文本和图像输入,输出文本的多模态模型,它可以解决很多困难的问题,比我们之前的任何模型都更准确,这得益于它更广泛的常识和先进的推理能力¹。如果你想让GPT4帮你完成一些创造性或技术性的写作任务,比如写歌、写剧本、或者学习你的写作...
2024-09-04 11:51:19 304浏览 0点赞 0回复 0收藏
正如飞行员、医生、卡车司机和运动员通过在低风险环境中练习技能而提升表现,学生在被赋予探索、犯错并调整策略的机会时,也能更有效地学习。角色扮演情境,即学生扮演特定角色并尝试解决商业问题,提供了丰富的实践机会。这样的情境为学生提供了一个无风险的环境,让他们能够测试自己的知识和练习做出关键决策。然而,市面上现有的角色扮演材料,无论是线上还是纸质的,可能与我们课程的具体学习目标不完全一致,也无法适应不...
2024-08-26 00:44:13 415浏览 0点赞 0回复 0收藏
小试牛刀,很懂《三体》恋爱脑云天明!在谈论AI的代码解析能力之前,我们不妨先看一下它在处理自然语言文本方面的表现。为了测试GLM4Long的理解力,我决定让它尝试阅读并理解我最爱的科幻小说94万字的《三体》。抽取概括能力作为一个具有强大理解能力的模型,必须具备从复杂的文本中抽取出关键的信息,并进行总结。当一次性输入整本小说,模型能有怎样的表现呢?我决定以《三体》中的恋爱脑云天明为例,我们可以让模型梳理出云...
2024-08-21 10:55:41 350浏览 0点赞 0回复 0收藏
正如飞行员、医生、卡车司机和运动员通过在低风险环境中练习技能而提升表现,学生在被赋予探索、犯错并调整策略的机会时,也能更有效地学习。角色扮演情境,即学生扮演特定角色并尝试解决商业问题,提供了丰富的实践机会。这样的情境为学生提供了一个无风险的环境,让他们能够测试自己的知识和练习做出关键决策。然而,市面上现有的角色扮演材料,无论是线上还是纸质的,可能与我们课程的具体学习目标不完全一致,也无法适应不...
2024-08-19 09:18:30 448浏览 0点赞 0回复 0收藏
了解小智的粉丝相信对ZhipuAI都不陌生,在往期LangChain教程里,小智已经通过GLM4的超强能力搭建了众多的Agent智能体应用。最近AI又悄摸上线了GLM4AlltoolsAPI能力,今天我就带大家来盘一盘!GLM4更新了什么?老规矩,先放大纲,带大家看看GLM4AlltoolsAPI更新了哪些功能。如图所示,以下就是Alltools所有新增的能力。我将其分为了四块,一站式检索,一站式智能编程,企业私域增强,多模态四个部分。想要用上这些新的功能也十分...
2024-08-13 01:03:42 480浏览 0点赞 0回复 0收藏
在之前的博客文章中,我们探讨了基于聊天的代理用户体验,其中用户需要主动思考如何与AI进行交流。但如果AI能在后台默默为您工作,那会怎样呢?我认为,为了让代理系统真正发挥潜力,我们需要转变观念,让AI在后台默默工作。当任务在后台处理时,用户通常更能接受较长的完成时间,因为他们对即时响应的期望降低了。这样,代理就能更自由地进行工作,往往比在聊天界面中更加细致和认真。此外,让代理在后台运行,也使我们能够更...
2024-08-07 15:28:23 345浏览 0点赞 0回复 0收藏
合成数据技术并不是创造全新的信息,而是通过转换现有信息来生成不同的变体。在过去的十多年里,合成数据技术已被广泛应用于提升各类模型的精确度——无论是通过变换图像来优化物体检测模型,还是加强信用卡欺诈检测,亦或是提升BERT模型在自动问答方面的表现。随着大型语言模型(LLMs)的出现,生成合成数据的动力和技术都得到了极大的加强。各行各业的企业正在利用合成数据来微调基础LLMs,以满足各种应用场景的需求,比如:金...
2024-08-06 10:27:03 514浏览 0点赞 0回复 0收藏
构建少量样本提示的方法多种多样,但目前还没有统一的最佳实践。我们进行了一些实验,以探究不同技巧对模型和任务性能的影响,这些实验结果表明,通过少量样本提示,我们可以显著提高模型的准确度,特别是在处理复杂任务时。接下来,我将分享我们是如何做到这一点的,以及实验的结果。编辑注:本文经翻译并二次整理自Fewshotpromptingtoimprovetoolcallingperformances一文。实验过程我们基于两个数据集进行了实验。第一个数据...
2024-07-31 00:36:42 453浏览 0点赞 0回复 0收藏
如果你询问任何正在使用大型语言模型(LLM)构建智能代理的开发者,他们很可能会告诉你,智能代理在规划和推理方面的不足是影响其可靠性的一个主要问题。智能代理的规划究竟是什么?目前人们是如何克服这一缺陷的?我们对智能代理未来规划和推理的发展趋势有何预测?接下来的文章将一一解答这些问题。编辑注:本文经翻译并二次整理自planningforagents一文。规划和推理的真正含义是什么?智能代理的规划和推理,指的是它如何思...
2024-07-26 11:45:50 464浏览 0点赞 0回复 0收藏
受限于网络以及产品内测未开放的原因,国内的很多朋友可能对AI大模型早就耳熟能详,但至今却仍没能有机会上手使用一番。但是好消息来了,在接近半年的酝酿后,国内第一批通过审核的AI大模型正式上线,今天我将给大家简要介绍下这八个模型,并在文末附上这八个模型的体验地址(都是国内注册即可使用的哦,快来玩耍起来吧)。首批上线的AI大模型来自八家不同的公司:百度(文心一言)抖音(云雀大模型)智谱AI(GLM大模型)中科院...
2024-07-22 09:12:28 650浏览 0点赞 0回复 0收藏
获得成就
已积累 6633 人气
获得 0 个点赞
获得 0 次收藏