
大模型应用从做出来,到怎么把应用做好 原创
“ 大模型的应用开发,是一门实践性很强的东西,理论很简单,做好很困难。”
关于大模型的应用已经写过很多文章了,在刚开始对大模型应用理解不深入的情况下,那时总以为大模型的应用很简单,只需要把东西丢给大模型,然后让大模型给出一个输出结果即可。
但等到随着对大模型应用理解的加深,才发现事情远远没有那么简单;用大模型做一个demo和用大模型做一个企业级应用,那差距不是一般的大;做出来和做好完全是两个概念。
怎么做好一个大模型应用?
做好一个大模型应用需要解决哪些问题?
以目前作者主要从事的应用方向,RAG和智能体为例,怎么做好一个RAG系统,又怎么做好一个智能体?
RAG技术从理论上来说特别简单,一句话总结就是:通过相似度召回的方式,把需要的文档内容丢给大模型,然后让大模型根据文档内容进行输出。
但这里就有一个问题?
怎么快速和准确的召回数据,面对复杂的文档格式,复杂的文档内容,怎么处理数据才能保证快速召回与问题相关的问题,以及召回数据的准确性问题;毕竟如果召回的数据有问题,那还不如不要召回为好。
因此,对召回数据的评判标准有两个,一个是召回的广度,另一个是召回的精准度;但在具体的实践过程中,这两个标准往往又是相悖的。
而随着数据量的增多,要想达到这两个标准会变得越来越困难,也就是说随着数据的量变,会导致其产生质变;而且这还会带来新的问题——速度,毕竟对产品来说,响应时间太长是不可接受的。
其次,再说到更复杂的智能体系统;智能体的核心是让大模型来取代人类的决策过程,让大模型去主导一个系统的整个生命周期;这个首先需要大模型具备一定的逻辑推理和分析能力,当然这个可以根据不同的任务选择不同的模型。
智能体看着做起来很复杂,实际操作起来确实也很复杂;但其核心其实就两点——模型的推理能力和工具调用的能力。只要模型拥有强大的问题分析和逻辑推理能力,再给它配备大量的工具,那么理论上来说这个智能体将无所不能。
但,做智能体的难点在哪里?
首先,怎么激发智能体的逻辑思维能力,以及其自身的纠错能力;我们首先要明白一件事情,一个大模型在被训练完成之后,除了重新训练或微调,否则这个模型的能力范围就已经定型了,因此我们需要做的是激发这个模型的潜力。
这玩意就像一个人,他上完大学之后懂的很多东西,但这些东西他不一定能做的好,而这就需要在大量的实践中去学习解决问题的方法。
因此,目前关于智能体的应用业内就提出了一个方法论——ReAct模式;也就是一个会自我反思的智能体;其原理就是,让大模型一边去推理,一边行动;也就是我们常说的边干边学,而且为了验证模型的推理效果,还给其引入了一个Observation(观察者)模式,也就是去判断推理和行动的结果是否符合要求,如果不符合则重新来过,直到符合为止。
大模型应用是一个入门非常简单,但要想做好却需要大量技术,架构,工程化才行。
本文转载自AI探索时代 作者:DFires
