鸿蒙开发者社区

公众号矩阵

移动端

视频课免费课排行榜短视频直播课软考学堂

全部课程软考信创认证华为认证厂商认证 IT技术 PMP项目管理免费题库

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

AI.x社区

登录/注册
51CTO

中国优质的IT技术网站

51CTO博客

专业IT技术创作平台

51CTO学堂

IT职业在线教育平台

再次提升RAG性能：两种高效的Rerank模型实践指南原创

发布于 2024-7-9 07:18

浏览

1收藏

在高级RAG应用中，检索后处理环节至关重要。Rerank技术通过重新排序检索出的文档块，确保与用户问题更相关的信息排在前面，从而提高语言模型生成答案的质量。在这个环节中，可以做一些诸如相似度过滤、关键词过滤、chunk内容替换等处理。其中，Rerank（重排序）是一种常见的，也是在RAG应用优化中很常见的一种技术处理环节。

本文介绍了两种被广泛认可的Rerank模型：Cohere Rerank模型和bge-reranker-large模型，并提供了使用指南。

再次提升RAG性能：两种高效的Rerank模型实践指南 -AI.x社区

一、为什么还需要Rerank

RAG应用中有多种索引类型，很多索引技术并非基于语义与向量构建，其检索的结果希望借助独立的Rerank实现语义重排
在一些复杂RAG范式中，很多时候会使用多路混合检索来获取更多相关知识；这些来自不同源、不同检索算法的chunks要借助Rerank做重排
即使是完全基于向量构建的索引，由于不同的嵌入模型、相似算法、语言环境、领域知识特点等影响，其语义检索的相关度排序也可能发生较大的偏差；此时借助独立的Rerank模型做纠正也非常有意义

二、在线模型 - Cohere Rerank模型

Cohere Rerank是一个商业闭源的Rerank模型。它根据与指定查询问题的语义相关性对多个文本输入进行排序，专门用于帮助关键词或向量搜索返回的结果做重新排序与提升质量。

为了使用Cohere Rerank，你首先需要在官方网站（https://cohere.com/）注册后申请测试的API-key（测试使用免费）：

再次提升RAG性能：两种高效的Rerank模型实践指南 -AI.x社区

Cohere Rerank的使用非常简单，通常在LangChain与LlamaIndex框架中集成使用。下面展示如何在LangChain框架中使用Cohere Rerank来优化检索结果。

再次提升RAG性能：两种高效的Rerank模型实践指南 -AI.x社区

输出结果示例

再次提升RAG性能：两种高效的Rerank模型实践指南 -AI.x社区

在调用Cohere Rerank之后，内容的相关性和其对应的查询更加匹配，排序也更加合理。这种更加合理的排名一方面有利于LLM生成更准确的回复；另一方面也可以帮助降低top_K数量，以节约上下文空间。

三、本地模型 - bge-reranker-large模型

bge-reranker-large是国内智源开源的一个被广泛使用的Rerank模型，在众多的模型测试中有着非常优秀的成绩。

下面展示如何在LangChain框架中使用bge-reranker-large来优化检索结果。

再次提升RAG性能：两种高效的Rerank模型实践指南 -AI.x社区

输出结果示例

再次提升RAG性能：两种高效的Rerank模型实践指南 -AI.x社区

注：示例仅供参考，具体运行可能需要调整

了解更多：https://github.com/FlagOpen/FlagEmbedding/blob/master/README_zh.md

总结：

Rerank虽然在RAG流程中看似不那么显眼，但其实现简单、资源要求低，且不依赖于特定的嵌入模型，能够显著提升最终生成的质量。无论是选择在线的Cohere Rerank模型，还是本地部署的bge-reranker-large模型，都能为您的RAG应用带来性能上的提升。

本文转载自公众号顶层架构领域

原文链接：https://mp.weixin.qq.com/s/y_iqvDdGNqQLZVo61hF1rQ

©著作权归作者所有，如需转载，请注明出处，否则将追究法律责任

标签

已于2024-7-9 11:18:02修改

赞

收藏 1

回复

举报

回复

相关推荐

RAG技术性能提升之文档分块策略方案

AIGC观察者 • 6177浏览 • 0回复
提升RAG系统性能10条策略建议

AIGC观察者 • 3340浏览 • 0回复
RAPTOR 检索树再次进一步提升RAG性能的设计思路

AIGC观察者 • 4828浏览 • 0回复
提升5.69倍，高效RAG上下文压缩方法COCOM

Aceryt • 3044浏览 • 0回复
提升 RAG 系统的回答质量：构建高效的 Prompt

玄姐聊AGI • 4550浏览 • 0回复
Adaptive-RAG：性能提升50%以上的高效RAG策略

大语言模型论文跟踪 • 3291浏览 • 0回复
【AI开源项目】FastGPT - 快速部署FastGPT以及使用知识库的两种方式！

唐克 • 9941浏览 • 0回复
TextIn：一款优秀的文档解析神器，提升RAG性能必备

恰似惊鸿 • 5167浏览 • 0回复
提升人工智能性能的三种关键的LLM压缩策略

51CTO内容精选 • 2690浏览 • 0回复
提升RAG性能的全攻略：优化检索增强生成系统的策略大揭秘

Halo咯咯 • 7404浏览 • 0回复
怎么解决大模型知识库的检索问题，RAG检索增强之ReRank(重新排序)

AI探索时代 • 4289浏览 • 0回复
从RAG到RAG+：让大模型更懂业务的权威指南

芝士AI吃鱼 • 2917浏览 • 0回复
RAG圈的DeepSeek，中科院DeepRAG让大模型带着“思考”检索，性能提升21.99%

PaperAgent • 4152浏览 • 0回复
WebWalker：通过Multi Agent提升RAG在开放域QA的性能

大语言模型论文跟踪 • 2479浏览 • 0回复
ViDoRAG：提升视觉RAG性能10%

大语言模型论文跟踪 • 2977浏览 • 0回复
为什么 RAG 一定需要 Rerank？

玄姐聊AGI • 2971浏览 • 0回复
RAG检索系统的两大核心利器——Embedding模型和Rerank模型

AI探索时代 • 2644浏览 • 0回复
关于基于人工智能做数据分析的两种方式——SQL和Pandas的区别

AI探索时代 • 1487浏览 • 0回复
PPO 与 DPO：大模型偏好对齐的两种核心算法解析

鸿煊的学习笔记 • 3298浏览 • 0回复

这个用户很懒，还没有个人简介

帖子

声望

粉丝

关注

最近发布

Label Studio 数据标注工具详解 2024-08-28 07:25:43发布
Easy-RAG 一个适合学习、使用、自主扩展的检索增强生成系统 2024-08-21 16:33:57发布

热门推荐

一张图生成3A级游戏画面！腾讯混元全新开源Hunyuan-GameCraft 0回复

国产视频大模型突破！阿里最新开源Wan2.2，单卡生成电影级画面 0回复

阿里开源首个图像生成模型Qwen-Image：超强中文渲染能力刷新SOTA！ 0回复

六大智能体平台深度对比：从技术架构到行业落地，一篇讲透选型关键 0回复

旧程序员时代落幕了！GitHub掌门人：不用AI就退行！5年内，AI生成代码将达90%！七大核心技能必须有！ 0回复

上一篇：深入理解思维树 (ToT)策略提示词设计

下一篇： AI技术新前沿本地LLM模型推理训练加速

社区精华内容

目录

Copyright © 2005-2025 51CTO.COM 京ICP证060544版权所有未经许可请勿转载