一、前言
目前,海内外各家厂商开发的大语言模型已进入绝大多数使用者与企业用户的视野,展示了很多令人兴奋的可能性。但当企业级应用需求出现,从系统开发到知识库问答产品的真正落地,我们还有一系列技术问题需要解决。
举例来说,被广泛讨论的幻觉问题(大模型在不擅长或不具备相关知识的场景下一本正经的胡说八道)、知识局限问题(难以获取实时信息与非公开数据)、数据安全问题(公司私有数据上传到第三方平台安全性和隐私性难以保障)都是企业应用的阻碍。
根据当前的实践结果,在大模型微调成本高、效果难以保障、模型知识实时更新困难的情况下,RAG是最普遍的选择。
而在现阶段,如何提升RAG效能,基于组织数据与知识存储库提供准确、专业的问答工具,是开发者的重要命题之一。
二、优化思路
基于RAG的运作流程,优化思路可以针对各个环节进行。此前,笔者较为注重嵌入模型与多级索引算法,最近则发现了一个新的优化窗口。
我们知道,构建RAG系统的第一步是知识文档的数据清洗与储备。在企业级应用场景中,我们面对的初始及更新知识源可能来自多种信息渠道,以不同的格式或介质储存。举例来说,需要处理的文件可能有Word文......
暂无评论...