检索增强生成(RAG)技术技综述:原理、类型与应用前景
RAG 的基本原理是将文本生成任务与信息检索相结合。RAG 技术在接收到用户的查询请求后,首先会对相关文档进行检索。会将文档分割成适宜处理的片段,然后转化为向量嵌入形式,以便利用余弦相似度等方法快速找到。找到相关文本片段后,将其作为额外信息输入到语言模型中,辅助模型生成回答。
RAG 的基本原理是将文本生成任务与信息检索相结合。RAG 技术在接收到用户的查询请求后,首先会对相关文档进行检索。会将文档分割成适宜处理的片段,然后转化为向量嵌入形式,以便利用余弦相似度等方法快速找到。找到相关文本片段后,将其作为额外信息输入到语言模型中,辅助模型生成回答。