从零开始构建 RAG:一个朴素但可扩展的方法(四)—— 向量数据库的艺术
引言:向量数据库在 RAG 系统中的关键角色 在前几篇文章中,我们已经构建了一个基本的 RAG (Retrieval-Augmented Generation) 流水线,设计了一个可扩展的 LLM (大型语言模型) 接口,并对文档进行了清晰的解析和分块。现在,是时候将这些数据块存储起来,以便在需要时检索它们了。这就是向量数据库的用武之地。向量数据库是 RAG 系统的记忆核心,负责存储分块的文档,并