从零构建RAG：一个朴素但可扩展的方案（二）：利用最佳设计模式集成大语言模型

引言：大语言模型（LLM）在RAG系统中的核心作用与框架的模块化设计

检索增强生成（Retrieval-Augmented Generation，简称RAG）系统背后的核心驱动力毫无疑问是大语言模型（LLM）。随着OpenAI、Cohere、HuggingFace、DeepSeek等厂商不断推陈出新，LLM 技术日新月异。然而，频繁更换供应商或进行实验，却往往需要重写大量核心逻辑，这无疑增加了开发成本和维护难度。本文将深入探讨如何利用注册模式（Registry Pattern）和工厂模式（Factory Pattern），构建一个可扩展、清晰且模块化的 LLM 框架，从而实现仅需修改配置文件即可切换模型，并以最小的样板代码添加新的供应商。

目标：灵活切换LLM供应商，保障密钥安全，遵循良好设计模式

本篇文章旨在实现以下关键目标：

灵活切换 LLM 供应商：通过修改配置文件，即可轻松更换 RAG 系统使用的 LLM 供应商，无需修改核心代码。
最小化样板代码：添加新的 LLM 供应商时，只需编写极少量代码，即可将其集成到框架中。
密钥安全管理：将 API 密钥等敏感信息存储在 .env 文件中，避免泄露到源代码中。
遵循最佳实践：采用注册模式（Registry Pattern）、工厂模式（Factory Pattern）和封装原则，编写高质量、易于维护的代码。

项目结构：配置文件、主脚本和LLM框架的组织

文章提到的示例项目 naive-rag/ 拥有清晰的结构：

.env: 存储 API 密钥等环境变量。
main_llm_framework.py: 演示 LLM 框架 使用的主脚本。
llm_framework/: 包含 LLM 框架 的核心代码。
- config/: 存储配置文件。
  - config.ini: 定义模型、供应商等配置信息。

这样的组织结构有助于项目的模块化和可维护性。

注册模式：构建LLM注册表，实现动态模型发现

注册模式允许我们在运行时动态地注册和发现 LLM 模型。我们可以创建一个 LLMRegistry 类，用于存储所有可用的 LLM 模型。

class LLMRegistry:
    _registry = {}

    @classmethod
    def register(cls, name):
        def inner_wrapper(func):
            if name in cls._registry:
                raise ValueError(f"LLM with name '{name}' already registered")
            cls._registry[name] = func
            return func
        return inner_wrapper

    @classmethod
    def get_llm(cls, name):
        llm = cls._registry.get(name)
        if not llm:
            raise ValueError(f"LLM with name '{name}' not found")
        return llm

    @classmethod
    def list_llms(cls):
        return list(cls._registry.keys())

# 示例注册一个 OpenAI LLM
@LLMRegistry.register("openai")
def create_openai_llm(api_key, model_name):
    # 这里需要添加 OpenAI 的具体初始化代码
    # 比如： from openai import OpenAI; client = OpenAI(api_key=api_key); return client.chat.completions.create(model=model_name, ...)
    print(f"Creating OpenAI LLM with model: {model_name}")
    return OpenAIWrapper(api_key, model_name) #假设已经有OpenAIWrapper实现

# 示例注册一个 Cohere LLM
@LLMRegistry.register("cohere")
def create_cohere_llm(api_key, model_name):
    # 这里需要添加 Cohere 的具体初始化代码
    # 比如： from cohere import Client; co = Client(api_key); return co.generate(model=model_name, ...)
    print(f"Creating Cohere LLM with model: {model_name}")
    return CohereWrapper(api_key, model_name) #假设已经有CohereWrapper实现

在这个例子中，LLMRegistry.register 装饰器会将 LLM 创建函数注册到 _registry 字典中，键为 LLM 的名称。LLMRegistry.get_llm 方法可以根据名称获取对应的 LLM 创建函数。这种方式非常灵活，允许我们在不修改核心代码的情况下，添加新的 LLM 模型。

工厂模式：解耦LLM创建过程，实现依赖注入

工厂模式用于封装对象的创建过程，将客户端代码与具体的 LLM 实现解耦。我们可以创建一个 LLMFactory 类，用于根据配置信息创建 LLM 实例。

class LLMFactory:
    def __init__(self, config):
        self.config = config

    def create_llm(self):
        provider = self.config.get("llm", "provider")
        api_key = self.config.get("llm", "api_key") # 从config对象中获取，而不是从.env直接读取
        model_name = self.config.get("llm", "model_name")

        creator_func = LLMRegistry.get_llm(provider) # 使用注册表获取创建函数
        return creator_func(api_key, model_name)

在这个例子中，LLMFactory 接收一个配置对象 config，该对象包含 LLM 供应商、API 密钥和模型名称等信息。create_llm 方法根据配置信息，使用 LLMRegistry.get_llm 方法获取对应的 LLM 创建函数，并使用该函数创建 LLM 实例。这种方式将 LLM 的创建过程与客户端代码解耦，使得我们可以轻松地更换 LLM 供应商，而无需修改客户端代码。

例如，如果我们的 config.ini 文件中配置了 provider = openai，那么 LLMFactory 就会调用 create_openai_llm 函数来创建 OpenAI 的 LLM 实例。如果我们将 provider 修改为 cohere，那么 LLMFactory 就会调用 create_cohere_llm 函数来创建 Cohere 的 LLM 实例。

配置管理：使用configparser，优雅读取配置文件

为了实现通过修改配置文件来切换 LLM 供应商，我们需要一个配置管理模块。Python 的 configparser 模块可以很好地满足这个需求。

import configparser
import os

class Config:
    def __init__(self, config_path="config/config.ini"):
        self.config = configparser.ConfigParser()
        self.config.read(config_path)

    def get(self, section, key):
        try:
            return os.environ[self.config.get(section, key)]  if self.config.has_option(section, key) and self.config.get(section, key).startswith("${") and self.config.get(section, key).endswith("}") else self.config.get(section, key)
        except (configparser.NoSectionError, configparser.NoOptionError, KeyError) as e:
            print(f"Error reading config: {e}")
            return None

# Example usage
config = Config()
llm_provider = config.get("llm", "provider")
api_key = config.get("llm", "api_key")
model_name = config.get("llm", "model_name")

print(f"LLM Provider: {llm_provider}")
# 注意，apiKey 应该从 .env 文件中读取
# print(f"API Key: {api_key}")
print(f"Model Name: {model_name}")

Config 类读取 config.ini 文件，并提供 get 方法来获取配置项的值。为了安全起见，API 密钥通常不直接存储在 config.ini 文件中，而是通过环境变量来传递。Config.get方法会检查配置项是否以${开头并以}结尾，如果是，则尝试从环境变量中读取对应的值。这确保了敏感信息不会被泄露到代码库中。

环境变量管理：使用python-dotenv，保障API密钥安全

API 密钥是使用 LLM 服务的关键凭证，必须妥善保管。将 API 密钥存储在源代码中是非常危险的，容易被泄露。使用 .env 文件结合 python-dotenv 库，可以安全地管理 API 密钥等敏感信息。

首先，安装 python-dotenv：

pip install python-dotenv

然后，创建一个 .env 文件，并将 API 密钥存储在其中：

OPENAI_API_KEY=your_openai_api_key
COHERE_API_KEY=your_cohere_api_key

最后，在代码中使用 python-dotenv 加载环境变量：

from dotenv import load_dotenv
import os

load_dotenv()

# 获取 OpenAI API 密钥
openai_api_key = os.getenv("OPENAI_API_KEY")

# 获取 Cohere API 密钥
cohere_api_key = os.getenv("COHERE_API_KEY")

print(f"OpenAI API Key: {openai_api_key[:5]}... (hidden)") # 只显示前5个字符，保护密钥
print(f"Cohere API Key: {cohere_api_key[:5]}... (hidden)") # 只显示前5个字符，保护密钥

load_dotenv() 函数会将 .env 文件中的环境变量加载到 os.environ 中，我们可以使用 os.getenv() 函数来获取这些环境变量的值。

封装：创建LLM Wrapper，统一API接口

不同 LLM 供应商 的 API 接口各不相同，为了方便使用和维护，我们可以创建 LLM Wrapper 类，将不同 API 接口封装成统一的接口。

class LLMWrapper:
    def __init__(self, api_key, model_name):
        self.api_key = api_key
        self.model_name = model_name

    def generate(self, prompt):
        raise NotImplementedError("Subclasses must implement this method")

class OpenAIWrapper(LLMWrapper):
    def __init__(self, api_key, model_name):
        super().__init__(api_key, model_name)
        from openai import OpenAI
        self.client = OpenAI(api_key=self.api_key)

    def generate(self, prompt):
        completion = self.client.chat.completions.create(
            model=self.model_name,
            messages=[{"role": "user", "content": prompt}]
        )
        return completion.choices[0].message.content

class CohereWrapper(LLMWrapper):
    def __init__(self, api_key, model_name):
        super().__init__(api_key, model_name)
        from cohere import Client
        self.co = Client(self.api_key)

    def generate(self, prompt):
        response = self.co.generate(
            model=self.model_name,
            prompt=prompt,
            max_tokens=100 # Example parameter
        )
        return response.generations[0].text

LLMWrapper 是一个抽象类，定义了 generate 方法的接口。OpenAIWrapper 和 CohereWrapper 是 LLMWrapper 的子类，分别实现了 OpenAI 和 Cohere 的 API 接口。客户端代码只需要调用 generate 方法，就可以使用不同的 LLM 服务，而无需关心具体的 API 接口。

测试与验证：确保框架的正确性和可靠性

为了确保 LLM 框架 的正确性和可靠性，我们需要编写单元测试和集成测试。

import unittest
from unittest.mock import patch, MagicMock
from llm_framework.llm_factory import LLMFactory
from llm_framework.config import Config
from llm_framework.llm_registry import LLMRegistry

class TestLLMFramework(unittest.TestCase):

    @patch('llm_framework.llm_factory.LLMRegistry.get_llm')
    def test_create_llm_openai(self, mock_get_llm):
        mock_get_llm.return_value = MagicMock(return_value="OpenAI Model Instance")
        config = Config()
        config.config.read_string("""
            [llm]
            provider = openai
            api_key = test_api_key
            model_name = gpt-4
        """)
        llm_factory = LLMFactory(config)
        llm = llm_factory.create_llm()
        self.assertEqual(llm, "OpenAI Model Instance")
        mock_get_llm.assert_called_with("openai")

    @patch('llm_framework.llm_factory.LLMRegistry.get_llm')
    def test_create_llm_cohere(self, mock_get_llm):
        mock_get_llm.return_value = MagicMock(return_value="Cohere Model Instance")
        config = Config()
        config.config.read_string("""
            [llm]
            provider = cohere
            api_key = test_api_key
            model_name = large
        """)
        llm_factory = LLMFactory(config)
        llm = llm_factory.create_llm()
        self.assertEqual(llm, "Cohere Model Instance")
        mock_get_llm.assert_called_with("cohere")

    def test_llm_registry_register_and_get(self):
        @LLMRegistry.register("test_llm")
        def create_test_llm(api_key, model_name):
            return "Test LLM Instance"

        llm = LLMRegistry.get_llm("test_llm")
        self.assertEqual(llm("api_key", "model_name"), "Test LLM Instance")

if __name__ == '__main__':
    unittest.main()

这个例子展示了如何使用 unittest 和 mock 库来测试 LLM 框架。我们使用 patch 装饰器来模拟 LLMRegistry.get_llm 方法，以避免实际调用 LLM API。我们还使用 MagicMock 类来创建一个 mock 对象，用于模拟 LLM 实例。

总结：RAG系统与LLM框架的未来展望

通过注册模式和工厂模式，我们成功构建了一个可扩展、清晰且模块化的 LLM 框架。借助这个框架，我们可以轻松地切换 LLM 供应商，并以最小的样板代码添加新的供应商。这种架构不仅提高了代码的可维护性和可测试性，还为未来的 RAG 系统提供了更大的灵活性。随着 大语言模型 技术的不断发展，这种模块化和可扩展的设计思想将变得越来越重要。在未来的 RAG 系统开发中，我们可以进一步探索更多高级设计模式，例如策略模式和观察者模式，以构建更加灵活和强大的系统。

构建一个健壮的 RAG 系统，并不仅仅是简单地将 LLM 连接到外部数据源，更需要关注系统的可维护性、可扩展性和安全性。通过本文介绍的 LLM 框架，我们希望能够帮助读者更好地理解和构建高质量的 RAG 系统，从而更好地利用 大语言模型 技术来解决实际问题。

从零构建RAG：一个朴素但可扩展的方案（二）：利用最佳设计模式集成大语言模型

从零构建RAG：一个朴素但可扩展的方案（二）：利用最佳设计模式集成大语言模型

By llmtrend

突破炒作迷雾：利用RAG、MongoDB Atlas与Google Cloud构建真实世界的上下文感知AI

解锁高级 RAG 的力量：构建下一代 RAG 系统的实战指南

发表回复取消回复

pydiode：揭秘 ChatGPT Python Canvas 的运行时真相

大语言模型 (LLM)：聊天机器人背后的智能大脑，理解 Tokens、Transformers 以及 ChatGPT 的工作原理

大模型时代的“天鹅绒牢笼”：重塑智识主权宣言

本地构建强大AI智能体：无需云端，无需订阅，只需代码

You Missed

pydiode：揭秘 ChatGPT Python Canvas 的运行时真相

pydiode：揭秘 ChatGPT Python Canvas 的运行时真相

大语言模型 (LLM)：聊天机器人背后的智能大脑，理解 Tokens、Transformers 以及 ChatGPT 的工作原理

大语言模型 (LLM)：聊天机器人背后的智能大脑，理解 Tokens、Transformers 以及 ChatGPT 的工作原理

大模型时代的“天鹅绒牢笼”：重塑智识主权宣言

大模型时代的“天鹅绒牢笼”：重塑智识主权宣言

利用生成式AI（GenAI）进行数据增强与合成：提升模型性能的实战指南

从零构建RAG：一个朴素但可扩展的方案（二）：利用最佳设计模式集成大语言模型

By llmtrend

Related Post

突破炒作迷雾：利用RAG、MongoDB Atlas与Google Cloud构建真实世界的上下文感知AI

解锁高级 RAG 的力量：构建下一代 RAG 系统的实战指南

发表回复 取消回复

You Missed

pydiode：揭秘 ChatGPT Python Canvas 的运行时真相

大语言模型 (LLM)：聊天机器人背后的智能大脑，理解 Tokens、Transformers 以及 ChatGPT 的工作原理

大模型时代的“天鹅绒牢笼”：重塑智识主权宣言

发表回复取消回复