Semantic Kernel 与 LangChain：大模型应用开发，殊途同归？

大语言模型（LLMs）的应用开发正日趋成熟，涌现出许多优秀的编排框架，其中 Semantic Kernel 和 LangChain 无疑是其中的佼佼者。虽然两者都旨在简化 LLM 应用的构建，但它们在设计理念、灵活性、语言支持和适用场景上存在显著差异。本文将深入探讨这两个框架，分析其核心概念、优势劣势，帮助开发者选择最适合自身需求的工具。

Semantic Kernel：微软的 Agentic 架构与函数式编排

Semantic Kernel (SK) 是微软开源的一款 SDK，它致力于将 LLM 与传统的编程结构（如函数、变量、内存和插件）进行深度整合。其核心理念在于构建具备 Agentic 能力的应用，强调规划（Planning）和记忆编排（Memory Orchestration），通过语义函数实现智能代理的行为。

核心概念：

语义函数 (Semantic Functions): 这是 Semantic Kernel 的基石。它们本质上是与模型紧密关联的 Prompt 模板。通过定义 Prompt 模板，Semantic Kernel 允许开发者以声明式的方式控制 LLM 的行为。例如，你可以创建一个语义函数，用于根据用户输入总结一篇文章。模板可以包含占位符，这些占位符在运行时会被变量值填充，从而动态生成 Prompt。这使得开发者可以轻松地重用和组合不同的语义函数，构建复杂的 LLM 应用。
- 案例：假设你正在开发一个客户服务机器人。你可以创建一个名为 “AnswerQuestion” 的语义函数，其 Prompt 模板如下：
```
请根据以下知识库回答用户的问题：

知识库：{{$knowledgeBase}}

用户问题：{{$userQuestion}}

答案：
```
  其中 {{$knowledgeBase}} 和 {{$userQuestion}} 是占位符，分别代表知识库的内容和用户提出的问题。当用户提问时，你可以将相关的知识库内容和用户问题填充到这些占位符中，然后调用 LLM 生成答案。
原生函数 (Native Functions): 与语义函数不同，原生函数是用传统的编程语言（如 C#、Python 或 Java）编写的代码。它们允许开发者将现有的代码逻辑集成到 LLM 应用中。这为 Semantic Kernel 提供了强大的灵活性，使其能够处理各种复杂的任务，例如访问数据库、调用 API 或执行数学计算。
- 案例： 假设你需要从数据库中获取信息，然后将其用于生成回复。你可以编写一个原生函数，该函数负责连接数据库、查询数据，并将其格式化为 Semantic Kernel 可以使用的格式。然后，你可以将这个原生函数与一个语义函数组合起来，创建一个能够从数据库获取信息并生成个性化回复的 LLM 应用。
内存存储 (Memory Store): Semantic Kernel 集成了向量存储，支持嵌入（Embedding）和检索操作。这意味着它可以有效地存储和检索与应用程序相关的信息，例如用户历史记录、知识库文章和对话上下文。这对于构建具有记忆能力的 LLM 应用至关重要。
- 案例： 在客户服务机器人中，你可以使用内存存储来保存用户历史记录。当用户再次提问时，你可以检索其历史记录，并将其用于生成更个性化和相关的回复。
规划器 (Planners): 这是 Semantic Kernel 的一个高级特性。规划器可以自动选择和链接不同的函数，以实现特定的目标。这使得开发者可以构建高度智能的 LLM 应用，这些应用可以根据用户的需求自动调整其行为。
- 案例： 假设你想要创建一个可以帮助用户预订旅行的 LLM 应用。你可以创建一个规划器，该规划器可以根据用户的旅行偏好（例如目的地、日期和预算）自动选择合适的函数，例如 “SearchFlights”、”BookHotel” 和 “RentCar”。然后，规划器可以将这些函数链接起来，创建一个完整的旅行预订流程。
连接器/插件 (Connectors/Plugins): Semantic Kernel 允许开发者将 API 或任务封装成可重用的单元，供 LLM 调用。这使得开发者可以轻松地将 LLM 应用与外部服务集成，扩展其功能。
- 案例： 你可以将一个天气 API 封装成一个插件，然后让 LLM 在回复用户时可以自动获取当前天气信息。

语言支持：

Semantic Kernel 支持 C#、Python 和 Java。这使得开发者可以使用他们熟悉的编程语言来构建 LLM 应用。

优势：

Agentic 架构： Semantic Kernel 专注于构建具有 Agentic 能力的应用，这使其非常适合构建智能代理和自动化系统。
函数式编排： Semantic Kernel 使用函数作为其核心构建块，这使得开发者可以轻松地重用和组合不同的功能。
强大的规划能力： Semantic Kernel 的规划器可以自动选择和链接不同的函数，以实现特定的目标。

劣势：

学习曲线： Semantic Kernel 的概念较为复杂，需要一定的学习成本。
灵活性相对较低： 与 LangChain 相比，Semantic Kernel 的灵活性相对较低，可能不适合构建高度定制化的 LLM 应用。

LangChain：Python 为中心的模块化 LLM 应用构建

LangChain 是一个以 Python 为中心的框架（也支持 JavaScript/TypeScript），专注于通过模块化组件链构建可组合的 LLM 应用。它的核心思想是将 LLM 应用分解为一系列独立的步骤，然后将这些步骤连接起来，形成一个完整的流程。

核心概念：

链 (Chains): 链是 LangChain 的核心概念。它们是按顺序排列的调用序列。例如，一个链可能包含一个 LLM 调用、一个工具调用和一个内存访问。LangChain 提供了各种预定义的链，例如 “LLMChain”、”SequentialChain” 和 “RouterChain”。开发者也可以根据自己的需求创建自定义链。
- 案例： 你可以创建一个链，用于根据用户输入生成文章摘要。该链可能包含以下步骤：
  1. LLM 调用： 使用 LLM 从用户输入中提取关键信息。
  2. 摘要生成： 使用 LLM 根据提取的关键信息生成文章摘要。
代理 (Agents): 代理是使用工具进行决策的实体。LangChain 提供了各种预定义的代理，例如 “ZeroShotAgent”、”ReActAgent” 和 “SelfAskWithSearchAgent”。代理可以根据用户的输入和环境的状态，自动选择合适的工具来完成任务。
- 案例： 你可以创建一个代理，用于回答用户提出的关于某个主题的问题。该代理可以使用以下工具：
  1. 搜索引擎： 用于搜索互联网上的相关信息。
  2. 知识库： 用于访问预定义的知识库。
  3. 计算器： 用于执行数学计算。
可运行对象 (Runnables): 这是对步骤的统一抽象，支持流式传输、异步和追踪。Runnables 允许开发者以更灵活和可控的方式管理 LLM 应用的执行流程。
- 案例： 你可以使用 Runnables 来实现一个流式聊天机器人。当用户输入时，Runnables 可以将输入逐步发送给 LLM，并在 LLM 生成回复的同时将其流式传输给用户。
内存 (Memory): LangChain 提供了各种内存模块，用于存储和检索与应用程序相关的信息。这些内存模块可以用于存储对话历史记录、摘要或向量嵌入。
- 案例： 在聊天机器人中，你可以使用内存模块来保存对话历史记录。当用户再次提问时，你可以检索其历史记录，并将其用于生成更个性化和相关的回复。LangChain 支持多种内存类型，包括：
  - 对话记忆 (Conversation Memory): 存储对话历史，允许 LLM 理解上下文。
  - 总结记忆 (Summarization Memory): 将对话历史总结为更简洁的形式，节省存储空间。
  - 向量记忆 (Vector-based Memory): 使用向量嵌入来存储和检索信息，支持语义搜索。
工具 (Tooling): LangChain 深度集成了向量存储、API 和检索机制。这使得开发者可以轻松地将 LLM 应用与各种外部资源集成。
- 案例： 你可以使用 LangChain 集成的向量存储来存储和检索知识库文章。当用户提问时，你可以使用向量搜索来找到相关的文章，并将它们用于生成答案。

语言支持：

LangChain 主要支持 Python，也支持 JavaScript/TypeScript。

优势：

模块化： LangChain 的模块化设计使得开发者可以轻松地构建和定制 LLM 应用。
灵活性： LangChain 提供了各种不同的模块和工具，允许开发者构建各种类型的 LLM 应用。
活跃的社区： LangChain 拥有一个活跃的社区，提供了大量的文档、教程和示例。

劣势：

复杂性： LangChain 的概念较为复杂，需要一定的学习成本。
Python 依赖： LangChain 主要支持 Python，这可能会限制其在某些环境中的使用。

Semantic Kernel 与 LangChain 的对比总结

总而言之，Semantic Kernel 专注于构建具有 Agentic 能力的应用，强调规划和函数式编排，是微软推出的更偏向企业级应用的框架。而 LangChain 则更灵活，注重模块化和可组合性，更适合快速原型设计和构建定制化的 LLM 应用。

两者在功能上存在一定的重叠，例如都支持内存、链和工具，但在编排方式以及开发者对自动化程度的控制方面有所不同。选择哪个框架取决于具体的应用场景和开发者的偏好。如果你需要构建一个具有高度智能和自动化能力的应用，Semantic Kernel 可能更适合你。如果你需要构建一个高度定制化的 LLM 应用，LangChain 可能更适合你。

未来展望

随着大模型技术的不断发展，Semantic Kernel 和 LangChain 也将不断进化。未来的趋势可能包括：

更强的 Agentic 能力： 两个框架都将致力于提高其 Agentic 能力，使 LLM 应用能够更自主地完成任务。
更强大的工具集成： 两个框架都将继续集成更多的工具和 API，扩展 LLM 应用的功能。
更易于使用的开发工具： 两个框架都将努力提供更易于使用的开发工具，降低 LLM 应用的开发门槛。

最终，无论选择哪个框架，都应根据自身需求和技术栈进行评估，并在实践中不断探索和学习，才能充分利用大模型的力量，构建出更智能、更强大的应用。

Semantic Kernel 与 LangChain：大模型应用开发，殊途同归？