LangChain vs Langflow：使用代码或拖拽构建简易 LLM 应用

过去几年，围绕大型语言模型 (LLM) 的技术如雨后春笋般涌现，其中 LangChain 和 Langflow 无疑是最受关注的焦点。本文将深入探讨这两者之间的差异，以及如何利用它们构建一个简易的 LLM 应用，即使您是编程新手，也能轻松上手。我们将通过一个实际案例，对比使用 LangChain 编写代码和使用 Langflow 拖拽式构建流程的优劣，帮助您选择最适合自己的工具。

LangChain：强大的代码框架，灵活且可控

LangChain 是一个强大的框架，旨在简化 LLM 应用的开发过程。它提供了一系列模块化的组件，例如模型、提示词 (Prompt)、链 (Chain)、向量存储 (Vector Store) 等，允许开发者以高度灵活的方式构建复杂的应用。LangChain 的核心优势在于其强大的定制性和可控性。您可以根据自己的需求，选择不同的模型、调整提示词、设计链的结构，从而实现对 LLM 行为的精细控制。

例如，如果您需要构建一个能够处理特定领域知识的问答机器人，使用 LangChain 可以轻松实现。首先，您需要选择一个合适的 LLM 模型，例如 OpenAI 的 GPT-3.5 或 Google 的 PaLM 2。然后，您可以使用 LangChain 提供的文本分割器 (Text Splitter) 将您的知识库文档分割成更小的块，并使用嵌入模型 (Embedding Model) 将这些文本块转换为向量表示。最后，您可以使用向量存储 (例如 FAISS 或 Chroma) 来存储这些向量，并使用 LangChain 提供的检索器 (Retriever) 根据用户的问题检索相关的文本块。通过将这些组件组合在一起，您可以构建一个高效且准确的问答机器人。

然而，LangChain 的强大功能也意味着更高的学习曲线。开发者需要熟悉 Python 编程语言，并且需要理解 LangChain 框架的各个组件及其工作原理。这对于没有编程经验的用户来说，可能是一个挑战。

Langflow：可视化拖拽，快速原型设计

Langflow 则提供了一种完全不同的开发体验。它是一个可视化的拖拽式构建器，允许用户通过拖拽和连接不同的组件来构建 LLM 应用，而无需编写任何代码。Langflow 的核心优势在于其易用性和快速原型设计能力。用户可以在几分钟内构建一个简单的 LLM 应用，并快速迭代和调整。

例如，如果您想构建一个简单的文本摘要应用，使用 Langflow 只需要几个简单的步骤。首先，您可以将一个文本输入组件拖拽到画布上，并将其连接到一个 LLM 模型组件。然后，您可以设置 LLM 模型的参数，例如温度 (Temperature) 和最大生成长度 (Max Tokens)。最后，您可以将 LLM 模型组件连接到一个文本输出组件，以便查看摘要结果。通过这种方式，您可以快速构建一个文本摘要应用，并尝试不同的模型和参数，直到获得满意的结果。

Langflow 的易用性使其成为非技术用户的理想选择。它允许用户在没有编程经验的情况下，也能参与到 LLM 应用的开发中来。然而，Langflow 的灵活性相对较低。用户只能使用 Langflow 提供的组件，并且无法自定义组件的行为。这对于需要高度定制的应用来说，可能是一个限制。

Ollama：本地运行 LLM，保护数据隐私

在构建 LLM 应用时，数据隐私是一个非常重要的考虑因素。许多 LLM 模型都是托管在云端的，这意味着您需要将您的数据上传到云端才能使用这些模型。这可能会引起数据隐私方面的担忧。Ollama 是一个开源项目，旨在解决这个问题。它允许您在本地运行 LLM 模型，从而保护您的数据隐私。

Ollama 支持多种 LLM 模型，例如 Llama 2、Mistral 和 StableLM。您可以从 Ollama 的模型库中下载您需要的模型，并在本地运行它们。这不仅可以保护您的数据隐私，还可以提高应用的响应速度，因为您不需要将数据发送到云端进行处理。

例如，如果您正在构建一个处理敏感数据的医疗诊断应用，使用 Ollama 可以确保您的数据不会离开您的本地环境。您可以将 Ollama 集成到您的 LangChain 或 Langflow 应用中，以便在本地运行 LLM 模型。

FAISS：高效向量搜索，加速检索过程

在许多 LLM 应用中，例如问答机器人和推荐系统，都需要进行向量搜索。向量搜索是指在向量数据库中查找与给定向量最相似的向量。由于向量数据库通常包含大量的向量，因此向量搜索是一个计算密集型的任务。FAISS 是 Facebook AI Research 开发的一个库，旨在加速向量搜索过程。

FAISS 提供了一系列高效的向量搜索算法，例如 IVF (Inverted File Index) 和 HNSW (Hierarchical Navigable Small World)。这些算法可以显著提高向量搜索的速度，从而提高 LLM 应用的性能。

例如，如果您正在构建一个问答机器人，您可以使用 FAISS 来加速知识库的检索过程。您可以将知识库中的文本块转换为向量表示，并将这些向量存储在 FAISS 向量数据库中。当用户提出问题时，您可以将问题转换为向量表示，并使用 FAISS 在向量数据库中查找与问题最相关的文本块。通过使用 FAISS，您可以快速找到相关的文本块，并将其提供给 LLM 模型进行处理。

代码 vs. 拖拽：如何选择？

LangChain 和 Langflow 各有优缺点，适用于不同的场景。

如果您需要高度的定制性和可控性，并且熟悉 Python 编程语言，那么 LangChain 是一个不错的选择。 您可以使用 LangChain 构建复杂的 LLM 应用，并精细控制 LLM 的行为。
如果您希望快速构建 LLM 应用的原型，并且不需要太多的定制性，那么 Langflow 是一个更好的选择。 您可以使用 Langflow 在几分钟内构建一个简单的 LLM 应用，并快速迭代和调整。
如果您对数据隐私有很高的要求，那么可以将 Ollama 集成到您的 LangChain 或 Langflow 应用中。 您可以使用 Ollama 在本地运行 LLM 模型，从而保护您的数据隐私。
如果您需要进行向量搜索，那么可以使用 FAISS 来加速检索过程。 FAISS 提供了高效的向量搜索算法，可以显著提高 LLM 应用的性能。

以下表格总结了 LangChain 和 Langflow 的主要区别：

| 特性 | LangChain | Langflow |
| ———– | ———————– | ————————– |
| 编程语言 | Python | 无需编程 |
| 定制性 | 高 | 低 |
| 易用性 | 低 | 高 |
| 学习曲线 | 高 | 低 |
| 适用场景 | 复杂的 LLM 应用 | 快速原型设计、简单的 LLM 应用 |
| 核心优势 | 灵活性、可控性 | 易用性、快速原型设计 |

实际案例：构建一个基于客户笔记的问答机器人

回到文章开头提到的案例：一位Salesforce咨询顾问希望构建一个基于客户笔记的问答机器人。

使用 LangChain 的步骤：

数据准备： 将客户笔记整理成文本文件。
文本分割： 使用 LangChain 的 RecursiveCharacterTextSplitter 将文本分割成更小的块。
嵌入模型： 使用 OpenAI 的 text-embedding-ada-002 模型将文本块转换为向量表示。
向量存储： 使用 FAISS 存储向量。
检索器： 使用 LangChain 的 FAISS 检索器根据用户的问题检索相关的文本块。
LLM 模型： 使用 OpenAI 的 gpt-3.5-turbo 模型生成答案。
链的构建： 使用 LangChain 的 RetrievalQA 构建一个问答链，将检索器和 LLM 模型连接起来。

代码示例（简化版）：

from langchain.document_loaders import TextLoader
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain.embeddings import OpenAIEmbeddings
from langchain.vectorstores import FAISS
from langchain.chains.qa_with_sources import load_qa_with_sources_chain
from langchain.llms import OpenAI

# 加载数据
loader = TextLoader("customer_notes.txt")
documents = loader.load()

# 分割文本
text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=0)
texts = text_splitter.split_documents(documents)

# 创建嵌入模型
embeddings = OpenAIEmbeddings()

# 创建向量存储
db = FAISS.from_documents(texts, embeddings)

# 创建检索器
retriever = db.as_retriever()

# 创建 LLM 模型
llm = OpenAI(temperature=0)

# 创建问答链
chain = load_qa_with_sources_chain(llm, chain_type="stuff")

# 提问
query = "什么是客户要求的关键功能？"
docs = retriever.get_relevant_documents(query)
result = chain({"input_documents": docs, "question": query}, return_only_outputs=True)

print(result['output_text'])

使用 Langflow 的步骤：

创建流程： 在 Langflow 中创建一个新的流程。
添加组件： 将以下组件拖拽到画布上：
- TextLoader：用于加载客户笔记。
- RecursiveCharacterTextSplitter：用于分割文本。
- OpenAIEmbeddings：用于创建嵌入模型。
- FAISS：用于创建向量存储。
- FAISS Retriever：用于检索相关文本块。
- OpenAI：用于生成答案。
- Chain (RetrievalQA)：用于构建问答链。
- TextInput：用于输入问题。
- TextOutput：用于显示答案。
连接组件： 将组件按照逻辑顺序连接起来。
配置组件： 设置每个组件的参数，例如文本文件路径、LLM 模型名称、温度等。
运行流程： 输入问题并运行流程。

通过对比可以看出，使用 LangChain 需要编写代码，但是可以灵活地定制各个组件的行为。而使用 Langflow 则无需编写代码，只需要拖拽和连接组件，但是灵活性较低。

总结：选择合适的工具，拥抱 LLM 应用的未来

LangChain 和 Langflow 都是强大的工具，可以帮助您构建各种各样的 LLM 应用。LangChain 提供了高度的灵活性和可控性，适合于需要高度定制的应用。Langflow 提供了易用性和快速原型设计能力，适合于快速构建简单的应用。结合 Ollama 和 FAISS，您可以在保证数据隐私和性能的前提下，构建更加强大的 LLM 应用。

选择最适合您的工具，并开始探索 LLM 应用的无限可能！无论是代码还是拖拽，最终目的是将大模型技术应用到实际场景中，解决实际问题，为我们的工作和生活带来便利。

LangChain vs Langflow：使用代码或拖拽构建简易 LLM 应用