RAG Archives - Page 6 of 19

从零开始构建 RAG：一个朴素但可扩展的方法（四）—— 向量数据库的艺术

llmtrend 2025年6月8日没有评论

引言：向量数据库在 RAG 系统中的关键角色在前几篇文章中，我们已经构建了一个基本的 RAG (Retrieval-Augmented Generation) 流水线，设计了一个可扩展的 LLM (大型语言模型) 接口，并对文档进行了清晰的解析和分块。现在，是时候将这些数据块存储起来，以便在需要时检索它们了。这就是向量数据库的用武之地。向量数据库是 RAG 系统的记忆核心，负责存储分块的文档，并

RAG

大模型RAG应用成本优化：策略、技巧与最佳实践

llmtrend 2025年6月8日没有评论

随着企业对大模型（LLM）推理应用的日益依赖，尤其是通过RAG（Retrieval Augmented Generation，检索增强生成）系统将上下文知识与基础模型相结合来执行任务，成本优化变得至关重要。本文深入探讨RAG应用中处理时间优化、成本管理和Token利用率等关键维度的优化策略，旨在帮助企业在保证性能的前提下，显著降低运营成本。 1. 场景适用性评估：LLM真的是最优解吗？在盲目采用

LLM

解密 LLM、LangChain、Embedding 与 RAG：构建者的实战指南

llmtrend 2025年6月8日没有评论

人工智能领域正在以惊人的速度发展，LLM(大型语言模型)、Embedding(嵌入)、RAG(检索增强生成)、Agent(智能体)和工作流等术语层出不穷，让人眼花缭乱。无论您是开发者、产品经理还是人工智能爱好者，理解这些基础概念对于构建现代人工智能应用程序至关重要。本文旨在清晰简洁地剖析这些概念，让您能够自信地驾驭和应用这些技术，并利用LangChain和LangGraph等框架，构建更加智能的A

LLM

从好奇到创造：你的生成式AI入门指南

llmtrend 2025年6月8日没有评论

你是否也听腻了“AI”这个词？ “生成式AI”是否让你觉得既熟悉又陌生？或许你已经体验过 ChatGPT 的强大，惊叹于 AI 绘画的精美，或者好奇这些工具背后的运作原理。如果你对 AI 领域充满好奇，渴望深入探索，却又被专业术语和复杂概念所困扰，那么这篇指南正是为你量身定制，它将引领你从消费者转变为创造者，掌握大模型技术，开启你的 AI 奥德赛。生成式AI 的核心：从识别到创造理解生成式

LLM

Mamba架构中的跨注意力机制探索：赋能多模态与长序列建模

llmtrend 2025年6月8日没有评论

在序列建模领域，注意力机制已经彻底改变了我们处理长上下文依赖关系的方式。尽管Transformer模型凭借其自注意力机制仍然占据主导地位，但诸如Mamba之类的新型模型正因其在处理长序列方面的效率而日益受到关注。一个新兴趋势是将跨注意力机制集成到Mamba架构中，以增强其在多模态或多源环境中的能力。本文将深入探讨Mamba架构中跨注意力的意义，它如何补充Mamba的设计，以及这种集成对于实际应用意

RAG

如何用 LangChain、FAISS 和 Hugging Face 构建一个智能主题公园助手：告别幻觉的 RAG 实战

llmtrend 2025年6月8日没有评论

你是否曾经渴望过一个能够准确回答问题，避免胡编乱造的主题公园助手？本文将带你了解如何利用 LangChain、FAISS 和 Hugging Face 构建一个基于 RAG (Retrieval-Augmented Generation) 的智能助手，打造一个没有“幻觉”的可靠问答系统。通过本文，你将了解到如何结合这些强大的工具，创建一个能够自信地说“我不知道”，而不是给出错误信息的智能助手。 R

Fine-tuning

超越基础模型：ChatGPT 与 Claude 微调深度解析（增强版）

llmtrend 2025年6月8日没有评论

通用大语言模型（LLM）正迅速被针对特定用途、经过微调的模型所取代。在对准确性、语气和上下文要求极高的领域，例如医疗保健、金融、法律和政府部门，通用模型往往表现不足。微调弥合了这一差距，它将一个功能强大的基础模型转化为特定领域的专家助手。本文将深入探讨 ChatGPT 和 Claude 这两个最广泛使用的大语言模型，着重分析微调方法、实施技巧、部署注意事项、定价比较以及性能权衡。无论您是构建专业的

RAG

Qwen 引领 RAG 革命：开源 Embedding 模型兼顾速度与精度

llmtrend 2025年6月8日没有评论

在大型语言模型（LLM）的浪潮中，人们往往追逐最新的、最闪耀的技术。然而，一个更为实用且强大的技术正在悄然兴起，它就是文本 embedding 模型。如果你正在构建检索增强生成（RAG）系统、语义搜索或者任何需要深入理解文本的应用，那么 Qwen 开源的 embedding 模型将为你带来革命性的改变，尤其是在掌控力、速度和避免供应商锁定方面。被锁定的困境：专有 Embedding 模型的挑战

RAG

从检索到推理：企业AI中RAG之后的新篇章

llmtrend 2025年6月8日没有评论

在日新月异的数据科学领域，人工智能（AI）的创新层出不穷。本文将深入探讨企业AI工作流程中一种日益显著的转变：从检索增强生成（RAG）到推理增强型AI，或可称为RAG++。这不仅仅是术语上的更迭，更代表着构建AI系统的根本性变革，即AI不仅能够获取信息，更能真正地思考和理解信息。什么是RAG？回顾检索增强生成的核心概念检索增强生成（RAG）是一种有效的模式，它避免了将所有数据一股脑地输入语言

RAG

RAG 流程中的 Augmentation 技术详解：提升大模型生成质量的关键一步

llmtrend 2025年6月8日没有评论

在构建基于 Retrieval-Augmented Generation (RAG) 的大模型应用中，信息检索 (Retrieval) 是基础，而 Augmentation（增强）则是将检索到的外部知识融入大模型上下文，提升生成内容质量的关键步骤。本文将深入探讨 RAG 流程中 Augmentation 阶段的核心技术，帮助读者理解并掌握如何有效利用外部知识增强大模型的生成能力。我们将结合实际案例

RAG

从零开始构建 RAG：一个朴素但可扩展的方法（四）—— 向量数据库的艺术

从零开始构建 RAG：一个朴素但可扩展的方法（四）—— 向量数据库的艺术

大模型RAG应用成本优化：策略、技巧与最佳实践

大模型RAG应用成本优化：策略、技巧与最佳实践

解密 LLM、LangChain、Embedding 与 RAG：构建者的实战指南

解密 LLM、LangChain、Embedding 与 RAG：构建者的实战指南

从好奇到创造：你的生成式AI入门指南

从好奇到创造：你的生成式AI入门指南

Mamba架构中的跨注意力机制探索：赋能多模态与长序列建模

Mamba架构中的跨注意力机制探索：赋能多模态与长序列建模

如何用 LangChain、FAISS 和 Hugging Face 构建一个智能主题公园助手：告别幻觉的 RAG 实战

如何用 LangChain、FAISS 和 Hugging Face 构建一个智能主题公园助手：告别幻觉的 RAG 实战

超越基础模型：ChatGPT 与 Claude 微调深度解析（增强版）

超越基础模型：ChatGPT 与 Claude 微调深度解析（增强版）

Qwen 引领 RAG 革命：开源 Embedding 模型兼顾速度与精度

Qwen 引领 RAG 革命：开源 Embedding 模型兼顾速度与精度

从检索到推理：企业AI中RAG之后的新篇章

从检索到推理：企业AI中RAG之后的新篇章

RAG 流程中的 Augmentation 技术详解：提升大模型生成质量的关键一步

RAG 流程中的 Augmentation 技术详解：提升大模型生成质量的关键一步

大模型 Prompt 工程的本质：从 “成为 (Be)” 到 “行动 (Do)” 的飞跃

构建 MCP 服务器：通往智能 AI 集成的指南

使用 Foundry Local 构建 Blazor 本地 AI 聊天应用：从 Ollama 到完全本地化

LangChain实战指南：基于Groq的极速LLM应用开发

AI Agent的记忆力：构建智能体的核心基石

You Missed

大模型 Prompt 工程的本质：从 “成为 (Be)” 到 “行动 (Do)” 的飞跃

大模型 Prompt 工程的本质：从 “成为 (Be)” 到 “行动 (Do)” 的飞跃

构建 MCP 服务器：通往智能 AI 集成的指南

构建 MCP 服务器：通往智能 AI 集成的指南

使用 Foundry Local 构建 Blazor 本地 AI 聊天应用：从 Ollama 到完全本地化

使用 Foundry Local 构建 Blazor 本地 AI 聊天应用：从 Ollama 到完全本地化

LangChain实战指南：基于Groq的极速LLM应用开发

LangChain实战指南：基于Groq的极速LLM应用开发