RAG Archives - Page 3 of 12

从传统到智能：RAG架构的演进之路

llmtrend 2025年6月9日没有评论

检索增强生成 (RAG) 技术正日益成为现代人工智能应用的核心。本文将深入探讨 RAG 的演进，从传统的 RAG 系统到更复杂的 Agentic RAG 方法，旨在帮助读者理解这两种范式的区别，并根据实际需求选择合适的 RAG 架构。随着大模型技术的快速发展，RAG架构也在不断演进，以满足更加复杂和多样化的应用场景。 1. RAG 技术：知识获取与生成的桥梁 RAG 技术的核心在于结合大型语言

RAG

从零开始构建 RAG：一个朴素但可扩展的方法（四）—— 向量数据库的艺术

llmtrend 2025年6月8日没有评论

引言：向量数据库在 RAG 系统中的关键角色在前几篇文章中，我们已经构建了一个基本的 RAG (Retrieval-Augmented Generation) 流水线，设计了一个可扩展的 LLM (大型语言模型) 接口，并对文档进行了清晰的解析和分块。现在，是时候将这些数据块存储起来，以便在需要时检索它们了。这就是向量数据库的用武之地。向量数据库是 RAG 系统的记忆核心，负责存储分块的文档，并

RAG

大模型RAG应用成本优化：策略、技巧与最佳实践

llmtrend 2025年6月8日没有评论

随着企业对大模型（LLM）推理应用的日益依赖，尤其是通过RAG（Retrieval Augmented Generation，检索增强生成）系统将上下文知识与基础模型相结合来执行任务，成本优化变得至关重要。本文深入探讨RAG应用中处理时间优化、成本管理和Token利用率等关键维度的优化策略，旨在帮助企业在保证性能的前提下，显著降低运营成本。 1. 场景适用性评估：LLM真的是最优解吗？在盲目采用

RAG

如何用 LangChain、FAISS 和 Hugging Face 构建一个智能主题公园助手：告别幻觉的 RAG 实战

llmtrend 2025年6月8日没有评论

你是否曾经渴望过一个能够准确回答问题，避免胡编乱造的主题公园助手？本文将带你了解如何利用 LangChain、FAISS 和 Hugging Face 构建一个基于 RAG (Retrieval-Augmented Generation) 的智能助手，打造一个没有“幻觉”的可靠问答系统。通过本文，你将了解到如何结合这些强大的工具，创建一个能够自信地说“我不知道”，而不是给出错误信息的智能助手。 R

RAG

Qwen 引领 RAG 革命：开源 Embedding 模型兼顾速度与精度

llmtrend 2025年6月8日没有评论

在大型语言模型（LLM）的浪潮中，人们往往追逐最新的、最闪耀的技术。然而，一个更为实用且强大的技术正在悄然兴起，它就是文本 embedding 模型。如果你正在构建检索增强生成（RAG）系统、语义搜索或者任何需要深入理解文本的应用，那么 Qwen 开源的 embedding 模型将为你带来革命性的改变，尤其是在掌控力、速度和避免供应商锁定方面。被锁定的困境：专有 Embedding 模型的挑战

RAG

从检索到推理：企业AI中RAG之后的新篇章

llmtrend 2025年6月8日没有评论

在日新月异的数据科学领域，人工智能（AI）的创新层出不穷。本文将深入探讨企业AI工作流程中一种日益显著的转变：从检索增强生成（RAG）到推理增强型AI，或可称为RAG++。这不仅仅是术语上的更迭，更代表着构建AI系统的根本性变革，即AI不仅能够获取信息，更能真正地思考和理解信息。什么是RAG？回顾检索增强生成的核心概念检索增强生成（RAG）是一种有效的模式，它避免了将所有数据一股脑地输入语言

RAG

RAG 流程中的 Augmentation 技术详解：提升大模型生成质量的关键一步

llmtrend 2025年6月8日没有评论

在构建基于 Retrieval-Augmented Generation (RAG) 的大模型应用中，信息检索 (Retrieval) 是基础，而 Augmentation（增强）则是将检索到的外部知识融入大模型上下文，提升生成内容质量的关键步骤。本文将深入探讨 RAG 流程中 Augmentation 阶段的核心技术，帮助读者理解并掌握如何有效利用外部知识增强大模型的生成能力。我们将结合实际案例

RAG

本地LLM vs 云端LLM：RAG应用中如何保护你的敏感数据？

llmtrend 2025年6月8日没有评论

在构建基于检索增强生成（RAG）的AI应用时，数据隐私和AI安全是至关重要的考量因素。你是否真正了解你正在使用的LLM（大型语言模型）是运行在本地还是云端？选择不当可能会导致敏感信息泄露。本文将深入探讨本地LLM和云端LLM的区别，以及如何在RAG架构中保护你的机密数据。 1. RAG与LLM：理解风险的根源 RAG（Retrieval-Augmented Generation）是一种结合了信息检

RAG

超越炒作：利用 RAG、MongoDB Atlas 和 Google Cloud 构建现实世界的上下文感知 AI

llmtrend 2025年6月8日没有评论

大型语言模型（LLM）正在重塑各行各业，但其固有的局限性，即知识停留在上次训练运行的时间点，以及缺乏访问特定数据的能力，限制了其在实际应用中的潜力。本文将深入探讨如何利用检索增强生成（RAG）、MongoDB Atlas Vector Search 和 Google Cloud 构建真正具有上下文感知能力的 AI 系统，并以医疗 IT 领域为例，展示其在数据敏感领域的应用前景。 RAG：弥合 LL

RAG

大模型时代AI工程师实习记：AsiaPac Technologies的创新之旅

llmtrend 2025年6月8日没有评论

随着人工智能技术的飞速发展，大模型正日益渗透到各行各业，对AI工程师的需求也与日俱增。本文将以一位SMU MITB人工智能方向学生在AsiaPac Technologies（一家新加坡ICT解决方案提供商）担任AI工程师实习生的经历为蓝本，深入探讨实习期间的挑战、收获以及对未来的展望。这段从2025年1月到6月的实习经历，不仅让笔者亲身体验了大模型在实际应用中的潜力，也为其未来的职业生涯奠定了坚实

RAG

从传统到智能：RAG架构的演进之路

从传统到智能：RAG架构的演进之路

从零开始构建 RAG：一个朴素但可扩展的方法（四）—— 向量数据库的艺术

从零开始构建 RAG：一个朴素但可扩展的方法（四）—— 向量数据库的艺术

大模型RAG应用成本优化：策略、技巧与最佳实践

大模型RAG应用成本优化：策略、技巧与最佳实践

如何用 LangChain、FAISS 和 Hugging Face 构建一个智能主题公园助手：告别幻觉的 RAG 实战

如何用 LangChain、FAISS 和 Hugging Face 构建一个智能主题公园助手：告别幻觉的 RAG 实战

Qwen 引领 RAG 革命：开源 Embedding 模型兼顾速度与精度

Qwen 引领 RAG 革命：开源 Embedding 模型兼顾速度与精度

从检索到推理：企业AI中RAG之后的新篇章

从检索到推理：企业AI中RAG之后的新篇章

RAG 流程中的 Augmentation 技术详解：提升大模型生成质量的关键一步

RAG 流程中的 Augmentation 技术详解：提升大模型生成质量的关键一步

本地LLM vs 云端LLM：RAG应用中如何保护你的敏感数据？

本地LLM vs 云端LLM：RAG应用中如何保护你的敏感数据？

超越炒作：利用 RAG、MongoDB Atlas 和 Google Cloud 构建现实世界的上下文感知 AI

超越炒作：利用 RAG、MongoDB Atlas 和 Google Cloud 构建现实世界的上下文感知 AI

大模型时代AI工程师实习记：AsiaPac Technologies的创新之旅

大模型时代AI工程师实习记：AsiaPac Technologies的创新之旅

大型语言模型 (LLM)：原理、应用与实践指南

2025年大模型前沿架构：量化创新深度解析

基于FastAPI与RAG的电商智能聊天机器人：从入门到实践

LLM赋能：一个Spring Boot应用如何替代五个微服务API？

大模型推理的幻觉：Apple揭示AI“思考”的局限性

You Missed

大型语言模型 (LLM)：原理、应用与实践指南

大型语言模型 (LLM)：原理、应用与实践指南

2025年大模型前沿架构：量化创新深度解析

2025年大模型前沿架构：量化创新深度解析

基于FastAPI与RAG的电商智能聊天机器人：从入门到实践

基于FastAPI与RAG的电商智能聊天机器人：从入门到实践

LLM赋能：一个Spring Boot应用如何替代五个微服务API？

LLM赋能：一个Spring Boot应用如何替代五个微服务API？