RAG

从传统到智能:RAG架构的演进之路

检索增强生成 (RAG) 技术正日益成为现代人工智能应用的核心。本文将深入探讨 RAG 的演进,从传统的 RAG 系统 到更复杂的 Agentic RAG 方法,旨在帮助读者理解这两种范式的区别,并根据实际需求选择合适的 RAG 架构。随着大模型技术的快速发展,RAG架构也在不断演进,以满足更加复杂和多样化的应用场景。 1. RAG 技术:知识获取与生成的桥梁 RAG 技术 的核心在于结合大型语言

从零开始构建 RAG:一个朴素但可扩展的方法(四)—— 向量数据库的艺术

引言:向量数据库在 RAG 系统中的关键角色 在前几篇文章中,我们已经构建了一个基本的 RAG (Retrieval-Augmented Generation) 流水线,设计了一个可扩展的 LLM (大型语言模型) 接口,并对文档进行了清晰的解析和分块。现在,是时候将这些数据块存储起来,以便在需要时检索它们了。这就是向量数据库的用武之地。向量数据库是 RAG 系统的记忆核心,负责存储分块的文档,并

大模型RAG应用成本优化:策略、技巧与最佳实践

随着企业对大模型(LLM)推理应用的日益依赖,尤其是通过RAG(Retrieval Augmented Generation,检索增强生成)系统将上下文知识与基础模型相结合来执行任务,成本优化变得至关重要。本文深入探讨RAG应用中处理时间优化、成本管理和Token利用率等关键维度的优化策略,旨在帮助企业在保证性能的前提下,显著降低运营成本。 1. 场景适用性评估:LLM真的是最优解吗? 在盲目采用

如何用 LangChain、FAISS 和 Hugging Face 构建一个智能主题公园助手:告别幻觉的 RAG 实战

你是否曾经渴望过一个能够准确回答问题,避免胡编乱造的主题公园助手?本文将带你了解如何利用 LangChain、FAISS 和 Hugging Face 构建一个基于 RAG (Retrieval-Augmented Generation) 的智能助手,打造一个没有“幻觉”的可靠问答系统。通过本文,你将了解到如何结合这些强大的工具,创建一个能够自信地说“我不知道”,而不是给出错误信息的智能助手。 R

Qwen 引领 RAG 革命:开源 Embedding 模型兼顾速度与精度

在大型语言模型(LLM)的浪潮中,人们往往追逐最新的、最闪耀的技术。然而,一个更为实用且强大的技术正在悄然兴起,它就是文本 embedding 模型。如果你正在构建检索增强生成(RAG)系统、语义搜索或者任何需要深入理解文本的应用,那么 Qwen 开源的 embedding 模型将为你带来革命性的改变,尤其是在掌控力、速度和避免供应商锁定方面。 被锁定的困境:专有 Embedding 模型的挑战

从检索到推理:企业AI中RAG之后的新篇章

在日新月异的数据科学领域,人工智能(AI)的创新层出不穷。本文将深入探讨企业AI工作流程中一种日益显著的转变:从检索增强生成(RAG)到推理增强型AI,或可称为RAG++。这不仅仅是术语上的更迭,更代表着构建AI系统的根本性变革,即AI不仅能够获取信息,更能真正地思考和理解信息。 什么是RAG?回顾检索增强生成的核心概念 检索增强生成(RAG) 是一种有效的模式,它避免了将所有数据一股脑地输入语言

RAG 流程中的 Augmentation 技术详解:提升大模型生成质量的关键一步

在构建基于 Retrieval-Augmented Generation (RAG) 的大模型应用中,信息检索 (Retrieval) 是基础,而 Augmentation(增强)则是将检索到的外部知识融入大模型上下文,提升生成内容质量的关键步骤。本文将深入探讨 RAG 流程中 Augmentation 阶段的核心技术,帮助读者理解并掌握如何有效利用外部知识增强大模型的生成能力。我们将结合实际案例

本地LLM vs 云端LLM:RAG应用中如何保护你的敏感数据?

在构建基于检索增强生成(RAG)的AI应用时,数据隐私和AI安全是至关重要的考量因素。你是否真正了解你正在使用的LLM(大型语言模型)是运行在本地还是云端?选择不当可能会导致敏感信息泄露。本文将深入探讨本地LLM和云端LLM的区别,以及如何在RAG架构中保护你的机密数据。 1. RAG与LLM:理解风险的根源 RAG(Retrieval-Augmented Generation)是一种结合了信息检

超越炒作:利用 RAG、MongoDB Atlas 和 Google Cloud 构建现实世界的上下文感知 AI

大型语言模型(LLM)正在重塑各行各业,但其固有的局限性,即知识停留在上次训练运行的时间点,以及缺乏访问特定数据的能力,限制了其在实际应用中的潜力。本文将深入探讨如何利用检索增强生成(RAG)、MongoDB Atlas Vector Search 和 Google Cloud 构建真正具有上下文感知能力的 AI 系统,并以医疗 IT 领域为例,展示其在数据敏感领域的应用前景。 RAG:弥合 LL

大模型时代AI工程师实习记:AsiaPac Technologies的创新之旅

随着人工智能技术的飞速发展,大模型正日益渗透到各行各业,对AI工程师的需求也与日俱增。本文将以一位SMU MITB人工智能方向学生在AsiaPac Technologies(一家新加坡ICT解决方案提供商)担任AI工程师实习生的经历为蓝本,深入探讨实习期间的挑战、收获以及对未来的展望。这段从2025年1月到6月的实习经历,不仅让笔者亲身体验了大模型在实际应用中的潜力,也为其未来的职业生涯奠定了坚实