RAG Archives - Page 4 of 12

突破炒作迷雾：利用RAG、MongoDB Atlas与Google Cloud构建真实世界的上下文感知AI

llmtrend 2025年6月7日没有评论

大模型（LLM）技术浪潮席卷全球，但我们必须穿透表面的炒作，直面其固有的局限性：知识停留在训练截止日期，无法访问企业专属数据。这使得检索增强生成（RAG）技术变得至关重要。本文将深入探讨如何利用 RAG 、MongoDB Atlas Vector Search 和 Google Cloud 构建真正具备上下文感知能力的AI应用，并结合实际案例，阐述其在数据敏感领域（如医疗IT）的巨大价值。检

RAG

解锁高级 RAG 的力量：构建下一代 RAG 系统的实战指南

llmtrend 2025年6月7日没有评论

生成式人工智能（Generative AI）的创新步伐正在加速，而检索增强生成（RAG）正处于这场变革的最前沿。与仅依赖静态、预训练知识的传统语言模型不同，RAG 系统引入了一项关键能力：从外部知识源进行动态、实时检索。本文将深入剖析高级 RAG 系统的架构、优化技术和部署策略，帮助你构建领域自适应、可扩展且值得信赖的 AI 解决方案。什么是检索增强生成（RAG）？ RAG 的核心是一种混合架构

RAG

零代码构建RAG聊天机器人：BladePipe + OpenAI实战指南

llmtrend 2025年6月7日没有评论

在AI大模型时代，如何将企业内部知识库与强大的语言模型相结合，打造智能问答系统？本文将带您深入了解如何利用 BladePipe 数据集成平台和 OpenAI，零代码构建基于 RAG (Retrieval-Augmented Generation) 架构的聊天机器人。通过两个简单的 DataJob，您就能拥有自己的RAG服务，无需编写任何代码！ RAG：连接知识与智能的关键桥梁 RAG，即检索增强生

RAG

企业级Chatbot的进阶之路：检索增强生成(RAG)技术深度解析

llmtrend 2025年6月7日没有评论

2024-2025年，基于大型语言模型(LLM)的Chatbot应用已经无处不在，然而，在看似智能的对话背后，准确性问题却日益凸显。虽然诸如ChatGPT和Gemini这样的模型能够生成流畅且类人的回复，但在处理企业特定的或实时信息时，它们往往表现得不够准确。为了解决这个问题，检索增强生成(RAG) 技术应运而生，它正帮助企业构建更智能、更上下文感知的Chatbot，实现规模化应用。本文将深入探讨

RAG

大模型与向量数据库：语义搜索、RAG及视觉语言模型的关键基础设施

llmtrend 2025年6月6日没有评论

随着大型语言模型（LLM）和视觉语言模型（VLM）不断突破人工智能的边界，高效的数据管理系统变得至关重要。向量数据库作为一种专门设计用于处理高维嵌入的数据库，正在这个生态系统中扮演着核心角色，尤其是在语义搜索、推荐系统和检索增强生成（RAG）等应用中。本文将深入探讨LLM/VLM与向量数据库之间的数据流动，剖析其方法论、优势、局限性，并对Milvus、FAISS、Weaviate和Pinecone

RAG

RAG：检索增强生成如何赋能大模型，让AI更懂你？

llmtrend 2025年6月6日没有评论

人工智能和大语言模型（LLM）正以前所未有的速度发展，在解决数学难题、创作引人入胜的故事，甚至生成精美图像方面展现出惊人的能力。然而，这些模型也存在固有的局限性。例如，当我们向一个LLM询问公司上个月的销售报告时，它往往无法给出答案。核心问题在于，尽管LLM拥有数十亿的参数，但它们所掌握的知识受限于训练数据及其时间范围。为了克服这一难题， RAG（Retrieval-Augmented Gener

RAG

大模型时代 RAG Agent 代码测试：无需真实 LLM 或向量数据库的单元测试指南

llmtrend 2025年6月6日没有评论

在大模型驱动的软件开发中，测试至关重要。传统的软件测试侧重于代码的“单元”，即单元测试。然而，对于生成式 AI 应用，特别是涉及RAG Agent (检索增强生成代理) 的应用，传统的测试方法面临挑战。本文将深入探讨如何针对 RAG Agent 进行代码测试，即使没有真实的LLM（大型语言模型）或向量数据库也能进行有效的单元测试，确保代码质量和可靠性。引言：大模型时代的测试挑战传统的软件测试通

RAG

大模型时代 RAG 应用的 “无 LLM” 代码测试指南：告别高昂成本，拥抱高效 Mock

llmtrend 2025年6月6日没有评论

在大模型技术蓬勃发展的今天，构建基于检索增强生成 (RAG) 的应用变得越来越普遍。然而，传统的软件测试方法在面对 RAG 应用时常常显得力不从心。由于 LLM 的随机性以及调用真实 LLM 和向量数据库的高昂成本，我们急需一种新的代码测试策略。本文将深入探讨如何在不依赖真实 LLM 或向量数据库的情况下，对 RAG 应用进行有效的代码测试，通过 Mock 技术构建 “纸上谈兵” 的环境

RAG

优化、评估与部署：打造高性能的检索增强生成（RAG）系统

llmtrend 2025年6月6日没有评论

构建基本的 RAG (Retrieval-Augmented Generation，检索增强生成) 流水线仅仅是开始。为了在规模化应用中提供准确、可信赖且响应迅速的答案，我们需要更先进的技术。本文将深入探讨 RAG 系统的优化、评估和部署，这些都是将优秀系统打造成卓越系统的关键。我们将着重介绍查询增强、元数据过滤、重排序等优化技术，组件级和端到端评估策略，以及延迟与准确性的权衡、缓存策略等部署技巧

RAG

从零构建RAG：一个朴素但可扩展的方案（二）：利用最佳设计模式集成大语言模型

llmtrend 2025年6月6日没有评论

引言：大语言模型（LLM）在RAG系统中的核心作用与框架的模块化设计检索增强生成（Retrieval-Augmented Generation，简称RAG）系统背后的核心驱动力毫无疑问是大语言模型（LLM）。随着OpenAI、Cohere、HuggingFace、DeepSeek等厂商不断推陈出新，LLM 技术日新月异。然而，频繁更换供应商或进行实验，却往往需要重写大量核心逻辑，这无疑增加了开发

RAG

突破炒作迷雾：利用RAG、MongoDB Atlas与Google Cloud构建真实世界的上下文感知AI

突破炒作迷雾：利用RAG、MongoDB Atlas与Google Cloud构建真实世界的上下文感知AI

解锁高级 RAG 的力量：构建下一代 RAG 系统的实战指南

解锁高级 RAG 的力量：构建下一代 RAG 系统的实战指南

零代码构建RAG聊天机器人：BladePipe + OpenAI实战指南

企业级Chatbot的进阶之路：检索增强生成(RAG)技术深度解析

企业级Chatbot的进阶之路：检索增强生成(RAG)技术深度解析

大模型与向量数据库：语义搜索、RAG及视觉语言模型的关键基础设施

大模型与向量数据库：语义搜索、RAG及视觉语言模型的关键基础设施

RAG：检索增强生成如何赋能大模型，让AI更懂你？

RAG：检索增强生成如何赋能大模型，让AI更懂你？

大模型时代 RAG Agent 代码测试：无需真实 LLM 或向量数据库的单元测试指南

大模型时代 RAG Agent 代码测试：无需真实 LLM 或向量数据库的单元测试指南

大模型时代 RAG 应用的 “无 LLM” 代码测试指南：告别高昂成本，拥抱高效 Mock

大模型时代 RAG 应用的 “无 LLM” 代码测试指南：告别高昂成本，拥抱高效 Mock

优化、评估与部署：打造高性能的检索增强生成（RAG）系统

优化、评估与部署：打造高性能的检索增强生成（RAG）系统

从零构建RAG：一个朴素但可扩展的方案（二）：利用最佳设计模式集成大语言模型

从零构建RAG：一个朴素但可扩展的方案（二）：利用最佳设计模式集成大语言模型

大型语言模型 (LLM)：原理、应用与实践指南

2025年大模型前沿架构：量化创新深度解析

基于FastAPI与RAG的电商智能聊天机器人：从入门到实践

LLM赋能：一个Spring Boot应用如何替代五个微服务API？

大模型推理的幻觉：Apple揭示AI“思考”的局限性

You Missed

大型语言模型 (LLM)：原理、应用与实践指南

大型语言模型 (LLM)：原理、应用与实践指南

2025年大模型前沿架构：量化创新深度解析

2025年大模型前沿架构：量化创新深度解析

基于FastAPI与RAG的电商智能聊天机器人：从入门到实践

基于FastAPI与RAG的电商智能聊天机器人：从入门到实践

LLM赋能：一个Spring Boot应用如何替代五个微服务API？

LLM赋能：一个Spring Boot应用如何替代五个微服务API？