RAG Archives - Page 12 of 20

生产级RAG：构建快速、准确且安全的检索增强生成系统

llmtrend 2025年6月5日没有评论

检索增强生成（RAG）系统已成为大模型应用的热门方向。许多团队能够在短时间内搭建一个RAG演示系统，但当用户规模扩大，系统开始面临严峻挑战：延迟增加、召回率下降、幻觉问题频发，以及严格的安全审查导致部署停滞。本文将深入探讨一个可用于生产环境的RAG模式，解决这些痛点，涵盖完整的数据流，安全防护（Guardrails）机制、实时的评估闭环，并提供一份可复制的部署清单。 RAG系统架构：混合检索与重排

RAG

从零开始构建RAG：一种朴素但可扩展的方法（一）

llmtrend 2025年6月5日没有评论

检索增强生成 (Retrieval-Augmented Generation, RAG) 正迅速成为利用大型语言模型 (LLM) 的关键技术。与其让 LLM “凭空想象”答案，不如先为其提供相关的上下文信息，这正是 RAG 擅长的地方。本文将带领大家从零开始，构建一个朴素但可扩展的 RAG 系统，深入理解其核心原理，并避免过度依赖现有框架的抽象。 RAG：连接搜索系统与语言模型的桥梁 RAG 的核

AI Tools

LangSAM：自然语言赋能图像分割，开启计算机视觉新纪元

llmtrend 2025年6月5日没有评论

想象一下，只需用简单的文字描述，就能精准地分割图像中的任何物体——“分割红色的汽车”或者“识别穿蓝色衬衫的人”。这不再是科幻小说里的情节。得益于 LangSAM (Language Segment Anything Model)，这种能力现在通过 Replicate 的云平台向所有人开放，彻底革新了图像分割领域，引领计算机视觉走向新的高度。 LangSAM：突破性的技术融合 LangSAM

LLM

为开源大语言模型推理设计多区域灾难恢复方案

llmtrend 2025年6月5日没有评论

现代AI应用越来越依赖于强大的大语言模型（LLM）。随着LLaMA、Mistral等开源LLM进入生产环境，一个至关重要的问题浮出水面：如何保障推理流程的韧性？如何在基础设施故障时保持在线、快速和可靠？答案在于灾难恢复（DR）——特别是为LLM工作负载量身定制的多区域灾难恢复策略。本文将探讨开源LLM推理的独特挑战，并提供在GCP或AWS等云平台上构建多区域灾难恢复计划的实用蓝图。开源LLM灾难

RAG

纠正检索增强生成 (CRAG): 提升大模型问答质量的利器

llmtrend 2025年6月5日没有评论

大型语言模型 (LLM) 在文本生成方面表现出色，但由于其参数知识的局限性，不可避免地会出现幻觉现象，导致生成内容不准确。检索增强生成 (RAG) 是一种有效的补充方案，它通过检索相关文档来增强 LLM 的知识，从而提高生成质量。然而，RAG 的性能很大程度上依赖于检索文档的相关性，一旦检索出错，模型的表现就会受到影响。为了解决这个问题，纠正检索增强生成 (CRAG) 应运而生，它旨在提升 RAG

LLM

利用 Oracle Kubernetes Engine (OKE) 容器化部署 Gemma 3：性能、RAG 与实践指南

llmtrend 2025年6月4日没有评论

引言：拥抱开源大模型 Gemma 3 开源大语言模型 (LLM) 的蓬勃发展为各行各业带来了创新机遇。谷歌推出的 Gemma 系列模型，特别是最新的 Gemma 3，以其轻量级、多语言支持、多模态能力和量化模型等特性，在问答、摘要和推理方面表现出色，迅速成为 Ollama 上最受欢迎的模型之一。本文将深入探讨如何在 Oracle Kubernetes Engine (OKE) 上利用容器化技术部署

LLM

利用 Airflow 3.0 和 Airflow AI SDK 构建现实世界的 MLOps 应用，提升支持团队效率

llmtrend 2025年6月4日没有评论

本文将深入探讨如何利用 Airflow 3.0 及其强大的 Airflow AI SDK 构建一个现实世界的 MLOps 应用，旨在提升 Astronomer 支持团队的生产力。通过 Airflow 的强大调度能力，结合本地部署的 LLM，该应用能够识别与新提交的支持工单相关的历史工单，并提供相关信息，帮助工程师更高效地解决问题。这个案例展示了 Airflow 在 LLM 应用中的巨大潜力，以及如

RAG

大模型赋能科研：基于RAG和个性化角色模型的AI论文摘要器

llmtrend 2025年6月4日没有评论

人工智能（AI）和机器学习领域正以惊人的速度发展，如何快速掌握最新的研究成果，对每一个从业者都是一项挑战。面对浩如烟海的研究论文，即使是经验丰富的数据科学家和AI工程师，也需要花费大量时间才能理解其精髓。更重要的是，如何将这些复杂的概念，例如“Attention is All You Need”论文背后的Transformer架构及其如何催生了ChatGPT，向业务负责人或更广泛的受众解释清楚，则

RAG

如何用 RAG 技术让你的 AI 应用摆脱“人工智障”的称号？

llmtrend 2025年6月4日没有评论

你辛辛苦苦打造了一个 AI 聊天机器人，用 GPT 模型驱动，甚至还给它起了个响亮的名字。然而，用户体验却不尽如人意。机器人回答含糊不清，胡编乱造信息，仿佛从未阅读过你精心准备的文档。问题并非你的 AI 模型不够智能，而是它缺乏必要的连接——它需要一个“大脑升级”，而这个“大脑升级”就是 RAG，即检索增强生成 (Retrieval-Augmented Generation)。 RAG：AI 应

RAG

FinRAG：元数据驱动的金融分析智能AI，助力企业高效决策

llmtrend 2025年6月4日没有评论

金融报告浩如烟海，如何从中快速提取关键信息，进行深入分析，一直是金融从业者面临的挑战。传统的RAG（检索增强生成）技术在处理通用知识任务时表现出色，但在金融领域却显得力不从心。本文将深入探讨一种名为 FinRAG (Financial Retrieval-Augmented Generation) 的新型AI解决方案，它通过元数据驱动的检索方式，结合分层摘要和强大的语言模型，显著提升了金融分析

RAG

生产级RAG：构建快速、准确且安全的检索增强生成系统

生产级RAG：构建快速、准确且安全的检索增强生成系统

从零开始构建RAG：一种朴素但可扩展的方法（一）

从零开始构建RAG：一种朴素但可扩展的方法（一）

LangSAM：自然语言赋能图像分割，开启计算机视觉新纪元

LangSAM：自然语言赋能图像分割，开启计算机视觉新纪元

为开源大语言模型推理设计多区域灾难恢复方案

为开源大语言模型推理设计多区域灾难恢复方案

纠正检索增强生成 (CRAG): 提升大模型问答质量的利器

纠正检索增强生成 (CRAG): 提升大模型问答质量的利器

利用 Oracle Kubernetes Engine (OKE) 容器化部署 Gemma 3：性能、RAG 与实践指南

利用 Oracle Kubernetes Engine (OKE) 容器化部署 Gemma 3：性能、RAG 与实践指南

利用 Airflow 3.0 和 Airflow AI SDK 构建现实世界的 MLOps 应用，提升支持团队效率

利用 Airflow 3.0 和 Airflow AI SDK 构建现实世界的 MLOps 应用，提升支持团队效率

大模型赋能科研：基于RAG和个性化角色模型的AI论文摘要器

大模型赋能科研：基于RAG和个性化角色模型的AI论文摘要器

如何用 RAG 技术让你的 AI 应用摆脱“人工智障”的称号？

如何用 RAG 技术让你的 AI 应用摆脱“人工智障”的称号？

FinRAG：元数据驱动的金融分析智能AI，助力企业高效决策

FinRAG：元数据驱动的金融分析智能AI，助力企业高效决策

大模型时代：Prompt管理驯服AI巨兽，释放业务价值

如何将 ChatGPT 级别的智能融入你的 iOS 应用：上下文感知助手架构解析

大型语言模型（LLM）：技术革新、社会影响与未来展望

不用重新训练，大模型成本也能降 40%：Tokenizer（分词器）优化才是关键

欧盟的AI监管新战线：大模型会成为下一个“操作系统”吗？

You Missed

大模型时代：Prompt管理驯服AI巨兽，释放业务价值

大模型时代：Prompt管理驯服AI巨兽，释放业务价值

如何将 ChatGPT 级别的智能融入你的 iOS 应用：上下文感知助手架构解析

如何将 ChatGPT 级别的智能融入你的 iOS 应用：上下文感知助手架构解析

大型语言模型（LLM）：技术革新、社会影响与未来展望

大型语言模型（LLM）：技术革新、社会影响与未来展望

不用重新训练，大模型成本也能降 40%：Tokenizer（分词器）优化才是关键

不用重新训练，大模型成本也能降 40%：Tokenizer（分词器）优化才是关键