RAG Archives - LLM TREND

打造智能RAG系统的必备工具：从知识库到大语言模型（LLM）

llmtrend 2025年6月13日没有评论

在人工智能领域，检索增强生成（RAG）系统正变得日益重要。它巧妙地结合了信息检索的精确性和自然语言生成的流畅性，使得智能助手，如客户服务聊天机器人，变得更加可靠和知识渊博。本文将深入探讨构建一个强大的RAG系统所需的关键工具，从知识库的构建到文档嵌入，再到向量数据库的选择和大语言模型（LLM）的应用，以及对话管理和流程编排，帮助你了解如何利用这些工具打造属于你的AI系统。 1. 知识库：RAG系统

RAG

检索增强分类：大模型时代文本分类的新范式

llmtrend 2025年6月13日没有评论

在大模型技术日新月异的今天，文本分类作为自然语言处理领域的基础且关键的应用，正迎来新的变革。从过滤垃圾邮件、识别产品类别，到理解聊天机器人中的用户意图，文本分类无处不在。传统方法依赖于大量标注数据训练定制化的机器学习模型，而大模型的出现，使得零样本或少样本分类成为可能，极大地缩短了服务部署时间。然而，这种方法的准确性往往低于定制模型，且高度依赖于精巧的提示工程。本文将深入探讨一种名为检索增强分类

RAG

离线环境下基于大模型的安全Text-to-SQL：ChromaDB与RAG管道的深度实践

llmtrend 2025年6月12日没有评论

在大模型技术日新月异的今天，如何让其更准确、更及时地响应用户的查询需求，并结合外部知识提供更符合语境的答案，成为了一个重要的研究方向。检索增强生成 (Retrieval Augmented Generation, RAG) 管道正在革新大模型与外部知识交互的方式。本文将深入探讨如何在离线环境（air-gapped environment）下，利用ChromaDB向量数据库构建安全的RAG管道，实现

RAG

利用Docling SDG释放AI全部潜力：合成数据生成的力量

llmtrend 2025年6月12日没有评论

在生成式AI快速发展的今天，对高质量、多样化的训练数据的需求是无限的。然而，获取和标注大量的真实世界数据，往往耗时、昂贵，且涉及隐私问题。在这种背景下，合成数据生成 (SDG) 作为一种变革性的解决方案应运而生。本文将深入探讨如何利用Docling for Synthetic Data Generation (SDG)，通过从现有文档中直接创建人工数据，无缝地利用先进的生成式AI模型以及Docli

RAG

向量索引：让大模型搜索如闪电般快速

llmtrend 2025年6月12日没有评论

在如今数据爆炸的时代，搜索正面临着前所未有的挑战。想象一下，你正在运营一个拥有上亿首歌曲的在线音乐平台，当用户搜索“充满活力的健身音乐”时，如果没有合适的索引技术，系统将不得不逐一检查每一首歌曲，计算搜索查询与每首歌曲之间的相似度，并对结果进行排序以找到最佳匹配。这可能需要长达30秒的时间，严重影响用户体验。向量索引技术的出现，正是为了解决这一问题，它如同一个智能的文件系统，能够极大地提升大模型搜

RAG

利用 FAISS 和 Chroma 评估检索增强聊天机器人中的大语言模型：性能、成本与可部署性深度解析

llmtrend 2025年6月12日没有评论

在构建智能、上下文感知的应用程序（如聊天机器人）时，检索增强生成 (RAG) 工作流程至关重要。它依赖于有效的向量数据库来存储文档的语义表示，并快速检索相关信息。本文将深入探讨如何结合 FAISS 和 Chroma 这两个向量数据库，并结合不同的大语言模型 (LLM)，包括 OpenAI 的 GPT-4o-mini、本地 Ollama 运行的 Llama3.2 以及 Hugging Face 的

RAG

利用Amazon Kendra和Bedrock构建RAG（检索增强生成）系统的实践指南

llmtrend 2025年6月12日没有评论

在人工智能和自然语言处理领域，RAG（检索增强生成）已成为一个颠覆性的技术。它巧妙地融合了大型语言模型的强大能力和精准的信息检索技术，从而生成更准确、更符合上下文语境的AI响应。本文将深入探讨如何利用 Amazon Kendra 和 Amazon Bedrock 搭建 RAG 系统，助力企业提升 AI 应用的智能化水平。 RAG：融合检索与生成的创新范式 RAG（检索增强生成）的核心在于结合了信息

RAG

利用RAG和LLM加速BI报表搜索：提升数据洞察效率

llmtrend 2025年6月12日没有评论

在当今数据驱动的商业环境中，企业内BI(Business Intelligence)报表的数量不断增长。如何帮助用户快速找到所需信息，成为了提升数据洞察效率的关键。本文将深入探讨如何利用 RAG (Retrieval-Augmented Generation，检索增强生成) 和 LLM (Large Language Model，大型语言模型) 技术，构建更智能、更高效的 BI 报表搜索系统。通过

RAG

两步构建：使用 Agno 框架轻松实现 RAG 智能 Agent

llmtrend 2025年6月10日没有评论

你是否也曾觉得 RAG (Retrieval-Augmented Generation，检索增强生成) 听起来像来自异世界的技术？本文将带你揭开 RAG 的神秘面纱，并通过 Agno 框架，用两个简单的步骤构建一个能够回答 PDF 文件相关问题的智能 Agent。这个 Agent 的核心在于能够通过检索特定信息来增强 LLM 的生成能力，从而提升问答的准确性和可靠性。 RAG：为 LLM

RAG

利用RAG技术赋能学习：大模型时代的个性化笔记管理与知识交互

llmtrend 2025年6月10日没有评论

随着大模型技术的日益成熟，如何高效地利用这些强大的工具来提升学习效率，成为了一个重要的课题。本文将探讨如何运用RAG（Retrieval-Augmented Generation，检索增强生成）技术，结合LLM（Large Language Model，大型语言模型）与向量数据库，构建一个智能的笔记管理系统，实现个性化的知识交互，解决类似于文中女儿面临的笔记管理难题。核心挑战：海量笔记的管理与L

RAG

打造智能RAG系统的必备工具：从知识库到大语言模型（LLM）

打造智能RAG系统的必备工具：从知识库到大语言模型（LLM）

检索增强分类：大模型时代文本分类的新范式

检索增强分类：大模型时代文本分类的新范式

离线环境下基于大模型的安全Text-to-SQL：ChromaDB与RAG管道的深度实践

离线环境下基于大模型的安全Text-to-SQL：ChromaDB与RAG管道的深度实践

利用Docling SDG释放AI全部潜力：合成数据生成的力量

利用Docling SDG释放AI全部潜力：合成数据生成的力量

向量索引：让大模型搜索如闪电般快速

向量索引：让大模型搜索如闪电般快速

利用 FAISS 和 Chroma 评估检索增强聊天机器人中的大语言模型：性能、成本与可部署性深度解析

利用 FAISS 和 Chroma 评估检索增强聊天机器人中的大语言模型：性能、成本与可部署性深度解析

利用Amazon Kendra和Bedrock构建RAG（检索增强生成）系统的实践指南

利用Amazon Kendra和Bedrock构建RAG（检索增强生成）系统的实践指南

利用RAG和LLM加速BI报表搜索：提升数据洞察效率

利用RAG和LLM加速BI报表搜索：提升数据洞察效率

两步构建：使用 Agno 框架轻松实现 RAG 智能 Agent

两步构建：使用 Agno 框架轻松实现 RAG 智能 Agent

利用RAG技术赋能学习：大模型时代的个性化笔记管理与知识交互

利用RAG技术赋能学习：大模型时代的个性化笔记管理与知识交互

从预训练到策略优化：大型语言模型 (LLM) 如何实现与人类意图对齐

Spring AI赋能：利用工具调用（Tool Calling）构建更强大的大语言模型应用

2025年值得关注的五大 Agentic AI框架：迎接自主智能新时代

本地部署 DeepSeek-R1：使用 Ollama 轻松驾驭大模型

You Missed

从预训练到策略优化：大型语言模型 (LLM) 如何实现与人类意图对齐

从预训练到策略优化：大型语言模型 (LLM) 如何实现与人类意图对齐

Spring AI赋能：利用工具调用（Tool Calling）构建更强大的大语言模型应用

Spring AI赋能：利用工具调用（Tool Calling）构建更强大的大语言模型应用

AI 内容捷径：为什么过度依赖 AI 写作会损害你的 WordPress 网站 SEO？

2025年值得关注的五大 Agentic AI框架：迎接自主智能新时代

2025年值得关注的五大 Agentic AI框架：迎接自主智能新时代