RAG Archives - Page 11 of 20

优化、评估与部署：打造高性能的检索增强生成（RAG）系统

llmtrend 2025年6月6日没有评论

构建基本的 RAG (Retrieval-Augmented Generation，检索增强生成) 流水线仅仅是开始。为了在规模化应用中提供准确、可信赖且响应迅速的答案，我们需要更先进的技术。本文将深入探讨 RAG 系统的优化、评估和部署，这些都是将优秀系统打造成卓越系统的关键。我们将着重介绍查询增强、元数据过滤、重排序等优化技术，组件级和端到端评估策略，以及延迟与准确性的权衡、缓存策略等部署技巧

LLM

LangChain学习笔记：从聊天模型到AI Agent的进阶之路

llmtrend 2025年6月6日没有评论

本文将分享我近几周来学习 LangChain 的心得体会，从基础的聊天模型构建，到复杂的检索增强生成 (RAG) 系统和 AI Agent 的实现，希望能为正在学习 LangChain 的朋友提供一些参考。LangChain 作为一个强大的框架，极大地简化了基于大模型的应用开发流程，让我们能够更高效地构建各种智能应用。 1. 从零开始：掌握 LangChain 聊天模型我首先从 La

LLM

大模型时代的“炼金术”：合成数据生成关键方法解析

llmtrend 2025年6月6日没有评论

随着大型语言模型（LLMs）的飞速发展，数据短缺已成为制约其进一步突破的关键瓶颈。面对这一“数据困境”，合成数据生成技术应运而生，成为了训练 LLMs 的一种极具潜力的解决方案。本文将深入探讨用于训练 LLMs 的关键合成数据生成方法，包括基于提示的生成、模型蒸馏、自指令技术等。同时，我们还将考察诸如分类引导生成和检索增强生成 (RAG) 等结构化方法，以及使用差分隐私的保护隐私的方法。 1. 基

RAG

赋能智能体：检索增强生成 (RAG) 如何革新 Agentic AI

llmtrend 2025年6月6日没有评论

检索增强生成 (RAG) 技术正在成为 Agentic AI 领域的一项关键创新。它通过赋予大型语言模型 (LLM) 动态访问外部知识的能力，克服了 LLM 固有的知识局限性，使 AI 智能体能够生成更准确、相关和及时的信息。本文将深入探讨 RAG 的核心原理、在 Agentic AI 中的应用、以及其具体工作流程，并阐述 RAG 如何将 LLM 从静态知识的调用者转变为具备战略信息获取能力的智能

RAG

R3-RAG：强化学习赋能大模型，像侦探一样思考和检索

llmtrend 2025年6月6日没有评论

大语言模型（LLM）如ChatGPT、Claude和Llama正在改变我们与信息的交互方式，它们擅长生成文本、总结文档甚至编写代码。然而，一个主要的挑战是幻觉问题，即LLM有时会产生听起来合理但实际上不正确的信息。为了解决这个问题，检索增强生成（RAG）应运而生。而现在，一种名为R3-RAG的新框架，利用强化学习训练LLM，使其在RAG系统中拥有更强的逐步推理能力和动态检索能力，有望进一步提升LL

RAG

基于简历的RAG问答机器人：大模型赋能招聘新思路

llmtrend 2025年6月5日没有评论

当前招聘市场面临信息瓶颈，招聘人员难以快速从候选人的简历中提取关键信息。本文介绍了一个基于检索增强生成（RAG）和大语言模型（LLM）的问答机器人项目，该机器人能够根据指定的简历回答问题，如同一个阅读过你简历的私人助理，可以回答类似“Michael 掌握哪些编程语言？”或“他最近的职位是什么？”等HR风格的问题。该项目旨在解决传统问答系统依赖预训练知识，无法可靠地回答关于简历等私有或特定上下文文档

LLM

LegalSearchLM：大模型赋能法律检索，要素生成重塑判例发现

llmtrend 2025年6月5日没有评论

在法律科技（LegalTech）领域，法律判例检索（Legal Case Retrieval, LCR）一直是至关重要的环节，它直接关系到法律专家的工作效率和司法公正的维护。然而，传统判例检索方法在面对海量数据和复杂法律关系时，往往显得力不从心。近期，一项名为 LegalSearchLM 的创新研究，尝试以生成式检索的视角，将判例检索转化为法律要素生成问题，并构建了大规模的LEGAR BENCH基

RAG

大模型技术前沿：从RAG到自主Agent的演进与微调

llmtrend 2025年6月5日没有评论

随着大模型 (LLM) 技术的飞速发展，我们正步入一个全新的智能系统时代。这些模型正从静态、通用型的模式，向着动态、特定任务型的系统转变，具备了实时推理和自主行为的能力。这一变革的核心驱动力在于两项关键技术进步：检索增强生成 (RAG) 和自主Agent 的涌现。本文将深入探讨这些技术，并对比传统RAG与图RAG系统，以及对Agent层级进行分类，同时也会涉及到对大模型进行微调的技术，以提升其在

RAG

基于 OpenAPI Schema、RAG 和 LLMs 的 API 自动化测试用例生成：Caseforge 的探索与实践

llmtrend 2025年6月5日没有评论

随着微服务架构的普及，API 端点的数量呈指数级增长，全面彻底地测试这些 API 的成本也随之水涨船高。即使存在 OpenAPI (Swagger) 规范，编写 API 测试用例仍然是一项手动、重复性的工作。那么，我们是否可以仅仅依靠 OpenAPI schema 自动生成有意义的测试用例呢？近年来，大型语言模型 (LLMs) 的崛起为我们提供了一种新的可能性。本文将深入探讨如何结合 OpenA

RAG

RAG技术进阶：迈向2025的检索增强生成新纪元

llmtrend 2025年6月5日没有评论

检索增强生成（Retrieval-Augmented Generation，RAG）作为自然语言处理（NLP）和生成式人工智能领域的一项突破性技术，正日益受到关注。它巧妙地融合了信息检索与语言模型生成文本的能力，构建出更精确、更具时效性且更值得信赖的智能系统。本文将深入探讨塑造未来对话式AI、智能聊天机器人和语义搜索系统等领域的各种高级 RAG 技术，重点介绍纠正检索增强生成 (CRAG)、链式思

RAG

优化、评估与部署：打造高性能的检索增强生成（RAG）系统

优化、评估与部署：打造高性能的检索增强生成（RAG）系统

LangChain学习笔记：从聊天模型到AI Agent的进阶之路

LangChain学习笔记：从聊天模型到AI Agent的进阶之路

大模型时代的“炼金术”：合成数据生成关键方法解析

大模型时代的“炼金术”：合成数据生成关键方法解析

赋能智能体：检索增强生成 (RAG) 如何革新 Agentic AI

赋能智能体：检索增强生成 (RAG) 如何革新 Agentic AI

R3-RAG：强化学习赋能大模型，像侦探一样思考和检索

R3-RAG：强化学习赋能大模型，像侦探一样思考和检索

基于简历的RAG问答机器人：大模型赋能招聘新思路

基于简历的RAG问答机器人：大模型赋能招聘新思路

LegalSearchLM：大模型赋能法律检索，要素生成重塑判例发现

LegalSearchLM：大模型赋能法律检索，要素生成重塑判例发现

大模型技术前沿：从RAG到自主Agent的演进与微调

大模型技术前沿：从RAG到自主Agent的演进与微调

基于 OpenAPI Schema、RAG 和 LLMs 的 API 自动化测试用例生成：Caseforge 的探索与实践

基于 OpenAPI Schema、RAG 和 LLMs 的 API 自动化测试用例生成：Caseforge 的探索与实践

RAG技术进阶：迈向2025的检索增强生成新纪元

RAG技术进阶：迈向2025的检索增强生成新纪元

大模型时代：Prompt管理驯服AI巨兽，释放业务价值

如何将 ChatGPT 级别的智能融入你的 iOS 应用：上下文感知助手架构解析

大型语言模型（LLM）：技术革新、社会影响与未来展望

不用重新训练，大模型成本也能降 40%：Tokenizer（分词器）优化才是关键

欧盟的AI监管新战线：大模型会成为下一个“操作系统”吗？

You Missed

大模型时代：Prompt管理驯服AI巨兽，释放业务价值

大模型时代：Prompt管理驯服AI巨兽，释放业务价值

如何将 ChatGPT 级别的智能融入你的 iOS 应用：上下文感知助手架构解析

如何将 ChatGPT 级别的智能融入你的 iOS 应用：上下文感知助手架构解析

大型语言模型（LLM）：技术革新、社会影响与未来展望

大型语言模型（LLM）：技术革新、社会影响与未来展望

不用重新训练，大模型成本也能降 40%：Tokenizer（分词器）优化才是关键

不用重新训练，大模型成本也能降 40%：Tokenizer（分词器）优化才是关键