RAG

优化、评估与部署:打造高性能的检索增强生成(RAG)系统

构建基本的 RAG (Retrieval-Augmented Generation,检索增强生成) 流水线仅仅是开始。为了在规模化应用中提供准确、可信赖且响应迅速的答案,我们需要更先进的技术。本文将深入探讨 RAG 系统的优化、评估和部署,这些都是将优秀系统打造成卓越系统的关键。我们将着重介绍查询增强、元数据过滤、重排序等优化技术,组件级和端到端评估策略,以及延迟与准确性的权衡、缓存策略等部署技巧

LangChain学习笔记:从聊天模型到AI Agent的进阶之路

本文将分享我近几周来学习 LangChain 的心得体会,从基础的 聊天模型 构建,到复杂的 检索增强生成 (RAG) 系统 和 AI Agent 的实现,希望能为正在学习 LangChain 的朋友提供一些参考。LangChain 作为一个强大的框架,极大地简化了基于 大模型 的应用开发流程,让我们能够更高效地构建各种智能应用。 1. 从零开始:掌握 LangChain 聊天模型 我首先从 La

大模型时代的“炼金术”:合成数据生成关键方法解析

随着大型语言模型(LLMs)的飞速发展,数据短缺已成为制约其进一步突破的关键瓶颈。面对这一“数据困境”,合成数据生成技术应运而生,成为了训练 LLMs 的一种极具潜力的解决方案。本文将深入探讨用于训练 LLMs 的关键合成数据生成方法,包括基于提示的生成、模型蒸馏、自指令技术等。同时,我们还将考察诸如分类引导生成和检索增强生成 (RAG) 等结构化方法,以及使用差分隐私的保护隐私的方法。 1. 基

赋能智能体:检索增强生成 (RAG) 如何革新 Agentic AI

检索增强生成 (RAG) 技术正在成为 Agentic AI 领域的一项关键创新。它通过赋予大型语言模型 (LLM) 动态访问外部知识的能力,克服了 LLM 固有的知识局限性,使 AI 智能体能够生成更准确、相关和及时的信息。本文将深入探讨 RAG 的核心原理、在 Agentic AI 中的应用、以及其具体工作流程,并阐述 RAG 如何将 LLM 从静态知识的调用者转变为具备战略信息获取能力的智能

R3-RAG:强化学习赋能大模型,像侦探一样思考和检索

大语言模型(LLM)如ChatGPT、Claude和Llama正在改变我们与信息的交互方式,它们擅长生成文本、总结文档甚至编写代码。然而,一个主要的挑战是幻觉问题,即LLM有时会产生听起来合理但实际上不正确的信息。为了解决这个问题,检索增强生成(RAG)应运而生。而现在,一种名为R3-RAG的新框架,利用强化学习训练LLM,使其在RAG系统中拥有更强的逐步推理能力和动态检索能力,有望进一步提升LL

基于简历的RAG问答机器人:大模型赋能招聘新思路

当前招聘市场面临信息瓶颈,招聘人员难以快速从候选人的简历中提取关键信息。本文介绍了一个基于检索增强生成(RAG)和大语言模型(LLM)的问答机器人项目,该机器人能够根据指定的简历回答问题,如同一个阅读过你简历的私人助理,可以回答类似“Michael 掌握哪些编程语言?”或“他最近的职位是什么?”等HR风格的问题。该项目旨在解决传统问答系统依赖预训练知识,无法可靠地回答关于简历等私有或特定上下文文档

LegalSearchLM:大模型赋能法律检索,要素生成重塑判例发现

在法律科技(LegalTech)领域,法律判例检索(Legal Case Retrieval, LCR)一直是至关重要的环节,它直接关系到法律专家的工作效率和司法公正的维护。然而,传统判例检索方法在面对海量数据和复杂法律关系时,往往显得力不从心。近期,一项名为 LegalSearchLM 的创新研究,尝试以生成式检索的视角,将判例检索转化为法律要素生成问题,并构建了大规模的LEGAR BENCH基

大模型技术前沿:从RAG到自主Agent的演进与微调

随着大模型 (LLM) 技术的飞速发展,我们正步入一个全新的智能系统时代。这些模型正从静态、通用型的模式,向着动态、特定任务型的系统转变,具备了实时推理和自主行为的能力。这一变革的核心驱动力在于两项关键技术进步:检索增强生成 (RAG) 和 自主Agent 的涌现。本文将深入探讨这些技术,并对比传统RAG与图RAG系统,以及对Agent层级进行分类,同时也会涉及到对大模型进行微调的技术,以提升其在

基于 OpenAPI Schema、RAG 和 LLMs 的 API 自动化测试用例生成:Caseforge 的探索与实践

随着微服务架构的普及,API 端点的数量呈指数级增长,全面彻底地测试这些 API 的成本也随之水涨船高。即使存在 OpenAPI (Swagger) 规范,编写 API 测试用例仍然是一项手动、重复性的工作。那么,我们是否可以仅仅依靠 OpenAPI schema 自动生成有意义的 测试用例呢?近年来,大型语言模型 (LLMs) 的崛起为我们提供了一种新的可能性。本文将深入探讨如何结合 OpenA

RAG技术进阶:迈向2025的检索增强生成新纪元

检索增强生成(Retrieval-Augmented Generation,RAG)作为自然语言处理(NLP)和生成式人工智能领域的一项突破性技术,正日益受到关注。它巧妙地融合了信息检索与语言模型生成文本的能力,构建出更精确、更具时效性且更值得信赖的智能系统。本文将深入探讨塑造未来对话式AI、智能聊天机器人和语义搜索系统等领域的各种高级 RAG 技术,重点介绍纠正检索增强生成 (CRAG)、链式思