RAG

赋能智能体:检索增强生成 (RAG) 如何革新 Agentic AI

检索增强生成 (RAG) 技术正在成为 Agentic AI 领域的一项关键创新。它通过赋予大型语言模型 (LLM) 动态访问外部知识的能力,克服了 LLM 固有的知识局限性,使 AI 智能体能够生成更准确、相关和及时的信息。本文将深入探讨 RAG 的核心原理、在 Agentic AI 中的应用、以及其具体工作流程,并阐述 RAG 如何将 LLM 从静态知识的调用者转变为具备战略信息获取能力的智能

R3-RAG:强化学习赋能大模型,像侦探一样思考和检索

大语言模型(LLM)如ChatGPT、Claude和Llama正在改变我们与信息的交互方式,它们擅长生成文本、总结文档甚至编写代码。然而,一个主要的挑战是幻觉问题,即LLM有时会产生听起来合理但实际上不正确的信息。为了解决这个问题,检索增强生成(RAG)应运而生。而现在,一种名为R3-RAG的新框架,利用强化学习训练LLM,使其在RAG系统中拥有更强的逐步推理能力和动态检索能力,有望进一步提升LL

基于简历的RAG问答机器人:大模型赋能招聘新思路

当前招聘市场面临信息瓶颈,招聘人员难以快速从候选人的简历中提取关键信息。本文介绍了一个基于检索增强生成(RAG)和大语言模型(LLM)的问答机器人项目,该机器人能够根据指定的简历回答问题,如同一个阅读过你简历的私人助理,可以回答类似“Michael 掌握哪些编程语言?”或“他最近的职位是什么?”等HR风格的问题。该项目旨在解决传统问答系统依赖预训练知识,无法可靠地回答关于简历等私有或特定上下文文档

大模型技术前沿:从RAG到自主Agent的演进与微调

随着大模型 (LLM) 技术的飞速发展,我们正步入一个全新的智能系统时代。这些模型正从静态、通用型的模式,向着动态、特定任务型的系统转变,具备了实时推理和自主行为的能力。这一变革的核心驱动力在于两项关键技术进步:检索增强生成 (RAG) 和 自主Agent 的涌现。本文将深入探讨这些技术,并对比传统RAG与图RAG系统,以及对Agent层级进行分类,同时也会涉及到对大模型进行微调的技术,以提升其在

基于 OpenAPI Schema、RAG 和 LLMs 的 API 自动化测试用例生成:Caseforge 的探索与实践

随着微服务架构的普及,API 端点的数量呈指数级增长,全面彻底地测试这些 API 的成本也随之水涨船高。即使存在 OpenAPI (Swagger) 规范,编写 API 测试用例仍然是一项手动、重复性的工作。那么,我们是否可以仅仅依靠 OpenAPI schema 自动生成有意义的 测试用例呢?近年来,大型语言模型 (LLMs) 的崛起为我们提供了一种新的可能性。本文将深入探讨如何结合 OpenA

RAG技术进阶:迈向2025的检索增强生成新纪元

检索增强生成(Retrieval-Augmented Generation,RAG)作为自然语言处理(NLP)和生成式人工智能领域的一项突破性技术,正日益受到关注。它巧妙地融合了信息检索与语言模型生成文本的能力,构建出更精确、更具时效性且更值得信赖的智能系统。本文将深入探讨塑造未来对话式AI、智能聊天机器人和语义搜索系统等领域的各种高级 RAG 技术,重点介绍纠正检索增强生成 (CRAG)、链式思

生产级RAG:构建快速、准确且安全的检索增强生成系统

检索增强生成(RAG)系统已成为大模型应用的热门方向。许多团队能够在短时间内搭建一个RAG演示系统,但当用户规模扩大,系统开始面临严峻挑战:延迟增加、召回率下降、幻觉问题频发,以及严格的安全审查导致部署停滞。本文将深入探讨一个可用于生产环境的RAG模式,解决这些痛点,涵盖完整的数据流,安全防护(Guardrails)机制、实时的评估闭环,并提供一份可复制的部署清单。 RAG系统架构:混合检索与重排

从零开始构建RAG:一种朴素但可扩展的方法(一)

检索增强生成 (Retrieval-Augmented Generation, RAG) 正迅速成为利用大型语言模型 (LLM) 的关键技术。与其让 LLM “凭空想象”答案,不如先为其提供相关的上下文信息,这正是 RAG 擅长的地方。本文将带领大家从零开始,构建一个朴素但可扩展的 RAG 系统,深入理解其核心原理,并避免过度依赖现有框架的抽象。 RAG:连接搜索系统与语言模型的桥梁 RAG 的核

纠正检索增强生成 (CRAG): 提升大模型问答质量的利器

大型语言模型 (LLM) 在文本生成方面表现出色,但由于其参数知识的局限性,不可避免地会出现幻觉现象,导致生成内容不准确。检索增强生成 (RAG) 是一种有效的补充方案,它通过检索相关文档来增强 LLM 的知识,从而提高生成质量。然而,RAG 的性能很大程度上依赖于检索文档的相关性,一旦检索出错,模型的表现就会受到影响。为了解决这个问题,纠正检索增强生成 (CRAG) 应运而生,它旨在提升 RAG

大模型赋能科研:基于RAG和个性化角色模型的AI论文摘要器

人工智能(AI)和机器学习领域正以惊人的速度发展,如何快速掌握最新的研究成果,对每一个从业者都是一项挑战。面对浩如烟海的研究论文,即使是经验丰富的数据科学家和AI工程师,也需要花费大量时间才能理解其精髓。更重要的是,如何将这些复杂的概念,例如“Attention is All You Need”论文背后的Transformer架构及其如何催生了ChatGPT,向业务负责人或更广泛的受众解释清楚,则