RAG Archives - Page 2 of 17

使用 Microsoft Presidio 轻松检测 PII：利用大模型技术保护敏感数据

llmtrend 2025年6月13日没有评论

在当下大模型技术飞速发展的时代，个人身份信息 (PII) 的保护变得至关重要。本文将深入探讨如何利用 Microsoft Presidio 这一强大的自然语言处理 (NLP) 工具，轻松检测和保护 PII，尤其是在大模型应用场景下，避免敏感数据泄露。我们将详细介绍 Presidio 的核心功能，并探讨如何利用其内置的识别器和自定义识别器，有效地识别和匿名化文本、图像以及结构化数据中的 PII。大

RAG

离线环境下基于大模型的安全Text-to-SQL：ChromaDB与RAG管道的深度实践

llmtrend 2025年6月12日没有评论

在大模型技术日新月异的今天，如何让其更准确、更及时地响应用户的查询需求，并结合外部知识提供更符合语境的答案，成为了一个重要的研究方向。检索增强生成 (Retrieval Augmented Generation, RAG) 管道正在革新大模型与外部知识交互的方式。本文将深入探讨如何在离线环境（air-gapped environment）下，利用ChromaDB向量数据库构建安全的RAG管道，实现

LLM

伽利略计划：以科学严谨性探索不明飞行现象，大模型助力异常检测

llmtrend 2025年6月12日没有评论

引言在不明飞行现象（UAP）的研究领域，往往充斥着阴谋论、模糊不清的照片和未经证实的证词。哈佛大学发起的伽利略计划，以一种令人耳目一新的方式，试图将真正的科学方法引入这个领域。该计划旨在将对UAP的研究从零星的轶事观察转变为可信赖的、严谨且透明的科学研究。这标志着一种重要的转变，而大模型在其中扮演着至关重要的角色。 1. UAP研究的现状与转型过去75年来，UAP的研究很大程度上被边缘化。主流

RAG

利用Docling SDG释放AI全部潜力：合成数据生成的力量

llmtrend 2025年6月12日没有评论

在生成式AI快速发展的今天，对高质量、多样化的训练数据的需求是无限的。然而，获取和标注大量的真实世界数据，往往耗时、昂贵，且涉及隐私问题。在这种背景下，合成数据生成 (SDG) 作为一种变革性的解决方案应运而生。本文将深入探讨如何利用Docling for Synthetic Data Generation (SDG)，通过从现有文档中直接创建人工数据，无缝地利用先进的生成式AI模型以及Docli

LLM

混合AI框架：打破“智能幻觉”的钥匙？

llmtrend 2025年6月12日没有评论

在人工智能领域，单一的推理策略往往难以应对复杂多变的任务。为了提升AI的可靠性、效率和适应性，混合AI框架应运而生。本文将深入探讨五种主流的混合AI框架——符号+神经（Neurosymbolic AI）、LATS（Language Agent Tree Search）、MRP（Meta-Reasoning Prompting）、多智能体系统和 GoT（Graph-of-Thoughts），剖析其核

RAG

向量索引：让大模型搜索如闪电般快速

llmtrend 2025年6月12日没有评论

在如今数据爆炸的时代，搜索正面临着前所未有的挑战。想象一下，你正在运营一个拥有上亿首歌曲的在线音乐平台，当用户搜索“充满活力的健身音乐”时，如果没有合适的索引技术，系统将不得不逐一检查每一首歌曲，计算搜索查询与每首歌曲之间的相似度，并对结果进行排序以找到最佳匹配。这可能需要长达30秒的时间，严重影响用户体验。向量索引技术的出现，正是为了解决这一问题，它如同一个智能的文件系统，能够极大地提升大模型搜

RAG

利用 FAISS 和 Chroma 评估检索增强聊天机器人中的大语言模型：性能、成本与可部署性深度解析

llmtrend 2025年6月12日没有评论

在构建智能、上下文感知的应用程序（如聊天机器人）时，检索增强生成 (RAG) 工作流程至关重要。它依赖于有效的向量数据库来存储文档的语义表示，并快速检索相关信息。本文将深入探讨如何结合 FAISS 和 Chroma 这两个向量数据库，并结合不同的大语言模型 (LLM)，包括 OpenAI 的 GPT-4o-mini、本地 Ollama 运行的 Llama3.2 以及 Hugging Face 的

RAG

利用Amazon Kendra和Bedrock构建RAG（检索增强生成）系统的实践指南

llmtrend 2025年6月12日没有评论

在人工智能和自然语言处理领域，RAG（检索增强生成）已成为一个颠覆性的技术。它巧妙地融合了大型语言模型的强大能力和精准的信息检索技术，从而生成更准确、更符合上下文语境的AI响应。本文将深入探讨如何利用 Amazon Kendra 和 Amazon Bedrock 搭建 RAG 系统，助力企业提升 AI 应用的智能化水平。 RAG：融合检索与生成的创新范式 RAG（检索增强生成）的核心在于结合了信息

AI News

从生产到规模：AI 领域 2019 年与今日的变革之路

llmtrend 2025年6月12日没有评论

2019 年，当 Gen AI 还未成为热门话题时，人工智能 (AI) 领域已经步入了一个关键的转折点。回顾那时，重点在于如何将 AI/ML 从实验室推向实际生产环境。如今，随着开源模型的兴起、多模型生态系统的发展，以及对 AI 伦理和数据治理的日益重视，AI 领域的焦点已经转移到如何以负责任且可定制的方式，利用灵活、可组合的架构来实现 AI 解决方案的规模化应用。本文将深入探讨 2

RAG

利用RAG和LLM加速BI报表搜索：提升数据洞察效率

llmtrend 2025年6月12日没有评论

在当今数据驱动的商业环境中，企业内BI(Business Intelligence)报表的数量不断增长。如何帮助用户快速找到所需信息，成为了提升数据洞察效率的关键。本文将深入探讨如何利用 RAG (Retrieval-Augmented Generation，检索增强生成) 和 LLM (Large Language Model，大型语言模型) 技术，构建更智能、更高效的 BI 报表搜索系统。通过

RAG

使用 Microsoft Presidio 轻松检测 PII：利用大模型技术保护敏感数据

使用 Microsoft Presidio 轻松检测 PII：利用大模型技术保护敏感数据

离线环境下基于大模型的安全Text-to-SQL：ChromaDB与RAG管道的深度实践

离线环境下基于大模型的安全Text-to-SQL：ChromaDB与RAG管道的深度实践

伽利略计划：以科学严谨性探索不明飞行现象，大模型助力异常检测

伽利略计划：以科学严谨性探索不明飞行现象，大模型助力异常检测

利用Docling SDG释放AI全部潜力：合成数据生成的力量

利用Docling SDG释放AI全部潜力：合成数据生成的力量

混合AI框架：打破“智能幻觉”的钥匙？

混合AI框架：打破“智能幻觉”的钥匙？

向量索引：让大模型搜索如闪电般快速

向量索引：让大模型搜索如闪电般快速

利用 FAISS 和 Chroma 评估检索增强聊天机器人中的大语言模型：性能、成本与可部署性深度解析

利用 FAISS 和 Chroma 评估检索增强聊天机器人中的大语言模型：性能、成本与可部署性深度解析

利用Amazon Kendra和Bedrock构建RAG（检索增强生成）系统的实践指南

利用Amazon Kendra和Bedrock构建RAG（检索增强生成）系统的实践指南

从生产到规模：AI 领域 2019 年与今日的变革之路

从生产到规模：AI 领域 2019 年与今日的变革之路

利用RAG和LLM加速BI报表搜索：提升数据洞察效率

利用RAG和LLM加速BI报表搜索：提升数据洞察效率

解码奇异之美：非常规算法的起源、应用与实践（大模型视角）

Claude 3.5 Haiku 的大脑扫描：大模型解决问题的惊人方式

驾驭AI之语：Prompt Engineering解锁大语言模型无限潜能

Java开发者拥抱AI：大型语言模型（LLM）集成实战指南

超越检索：CC-RAG 与因果 AI 的黎明

You Missed

解码奇异之美：非常规算法的起源、应用与实践（大模型视角）

解码奇异之美：非常规算法的起源、应用与实践（大模型视角）

Claude 3.5 Haiku 的大脑扫描：大模型解决问题的惊人方式

Claude 3.5 Haiku 的大脑扫描：大模型解决问题的惊人方式

驾驭AI之语：Prompt Engineering解锁大语言模型无限潜能

驾驭AI之语：Prompt Engineering解锁大语言模型无限潜能

Java开发者拥抱AI：大型语言模型（LLM）集成实战指南

Java开发者拥抱AI：大型语言模型（LLM）集成实战指南