RAG

打造智能RAG系统的必备工具:从知识库到大语言模型(LLM)

在人工智能领域,检索增强生成(RAG)系统正变得日益重要。它巧妙地结合了信息检索的精确性和自然语言生成的流畅性,使得智能助手,如客户服务聊天机器人,变得更加可靠和知识渊博。本文将深入探讨构建一个强大的RAG系统所需的关键工具,从知识库的构建到文档嵌入,再到向量数据库的选择和大语言模型(LLM)的应用,以及对话管理和流程编排,帮助你了解如何利用这些工具打造属于你的AI系统。 1. 知识库:RAG系统

大模型技术选型:Prompting、Fine-Tuning 和 RAG,哪种方式更适合你?

随着大型语言模型 (LLM) 的不断发展,我们利用它们的方式也在不断演进。无论是构建聊天机器人、搜索系统,还是特定领域的智能助手,选择合适的技术至关重要。本文将深入探讨 Prompting、Fine-Tuning 和检索增强生成 (RAG) 这三种主流方法,并分析各自的优缺点,帮助你做出明智的决策。 Prompting:简单高效的起点 Prompting 是与 LLM 交互的最简单直接的方式。它涉

掌握 ChatGPT SEO:如何提升品牌在AI时代的可见性?

在人工智能(AI)蓬勃发展的时代,品牌如何在 ChatGPT 等大型语言模型中脱颖而出,成为一个至关重要的问题。 本文将深入探讨如何通过 ChatGPT SEO 提升品牌在 AI 时代的 AI可见性,并通过 AI-SEO 策略,最终实现 GPT排名 的提升,帮助你在竞争激烈的市场中获得优势。 理解 Generative Engine Optimization (GEO) 的重要性 传统搜索引擎优化

掌握 ChatGPT SEO:如何提升品牌在AI时代的可见性?

在人工智能(AI)蓬勃发展的时代,品牌如何在 ChatGPT 等大型语言模型中脱颖而出,成为一个至关重要的问题。 本文将深入探讨如何通过 ChatGPT SEO 提升品牌在 AI 时代的 AI可见性,并通过 AI-SEO 策略,最终实现 GPT排名 的提升,帮助你在竞争激烈的市场中获得优势。 理解 Generative Engine Optimization (GEO) 的重要性 传统搜索引擎优化

检索增强分类:大模型时代文本分类的新范式

在大模型技术日新月异的今天,文本分类作为自然语言处理领域的基础且关键的应用,正迎来新的变革。从过滤垃圾邮件、识别产品类别,到理解聊天机器人中的用户意图,文本分类无处不在。传统方法依赖于大量标注数据训练定制化的机器学习模型,而大模型的出现,使得零样本或少样本分类成为可能,极大地缩短了服务部署时间。然而,这种方法的准确性往往低于定制模型,且高度依赖于精巧的提示工程。本文将深入探讨一种名为检索增强分类

PicPay的生成式AI实践:赋能员工,提升效率(一)

自2023年2月以来,PicPay积极拥抱人工智能(AI),致力于提升客户体验。其中,最成功的案例莫过于其虚拟助手,该助手在短期内将净推荐值(NPS)提高了45%,问题解决率提升了20%。在此基础上,PicPay进一步将目光投向了内部运营,力求优化员工满意度和工作流程。 一项2024年12月对1725名员工的内部调研显示,高达86%的员工已经在日常工作中使用AI工具。面对日益增长的企业内部流程优化

使用 Microsoft Presidio 轻松检测 PII:利用大模型技术保护敏感数据

在当下大模型技术飞速发展的时代,个人身份信息 (PII) 的保护变得至关重要。本文将深入探讨如何利用 Microsoft Presidio 这一强大的自然语言处理 (NLP) 工具,轻松检测和保护 PII,尤其是在大模型应用场景下,避免敏感数据泄露。我们将详细介绍 Presidio 的核心功能,并探讨如何利用其内置的识别器和自定义识别器,有效地识别和匿名化文本、图像以及结构化数据中的 PII。 大

离线环境下基于大模型的安全Text-to-SQL:ChromaDB与RAG管道的深度实践

在大模型技术日新月异的今天,如何让其更准确、更及时地响应用户的查询需求,并结合外部知识提供更符合语境的答案,成为了一个重要的研究方向。检索增强生成 (Retrieval Augmented Generation, RAG) 管道正在革新大模型与外部知识交互的方式。本文将深入探讨如何在离线环境(air-gapped environment)下,利用ChromaDB向量数据库构建安全的RAG管道,实现

伽利略计划:以科学严谨性探索不明飞行现象,大模型助力异常检测

引言 在不明飞行现象(UAP)的研究领域,往往充斥着阴谋论、模糊不清的照片和未经证实的证词。哈佛大学发起的伽利略计划,以一种令人耳目一新的方式,试图将真正的科学方法引入这个领域。该计划旨在将对UAP的研究从零星的轶事观察转变为可信赖的、严谨且透明的科学研究。这标志着一种重要的转变,而大模型在其中扮演着至关重要的角色。 1. UAP研究的现状与转型 过去75年来,UAP的研究很大程度上被边缘化。主流

利用Docling SDG释放AI全部潜力:合成数据生成的力量

在生成式AI快速发展的今天,对高质量、多样化的训练数据的需求是无限的。然而,获取和标注大量的真实世界数据,往往耗时、昂贵,且涉及隐私问题。在这种背景下,合成数据生成 (SDG) 作为一种变革性的解决方案应运而生。本文将深入探讨如何利用Docling for Synthetic Data Generation (SDG),通过从现有文档中直接创建人工数据,无缝地利用先进的生成式AI模型以及Docli