RAG Archives - Page 13 of 19

金融服务业LLM全栈解析：从试点到平台，赋能业务增长

llmtrend 2025年6月2日没有评论

大型语言模型（LLM）正以前所未有的速度渗透到各行各业，特别是在金融服务业。过去一年，我亲历了这场企业技术变革，从最初的沙盒试点到全面的生产部署，过程既激动人心又充满挑战。LLM不再仅仅是调用API，而是构建一个完整的系统，以保障数据主权、满足合规框架，并安全、大规模地交付切实可行的业务成果。本文将以客户视角，深入探讨金融服务行业LLM全栈的构成、重要性以及实际部署经验，重点关注客户服务、风险分析

RAG

RAG技术：大模型时代的实时知识引擎与多模态搜索的未来

llmtrend 2025年6月2日没有评论

大语言模型(LLM) 在创意写作、复杂编码等领域展现了卓越能力，其本质是基于Transformer架构，通过海量文本数据集训练的深度神经网络。然而，静态预训练知识、幻觉问题、溯源难题以及微调的复杂性，限制了LLM的应用。检索增强生成 (Retrieval Augmented Generation，RAG) 作为一种前沿的解决方案，正通过整合外部知识库，赋予LLM更强的实时性、准确性和可解释性。本文

LLM

利用 FAISS 和 LangChain 模拟大语言模型（LLM）的短时和长时记忆

llmtrend 2025年6月2日没有评论

随着大语言模型（LLM）技术的日益成熟，如何提升其在推理过程中的记忆能力成为了一个重要的研究方向。本文将深入探讨如何借助 FAISS 向量存储和 LangChain 框架，在不进行模型微调或重新训练的情况下，有效模拟 LLM 的短时和长时记忆，并实现知识的插入、遗忘、矛盾处理以及利用最近性偏见优先考虑新近信息。整个过程将在 Google Colab 环境下，使用开源工具完成，方便读者复现和学习。

RAG

告别高昂API费用：用RAG架构与本地LLM轻松构建智能文档聊天机器人

llmtrend 2025年6月2日没有评论

在人工智能技术日新月异的今天，构建一个智能文档聊天机器人已不再是遥不可及的梦想。本文将深入探讨如何利用RAG（检索增强生成）架构与本地LLM（大型语言模型），在无需大量依赖外部API的情况下，轻松搭建一款属于自己的智能助手。我们将深入理解向量数据库和embeddings（嵌入）的核心概念，并详细介绍数据摄取（indexing）和检索与生成（chatting）这两大关键步骤，最后，结合实际代码示例，

RAG

RAG：检索增强生成技术如何革新大语言模型，提升AI应用的精准度与可信度

llmtrend 2025年6月1日没有评论

在人工智能领域，大语言模型（LLM）正以前所未有的速度发展，但其依赖预训练知识的局限性也日益凸显。为了突破这一瓶颈，检索增强生成（RAG）技术应运而生。RAG通过在生成回复之前整合外部信息检索，显著提升了 LLM 的性能，为AI应用的精准度、可靠性以及个性化开辟了新的可能性。本文将深入探讨 RAG 的优势、工作流程以及关键技术，揭示其如何革新大语言模型，推动AI应用的未来发展。 RAG 的核心优

LLM

Open WebUI 高可用部署架构：SRE 指南，打造稳定可靠的大模型应用

llmtrend 2025年6月1日没有评论

Open WebUI 作为本地和托管大语言模型 (LLM) 的卓越聊天界面，凭借其生产就绪的 UI、内置的 RAG 功能、Web 搜索以及无限的自定义潜力，正日益受到欢迎。对于那些需要 100% 正常运行时间，并希望处理大量用户流量的企业来说，仅仅使用 Python 或 Docker 快速入门选项是不够的。本文将深入探讨如何构建 Open WebUI 的高可用部署架构，确保即使在节点故障、滚动升级

RAG

RAG：检索增强生成技术如何赋能大语言模型

llmtrend 2025年5月31日没有评论

大语言模型（LLM）如ChatGPT曾经会自信地给出“现在是2021年”这样的错误答案，原因在于其训练数据截止于2021年，无法获知之后的信息。解决这一问题的关键并非简单地每年更新数据，而是采用了一种更为智能的方法：检索增强生成 (Retrieval-Augmented Generation，简称RAG)。RAG技术的出现，让人们惊呼：“现在它们可以连接互联网了，我们可以开始大展身手了！”而不再像

RAG

架构为王：从文本中心到智能控制，多模态检索增强生成 (MRAG) 的演进

llmtrend 2025年5月31日没有评论

欢迎来到人工智能探索之旅的第45篇章。我们将深入探讨多模态检索增强生成 (MRAG)，一种将人工智能从文本中心带向智能控制的革命性架构。本文将分析 MRAG 如何超越传统的 RAG，整合图像、视频等多种数据类型，并以一篇最新的综述为引，探讨其背后的架构演进，特别关注被称为“伪 MRAG”的 MRAG 1.0。我们将从架构的角度审视 MRAG 的演进，理解其如何逐步从以文本为中心过渡到以智能控制为中

AI Tools

构建AI应用？ Vertex AI、Google AI Studio及顶级替代方案终极指南

llmtrend 2025年5月31日没有评论

随着大模型（LLM）技术的日渐成熟，构建人工智能（AI）应用，如聊天机器人、智能搜索工具和虚拟助手，变得越来越普及。然而，LLM的世界既令人兴奋，也充满挑战。幸运的是，像 Vertex AI Agent Builder、Google AI Studio、LangChain、LangGraph、LlamaIndex、CrewAI 和 Vellum 这样的框架正在简化开发流程，使得构建AI应用变得更加

LLM

构建由生成式AI驱动的微服务：未成文的剧本

llmtrend 2025年5月31日没有评论

生成式AI正在重新定义软件架构。我们将大语言模型（LLMs）嵌入到搜索体验、产品助手、客户支持甚至分析仪表盘中。虽然提示工程（Prompt Engineering）备受关注，但将生成式AI插入到微服务中才是真正的架构挑战所在。本文将深入探讨如何在基于微服务的系统中架构生成式AI，涵盖消息队列、重试机制、缓存提示以及监控LLM在生产环境中的行为等关键方面。挑战：Gen AI ≠ 传统 API 我们

RAG

金融服务业LLM全栈解析：从试点到平台，赋能业务增长

金融服务业LLM全栈解析：从试点到平台，赋能业务增长

RAG技术：大模型时代的实时知识引擎与多模态搜索的未来

RAG技术：大模型时代的实时知识引擎与多模态搜索的未来

利用 FAISS 和 LangChain 模拟大语言模型（LLM）的短时和长时记忆

利用 FAISS 和 LangChain 模拟大语言模型（LLM）的短时和长时记忆

告别高昂API费用：用RAG架构与本地LLM轻松构建智能文档聊天机器人

告别高昂API费用：用RAG架构与本地LLM轻松构建智能文档聊天机器人

RAG：检索增强生成技术如何革新大语言模型，提升AI应用的精准度与可信度

RAG：检索增强生成技术如何革新大语言模型，提升AI应用的精准度与可信度

Open WebUI 高可用部署架构：SRE 指南，打造稳定可靠的大模型应用

Open WebUI 高可用部署架构：SRE 指南，打造稳定可靠的大模型应用

RAG：检索增强生成技术如何赋能大语言模型

RAG：检索增强生成技术如何赋能大语言模型

架构为王：从文本中心到智能控制，多模态检索增强生成 (MRAG) 的演进

架构为王：从文本中心到智能控制，多模态检索增强生成 (MRAG) 的演进

构建AI应用？ Vertex AI、Google AI Studio及顶级替代方案终极指南

构建AI应用？ Vertex AI、Google AI Studio及顶级替代方案终极指南

构建由生成式AI驱动的微服务：未成文的剧本

构建由生成式AI驱动的微服务：未成文的剧本

大模型 Prompt 工程的本质：从 “成为 (Be)” 到 “行动 (Do)” 的飞跃

构建 MCP 服务器：通往智能 AI 集成的指南

使用 Foundry Local 构建 Blazor 本地 AI 聊天应用：从 Ollama 到完全本地化

LangChain实战指南：基于Groq的极速LLM应用开发

AI Agent的记忆力：构建智能体的核心基石

You Missed

大模型 Prompt 工程的本质：从 “成为 (Be)” 到 “行动 (Do)” 的飞跃

大模型 Prompt 工程的本质：从 “成为 (Be)” 到 “行动 (Do)” 的飞跃

构建 MCP 服务器：通往智能 AI 集成的指南

构建 MCP 服务器：通往智能 AI 集成的指南

使用 Foundry Local 构建 Blazor 本地 AI 聊天应用：从 Ollama 到完全本地化

使用 Foundry Local 构建 Blazor 本地 AI 聊天应用：从 Ollama 到完全本地化

LangChain实战指南：基于Groq的极速LLM应用开发

LangChain实战指南：基于Groq的极速LLM应用开发