检索增强生成 Archives

RAG

构建一个高效的RAG聊天机器人：新的长短时记忆方法

llmtrend 2025年4月8日没有评论

长短时记忆方法有效地平衡了聊天历史的保留和内存效率。通过总结旧的互动，同时保持最近的消息可用，聊天机器人保持了上下文，减少了存储需求，并为长对话扩展得很好。这种方法可以通过分层总结、高级合并策略和检索机制进一步优化。

RAG

RAG在大型语言模型（LLMs）中的应用：逐步指南

llmtrend 2025年3月31日没有评论

大型语言模型（LLMs）在自然语言处理（NLP）领域带来了革命性的变化，但它们也有局限性，尤其是在处理特定领域的知识时。这时，RAG技术就显得尤为重要。RAG通过检索相关的外部文档并与生成性回应相结合，提高了准确性和事实一致性。

RAG

RAG技术在代码库中的应用：逐步指南

llmtrend 2025年3月27日没有评论

我们构建一个基于RAG的代码库AI专家，它可以帮助我们更好地理解和改进代码库。这个项目不仅展示了RAG技术在代码理解和生成中的应用，而且还提供了一个实际的案例，展示了如何将这些技术应用于实际问题。随着技术的不断发展，我们可以期待RAG技术在代码库管理和软件开发中发挥更大的作用。

RAG

RAG集成与微调：全面指南

llmtrend 2025年3月26日没有评论

RAG技术通过结合外部知识检索和生成性AI，为NLP领域带来了革命性的进步。通过本文的全面指南，您可以了解到RAG的核心组件、微调过程、实施工作流程以及在特定领域的应用案例。RAG的模块化架构不仅允许针对性增强，还通过领域专业化和运营效率的提升，为各行各业提供了强大的支持。

RAG

RAG性能比较：本地小型语言模型与OpenAI大型语言模型

llmtrend 2025年3月12日没有评论

RAG性能比较：基于特定数据集评估了各种语言模型的问答性能。在进行的测试中，分析了模型提供的答案的准确性及其对参考文档的遵循程度。根据获得的指标结果，OpenAI GPT-4o通过获得比其他模型更高的BLEU和ROUGE得分，展示了最佳性能

RAG

Agentic RAG：由代理驱动的自适应RAG工作流

llmtrend 2025年3月9日没有评论

Agentic RAG代表了RAG模型在处理复杂查询和提供更准确答案方面的一个进步。通过引入一个由LLM驱动的代理来动态协调检索和生成工作流，Agentic RAG能够提供更动态、更适应性强的解决方案。然而，这种进步也带来了性能、成本和复杂性的挑战。

RAG

理解RAG的关键组成部分：检索器和生成器

llmtrend 2025年3月7日没有评论

理解检索器和生成器是掌握RAG如何改进人工智能生成内容的关键。检索器确保访问实时信息，而生成器以自然的方式结构化和呈现这些信息。通过协同工作，这些组件创建了更准确、基于事实且可靠的人工智能响应，使RAG成为人工智能技术的一项突破性进展。

RAG

CapybaraDB 发布 EmbImage，为图像 RAG 应用带来多模态能力

llmtrend 2025年3月7日没有评论

EmbImage 是 CapybaraDB 中为存储和处理图像而设计的一种特殊数据类型。它通过以下方式启用多模态能力：视觉模型处理：允许图像被视觉模型处理以提取文本描述。嵌入向量搜索：使用提取的描述进行向量搜索。存储与其他文档数据：将图像与其它文档数据一同存储。

RAG

应对RAG中的“不在上下文”挑战

llmtrend 2025年3月7日没有评论

“不在上下文”问题的根本在于RAG系统的检索和生成阶段之间的脱节。尽管检索阶段能够找到大量相关信息，但生成阶段却未能有效地利用这些信息。这种脱节可能是由于多种因素造成的，包括技术限制、算法设计不当以及对用户查询的理解不足。

RAG

RAG简介：理解检索增强生成（Retrieval-Augmented Generation）

llmtrend 2025年3月5日没有评论

RAG简介，即检索增强生成，是一种结合了检索和生成的大型语言模型技术。它通过外部信息检索机制，提高了语言模型在回答问题时的准确性和可靠性。与传统的检索系统不同，RAG不仅检索信息，还将检索到的信息与语言模型结合，生成全新的回答。

检索增强生成

构建一个高效的RAG聊天机器人：新的长短时记忆方法

RAG在大型语言模型（LLMs）中的应用：逐步指南

RAG技术在代码库中的应用：逐步指南

RAG集成与微调：全面指南

RAG性能比较：本地小型语言模型与OpenAI大型语言模型

Agentic RAG：由代理驱动的自适应RAG工作流

理解RAG的关键组成部分：检索器和生成器

CapybaraDB 发布 EmbImage，为图像 RAG 应用带来多模态能力

应对RAG中的“不在上下文”挑战

RAG简介：理解检索增强生成（Retrieval-Augmented Generation）

大型语言模型 (LLM)：原理、应用与实践指南

2025年大模型前沿架构：量化创新深度解析

基于FastAPI与RAG的电商智能聊天机器人：从入门到实践

LLM赋能：一个Spring Boot应用如何替代五个微服务API？

大模型推理的幻觉：Apple揭示AI“思考”的局限性

You Missed

大型语言模型 (LLM)：原理、应用与实践指南

大型语言模型 (LLM)：原理、应用与实践指南

2025年大模型前沿架构：量化创新深度解析

2025年大模型前沿架构：量化创新深度解析

基于FastAPI与RAG的电商智能聊天机器人：从入门到实践

基于FastAPI与RAG的电商智能聊天机器人：从入门到实践

LLM赋能：一个Spring Boot应用如何替代五个微服务API？

LLM赋能：一个Spring Boot应用如何替代五个微服务API？