6 月 2025

超越奖励：理解强化学习及其在对齐大语言模型与人类价值观中的作用

llmtrend 2025年6月9日没有评论

引言：强化学习 (RL) 技术近年来在对齐大语言模型 (LLMs) 与人类价值观方面扮演着日益重要的角色。从最初的机器人控制、算法交易到游戏 AI，RL 的应用领域不断扩展。然而，在对齐 LLMs 方面，我们面临着一个全新的挑战：如何让模型在缺乏明确、预定义奖励函数的情况下，学习并遵循人类主观、微妙且依赖于上下文的偏好？本文将深入探讨强化学习的基础，剖析基于人类反馈的强化学习 (RLHF)

Agent

多智能体系统（MAS）：人工智能的下一波浪潮，引领企业数字化转型

llmtrend 2025年6月9日没有评论

在日益复杂的数字化生态系统中，对智能、可扩展和自适应自动化解决方案的需求日益增长。多智能体系统（MAS）正成为人工智能领域的下一个重要突破，它将彻底改变企业在营销、运营和IT等各个领域的运作方式。XIMNET的XTOPIA平台便是一款强大的多智能体解决方案，它赋能企业部署智能代理团队，以自主协作的方式，快速、精确地解决大规模问题。什么是多智能体系统？多智能体系统（MAS）是由多个AI代理组成的

LLM

大模型时代：用“反思”设计模式打造更智能的AI Agent

llmtrend 2025年6月9日没有评论

随着大模型（LLM）技术的日新月异，我们不再仅仅期待它们一次性给出完美的答案。如果能赋予AI Agent暂停、自我批判并不断改进的能力，是不是就能获得更强大的智能？这就是反思（Reflection）设计模式的核心思想。它是一种简单却高效的agentic模式，拥有惊人的能力，并且易于实现。本文将深入探讨反思模式背后的原理，并以Python代码为例，逐步展示如何构建它。反思模式：AI的自我审视反思

LLM

本地LLM对接MCP：精细化控制生成式AI的应用实践

llmtrend 2025年6月9日没有评论

在生成式AI浪潮下，如何精细化控制大型语言模型（LLM）的输出，使其更好地服务于特定业务场景，成为了开发者们关注的焦点。本文将深入探讨如何通过本地LLM对接模型上下文协议（MCP），并利用编程方式实现对MCP功能调用和输出的精细化控制，以提升生成式AI的应用效果。 1. MCP：定义与价值模型上下文协议（MCP）是一种定义模型输入输出的标准方式，它旨在解决不同AI模型之间的互操作性问题，并促进A

Agent

Langraph：解锁 AI Agent 工作流的未来，从入门到精通

llmtrend 2025年6月9日没有评论

在快速发展的 AI 领域，AI Agent 正在彻底改变我们与技术的互动方式。那么，究竟什么是 Agent？而 Langraph 又如何助力你构建更先进的 Agentic Workflows 呢？本文将以通俗易懂的方式，带你深入了解 Agent 的核心概念，Langraph 的运作机制，以及如何利用它们构建强大的自动化系统。无论你是开发者、AI 爱好者，还是仅仅对自动化未来充满好奇，都能从中受益。

RAG

Qdrant赋能的RAG：定制重排序提升LLM问答质量实战指南

llmtrend 2025年6月9日没有评论

引言：超越传统RAG，拥抱Qdrant与重排序大语言模型 (LLM) 固然强大，但其知识受限于训练数据。为了使其真正适用于生产环境，特别是在特定领域或需要实时信息的场景下，检索能力至关重要。这正是检索增强生成 (RAG) 技术的用武之地。然而，仅仅拥有良好的检索功能是不够的。如果检索到的前几个结果并非最相关，又该如何呢？本文将深入探讨如何通过集成 Qdrant 向量搜索引擎，并添加自定义重排序层

LLM

LLM如何成为我们的随叫随到工程师，并革新十万+零售渠道的管理方式

llmtrend 2025年6月9日没有评论

沃尔玛利用LLM（大型语言模型）和 MCP（模型上下文协议）构建的 AI 系统，大幅提升了运营效率和问题解决能力，实现了零售损失控制。通过将 LLM 应用于运营管理，沃尔玛不仅实现了 85% 的问题诊断时间缩短，还释放了工程师的创新潜力，并改善了门店的正常运行时间。沃尔玛的案例展示了 LLM 在复杂零售环境中的巨大潜力，它标志着 AI 在运营领域的未来已经到来。背景：零售损失与复杂系统沃尔玛

LLM Evaluation

苹果“思考的幻觉”论文：真科研还是AI营销的障眼法？

llmtrend 2025年6月9日没有评论

大型语言模型（LLM）领域最近掀起了一阵波澜，源头是苹果公司发布的一篇名为“思考的幻觉”（The Illusion of Thinking）的研究论文。这篇论文声称揭示了大型推理模型（LRM）在解决复杂问题时的根本局限性，甚至提出了“完全精度崩溃”等耸人听闻的观点。然而，仔细分析后，我们发现这篇论文的核心论点可能存在偏差，甚至更像是苹果公司在人工智能（AI）领域战略定位的一种尝试。本文将深入剖析该

LLM

释放Rustdoc Markdown的力量：赋能大模型，构建智能软件开发生态

llmtrend 2025年6月9日没有评论

在软件开发领域，大模型（LLMs）正以前所未有的速度改变着我们的工作方式。然而，要真正发挥大模型在复杂代码库中的潜力，仅仅依靠其海量的通用知识库是不够的。本文将深入探讨如何利用Rust语言的Rustdoc Markdown，提取精准的上下文信息，赋能大模型，最终构建一个更智能、高效的软件开发生态。通过将结构化的Rust代码文档转化为易于理解的Markdown格式，我们可以显著提升大模型在代码生成、

RAG

基于Ollama、ChromaDB和Streamlit构建本地RAG系统：深度解析与实践指南

llmtrend 2025年6月9日没有评论

随着大模型技术的飞速发展，检索增强生成（RAG）系统正逐渐成为处理复杂文档和知识库的关键技术。本文将深入探讨如何利用开源工具 Ollama、ChromaDB 和 Streamlit 构建一个完全本地化、生产级别的 RAG 系统，实现文档问答功能，并着重分析每个环节的关键技术点和潜在挑战，最终打造一个高效、安全、可定制的知识引擎。 RAG 系统的核心架构与优势 RAG，即 Retrieval-Aug

超越奖励：理解强化学习及其在对齐大语言模型与人类价值观中的作用

超越奖励：理解强化学习及其在对齐大语言模型与人类价值观中的作用

多智能体系统（MAS）：人工智能的下一波浪潮，引领企业数字化转型

多智能体系统（MAS）：人工智能的下一波浪潮，引领企业数字化转型

大模型时代：用“反思”设计模式打造更智能的AI Agent

大模型时代：用“反思”设计模式打造更智能的AI Agent

本地LLM对接MCP：精细化控制生成式AI的应用实践

本地LLM对接MCP：精细化控制生成式AI的应用实践

Langraph：解锁 AI Agent 工作流的未来，从入门到精通

Langraph：解锁 AI Agent 工作流的未来，从入门到精通

Qdrant赋能的RAG：定制重排序提升LLM问答质量实战指南

Qdrant赋能的RAG：定制重排序提升LLM问答质量实战指南

LLM如何成为我们的随叫随到工程师，并革新十万+零售渠道的管理方式

LLM如何成为我们的随叫随到工程师，并革新十万+零售渠道的管理方式

苹果“思考的幻觉”论文：真科研还是AI营销的障眼法？

苹果“思考的幻觉”论文：真科研还是AI营销的障眼法？

释放Rustdoc Markdown的力量：赋能大模型，构建智能软件开发生态

释放Rustdoc Markdown的力量：赋能大模型，构建智能软件开发生态

基于Ollama、ChromaDB和Streamlit构建本地RAG系统：深度解析与实践指南

基于Ollama、ChromaDB和Streamlit构建本地RAG系统：深度解析与实践指南

大模型幻觉：当AI听起来很对，实际上大错特错

大模型Token成本控制：精打细算，玩转AI的省钱之道

NVIDIA 押注：小型语言模型（SLM）引领 Agentic AI 的未来

用爱发电，一人构建隐私至上的搜索引擎：Seek Ninja 与 Searcha Page 的崛起

大模型学习之旅：第二天——深入探索提示工程与AI伙伴的构建

You Missed

大模型幻觉：当AI听起来很对，实际上大错特错

大模型幻觉：当AI听起来很对，实际上大错特错

大模型Token成本控制：精打细算，玩转AI的省钱之道

大模型Token成本控制：精打细算，玩转AI的省钱之道

NVIDIA 押注：小型语言模型（SLM）引领 Agentic AI 的未来

NVIDIA 押注：小型语言模型（SLM）引领 Agentic AI 的未来

用爱发电，一人构建隐私至上的搜索引擎：Seek Ninja 与 Searcha Page 的崛起

用爱发电，一人构建隐私至上的搜索引擎：Seek Ninja 与 Searcha Page 的崛起