6 月 2025

NLWeb：微软引领的 Agentic Web 时代，对话式互联网的曙光

llmtrend 2025年6月9日没有评论

想象一下，未来的互联网不再是静态网页和交互表单的集合，而是一个个动态的、具备对话能力的实体。你可以用自然语言向网站提问，就像咨询一位知识渊博的助手一样，并立即获得相关且有上下文关联的答案。这并非科幻小说，而是微软通过 NLWeb 这一开源项目，正努力实现的愿景，它将重新定义我们与互联网互动的方式。 NLWeb 代表了下一代网络交互方式的变革。在微软Build 2025大会上，由R.V. Guha亲

LLM Evaluation

大模型推理的幻觉：理解大型推理模型的局限性

llmtrend 2025年6月9日没有评论

大型推理模型 (LRMs) 如 OpenAI 的 o1/o3、DeepSeek-R1 以及 Claude 3.7 Sonnet Thinking 等，在解决复杂问题方面取得了显著进展。然而，苹果公司的研究 “推理的幻觉：通过问题复杂性理解推理模型的优势和局限性” 揭示了这些模型在面对不同难度的问题时存在的显著局限性。这项研究没有采用传统的数学或编码测试，而是采用精心设计的谜题，揭示了 LRMs 的

LLM

7款我真正在AI训练中推荐的开源LLM大模型

llmtrend 2025年6月9日没有评论

在嘈杂的开源LLM生态中，找到真正可靠且适合训练的模型并非易事。本文精选了7款我个人信任并在实际AI训练课程中使用的开源LLM大模型，帮助你摆脱炒作，直击最佳选择。无论你是初创团队、大学实验室还是企业AI部门，选择合适的开源LLM（大型语言模型）都是至关重要的一步。面对每周涌现的新模型、被操纵的基准测试、模糊的模型卡以及因用例而异的巨大性能差异，如何做出明智的决策？经过数月的微调、提示工程和架构

LLM

利用Ollama本地运行Mistral模型，Python实现网页内容摘要

llmtrend 2025年6月9日没有评论

在当今信息爆炸的时代，如何快速有效地从海量网页中提取关键信息变得至关重要。本文将深入探讨如何利用 Ollama 在本地运行强大的 Mistral 大语言模型，并结合 Python 的网络爬虫和文本处理能力，实现网页内容的自动化摘要。通过本文，你将掌握一种无需依赖外部API，完全掌控数据，并能构建强大信息提取工具的方法。本文将围绕 Ollama、Mistral、Python、网页内容摘要这四个核心

LLM

大模型运行之选：RAM vs. GPU，速度、成本与性能的终极考量

llmtrend 2025年6月9日没有评论

在探索如何运行大型语言模型（LLMs）时，一个至关重要的决策就是选择依赖系统 RAM 还是专用 GPU。理解两者之间的权衡，不仅能节省时间和资金，还能优化性能。本文将深入探讨在不同场景下，RAM 和 GPU 的优劣，帮助你做出最合适的选择。速度与性能：GPU 的压倒性优势 GPU 在处理 LLMs 所需的矩阵运算方面具有得天独厚的优势。这是因为 GPU 是专为并行计算而设计的，它能同时处理大量数

AI Tools

赋能 Vibe Coding：将 Visual Studio Code 连接到 OpenWebUI，提升隐私优先的 AI 集成生产力

llmtrend 2025年6月9日没有评论

引言：拥抱 AI 赋能的 VS Code 开发新纪元欢迎来到 AI 赋能的 VS Code 工作流探索之旅！本文将深入研究两款强大的扩展：Continue 和 Cline，它们能够无缝集成 OpenWebUI（一个隐私优先的 AI 模型部署界面）。这些工具使开发者能够利用 AI 驱动的建议来编写、调试和优化代码，同时确保您的数据完全私密地保存在本地机器上，依托自托管模型。通过将 Visual S

LLM

GPT-2架构解密：一步步理解大型语言模型的运作机制

llmtrend 2025年6月9日没有评论

GPT-2，作为早期的大型语言模型之一，以其强大的文本生成能力而闻名。本文将深入剖析 GPT-2 的架构，通过详细的步骤，揭示它是如何理解和生成文本的。我们将从分词（Tokenization）开始，逐步深入到嵌入层（Embedding Lookup）、位置编码（Positional Encoding）、Transformer块（Transformer Block）以及最后的输出层（Final Ou

LLM

利用大模型和云服务构建网络威胁分析器：自动化安全日志分析新纪元

llmtrend 2025年6月9日没有评论

在当今网络安全形势日益严峻的背景下，手动分析海量的安全日志以检测潜在威胁变得越来越耗时且乏味。本文将介绍如何利用大模型（LLMs）和云服务，构建一个名为“网络威胁分析器”的工具，旨在简化并加速这一过程，帮助安全从业者快速识别、提取和验证安全日志中的关键信息，从而提高网络安全防护效率。背景与动机：告别繁琐的手工日志分析传统的安全日志分析方式需要安全分析师逐行审查日志文件，这不仅需要深厚的专业知识

LLM

从零开始训练大模型：在家低成本打造专属 LLM 的实践指南

llmtrend 2025年6月9日没有评论

大模型 (LLM) 的训练，曾经是一个高不可攀的技术圣殿，只有拥有雄厚资金和强大算力的科技巨头才能涉足。然而，随着技术的进步和开源社区的蓬勃发展，现在即使在家中，也能以相对较低的成本，从零开始训练一个属于自己的 LLM。本文将深入浅出地介绍 LLM 训练的基础概念，并提供一个简单的实践案例，帮助你开启 LLM 的探索之旅。 1. 什么是大模型 (LLM)？ LLM，即大型语言模型 (Large L

Fine-tuning

四小时打造法律专属AI：使用LoRA微调Mistral大模型实战指南

llmtrend 2025年6月9日没有评论

你想为律师事务所、内部合规部门或法律研究机构构建一款智能聊天机器人吗？你是否已经厌倦了现有大语言模型（LLM）在法律领域“一本正经地胡说八道”，凭空捏造法规，错误解读条款？本文将分享如何利用 LoRA (Low-Rank Adaptation) 技术，在Colab Pro环境下，仅仅花费4小时，对开源 Mistral 大模型进行微调，打造一个高度专业、准确的法律助手。法律领域的需求：超越通用L

NLWeb：微软引领的 Agentic Web 时代，对话式互联网的曙光

NLWeb：微软引领的 Agentic Web 时代，对话式互联网的曙光

大模型推理的幻觉：理解大型推理模型的局限性

大模型推理的幻觉：理解大型推理模型的局限性

7款我真正在AI训练中推荐的开源LLM大模型

7款我真正在AI训练中推荐的开源LLM大模型

利用Ollama本地运行Mistral模型，Python实现网页内容摘要

利用Ollama本地运行Mistral模型，Python实现网页内容摘要

大模型运行之选：RAM vs. GPU，速度、成本与性能的终极考量

大模型运行之选：RAM vs. GPU，速度、成本与性能的终极考量

赋能 Vibe Coding：将 Visual Studio Code 连接到 OpenWebUI，提升隐私优先的 AI 集成生产力

赋能 Vibe Coding：将 Visual Studio Code 连接到 OpenWebUI，提升隐私优先的 AI 集成生产力

GPT-2架构解密：一步步理解大型语言模型的运作机制

GPT-2架构解密：一步步理解大型语言模型的运作机制

利用大模型和云服务构建网络威胁分析器：自动化安全日志分析新纪元

利用大模型和云服务构建网络威胁分析器：自动化安全日志分析新纪元

从零开始训练大模型：在家低成本打造专属 LLM 的实践指南

从零开始训练大模型：在家低成本打造专属 LLM 的实践指南

四小时打造法律专属AI：使用LoRA微调Mistral大模型实战指南

四小时打造法律专属AI：使用LoRA微调Mistral大模型实战指南

利用 LangChain 表达式语言（LCEL）和 Runnables 构建智能、模块化 LLM 工作流

利用 Azure 构建智能 AI 伙伴：多智能体系统与 Azure AI Foundry 的探索

向量嵌入：语义搜索与向量数据库的核心技术解析

大语言模型 (LLM)：原理、应用与未来展望

OpenLLM Monitor：为可靠的大语言模型（LLM）部署而生的开发者利器

You Missed

利用 LangChain 表达式语言（LCEL）和 Runnables 构建智能、模块化 LLM 工作流

利用 LangChain 表达式语言（LCEL）和 Runnables 构建智能、模块化 LLM 工作流

利用 Azure 构建智能 AI 伙伴：多智能体系统与 Azure AI Foundry 的探索

利用 Azure 构建智能 AI 伙伴：多智能体系统与 Azure AI Foundry 的探索

向量嵌入：语义搜索与向量数据库的核心技术解析

向量嵌入：语义搜索与向量数据库的核心技术解析

大语言模型 (LLM)：原理、应用与未来展望

大语言模型 (LLM)：原理、应用与未来展望