6 月 2025

Bagel-ai：免费入局LLM与图像生成的敲门砖？

llmtrend 2025年6月6日没有评论

对于想要探索大语言模型（LLM）和图像生成技术，却又苦于高昂成本的朋友们，Bagel-ai或许是一个值得尝试的选择。虽然Bagel-ai在速度上存在明显的短板，但作为一款免费工具，它所提供的功能范围和易用性，使其具备一定的吸引力，尤其适合入门级的学习和体验。本文将深入探讨Bagel-ai的功能特点、优缺点，以及它在大模型技术普及中的潜在价值。 Bagel-ai：免费的LLM与图像生成入门通道 Ba

Agent

Google ADK：构建智能AI代理的全面指南

llmtrend 2025年6月6日没有评论

在人工智能领域快速发展的大背景下，从简单的聊天机器人到复杂的自主代理系统，标志着我们正在见证一场意义深远的范式转变。Google的代理开发工具包（ADK）应运而生，它弥合了这一差距，为开发人员提供了一种结构化的、可用于生产的构建智能代理系统的方案。本文将深入探讨ADK的架构、各种代理类型、工具生态系统以及实际应用，为你提供构建强大AI代理系统的蓝图。 ADK的核心优势：代码优先与自主性 ADK与传

LLM Evaluation

大模型SQL生成准确率评估：构建可靠的数据分析AI系统

llmtrend 2025年6月6日没有评论

近年来，大模型（LLM）技术，如ChatGPT、Snowflake Cortext AI、Claude和Gemini，在SQL查询生成方面展现出惊人的能力，使得自然语言查询数据库成为可能。然而，生成的SQL是否真正准确？如何客观评估其准确率？本文将深入探讨如何使用黄金标准对比、结果集验证以及可选的LLM作为裁判的语义评估，来评估LLM生成的SQL查询的准确性，并提供一个可立即使用的Python项

LLM

Promptmind觉醒：100天解锁生成式AI与大语言模型的力量

llmtrend 2025年6月6日没有评论

欢迎来到Promptmind的觉醒之旅！这是一篇关于生成式AI和大语言模型 (LLM) 的100天深度探索日志，旨在帮助开发者、研究人员以及对AI充满好奇的探索者们，真正掌握提示工程(Prompt Engineering) 的核心技能，从简单的“玩转”AI工具，到能够构建实际的、具有商业价值的 GenAI 应用。我们将一起见证普通开发者如何蜕变为真正的 Promptmind，能够从GenAI的原始

LLM

BitNet：1.58位量化的奇迹，让大模型本地运行触手可及

llmtrend 2025年6月6日没有评论

BitNet 的出现无疑是大型语言模型 (LLM) 领域的一大突破。它采用革命性的1.58位量化技术，使得原本只能在服务器上运行的巨型模型，现在可以在你的笔记本电脑上，甚至树莓派上流畅运行。本文将深入探讨 BitNet 的核心优势、安装部署方法，以及它对未来人工智能发展的重要意义。 1.58位量化：极致轻量化的秘密 BitNet 最引人注目的特点是其 1.58 位量化技术。传统的 LLM 通常采用

Agent

多智能体系统中的非对称上下文窗口管理：大模型互操作性的关键挑战

llmtrend 2025年6月6日没有评论

随着企业级AI应用中AI智能体互操作性日益普及，AI工程师们面临着一个常常被忽视但至关重要的挑战：多个AI智能体拥有不同大小的上下文窗口。例如，当一个智能体使用2K token的限制，而另一个智能体使用8K token时，它们共享知识、保持连续性和高效协作的能力就会变得不对称。这种非对称上下文窗口的管理，直接影响着多智能体系统的性能和可靠性。本文将深入探讨这一问题的重要性，并提供相应的设计方案，助

AI Tools

Ollama VRAM 泄漏排查利器：脚本化检测与清理

llmtrend 2025年6月6日没有评论

Ollama 作为一款强大的大模型本地部署工具，因其便捷性受到了广泛欢迎。然而，在 v0.7.0 之前的版本中，存在一个隐蔽的 VRAM 泄漏问题，即使卸载模型后，GPU 显存也可能被逐渐耗尽。本文将深入探讨这一问题，并介绍一款由 DeepSeek V3 驱动的 Bash 脚本，它可以自动化检测和清理这些“僵尸进程”，有效解决 Ollama VRAM 泄漏问题，保持系统稳定运行。 VRAM 泄

LLM

大模型（LLM）：一场概率的游戏，一场质量的豪赌，一场人性的考验

llmtrend 2025年6月6日没有评论

当人工智能（AI），特别是大模型（LLM）如ChatGPT，以惊人的速度渗透到我们生活的方方面面时，最初的惊艳和好奇之后，随之而来的是更深层次的思考和质疑。大模型真的如此万能？它的局限性在哪里？以及，它对我们的工作、创造和人性，又意味着什么？本文将从大模型的核心概念、输出质量、伦理道德以及对人类的影响这几个关键方面，深入探讨这一炙手可热的技术。大模型（LLM）的核心：概率机器的本质大模型（LL

LLM

从零构建Mini-GPT：用PyTorch探索大模型的核心

llmtrend 2025年6月6日没有评论

语言模型的工作原理一直是人们好奇的焦点。本文将深入探讨如何使用PyTorch从零开始构建一个简易版的GPT模型（Mini-GPT），剖析其核心机制。灵感来源于nanoGPT项目，并参考了“Attention is All You Need”论文中的注意力机制，我们将一步步地搭建起这个小型大模型，一窥其内部运作的奥秘。数据集的准备：模型之基构建任何大模型的第一步都是准备高质量的数据集。数据是模型

Prompt

生成式AI时代：提示工程的演进与重要性

llmtrend 2025年6月6日没有评论

随着生成式AI系统日益成为现代工作流程的核心，一种全新的技能应运而生，它解锁了AI的真正潜力：提示工程。曾经被视为一种古怪的变通方法，现在已经发展成为一门严谨的学科，对于构建可靠、可控和目标驱动的AI系统至关重要。它的发展反映了用户、开发者和企业如何适应GPT-4、Claude、Gemini等日益强大的模型，以及LLaMA和Mistral等开源替代方案。早期探索：试错的艺术在像GPT-2这样的

Bagel-ai：免费入局LLM与图像生成的敲门砖？

Bagel-ai：免费入局LLM与图像生成的敲门砖？

Google ADK：构建智能AI代理的全面指南

Google ADK：构建智能AI代理的全面指南

大模型SQL生成准确率评估：构建可靠的数据分析AI系统

大模型SQL生成准确率评估：构建可靠的数据分析AI系统

Promptmind觉醒：100天解锁生成式AI与大语言模型的力量

Promptmind觉醒：100天解锁生成式AI与大语言模型的力量

BitNet：1.58位量化的奇迹，让大模型本地运行触手可及

BitNet：1.58位量化的奇迹，让大模型本地运行触手可及

多智能体系统中的非对称上下文窗口管理：大模型互操作性的关键挑战

多智能体系统中的非对称上下文窗口管理：大模型互操作性的关键挑战

Ollama VRAM 泄漏排查利器：脚本化检测与清理

Ollama VRAM 泄漏排查利器：脚本化检测与清理

大模型（LLM）：一场概率的游戏，一场质量的豪赌，一场人性的考验

大模型（LLM）：一场概率的游戏，一场质量的豪赌，一场人性的考验

从零构建Mini-GPT：用PyTorch探索大模型的核心

从零构建Mini-GPT：用PyTorch探索大模型的核心

生成式AI时代：提示工程的演进与重要性

生成式AI时代：提示工程的演进与重要性

悄然崛起的环境代理：你的隐形数字管家触手可及

基于 Rust 和 Tauri 构建本地优先 AI：一个 LLM 离线应用的技术蓝图

生成式AI重塑创意与创新：2025年技术、伦理与未来展望

大模型驱动具身智能的“幻觉”危机：一项关于场景-任务不一致性的实证研究

数字时代的普罗米修斯：生成式AI如何重塑思考、创造与认知

You Missed

悄然崛起的环境代理：你的隐形数字管家触手可及

悄然崛起的环境代理：你的隐形数字管家触手可及

基于 Rust 和 Tauri 构建本地优先 AI：一个 LLM 离线应用的技术蓝图

基于 Rust 和 Tauri 构建本地优先 AI：一个 LLM 离线应用的技术蓝图

生成式AI重塑创意与创新：2025年技术、伦理与未来展望

生成式AI重塑创意与创新：2025年技术、伦理与未来展望

大模型驱动具身智能的“幻觉”危机：一项关于场景-任务不一致性的实证研究

大模型驱动具身智能的“幻觉”危机：一项关于场景-任务不一致性的实证研究