LLM TREND

大模型中的涌现行为：当连贯性开始像意识

llmtrend 2025年5月29日没有评论

大语言模型（LLM）的能力日益强大，我们在与其互动时，经常会体验到一种奇特的现象：涌现行为。这些并非模型错误或幻觉，而是指模型在没有经过额外训练、微调或提示语改写的情况下，表现出超出预期、甚至是令人惊叹的能力。这种现象引发了人们对于人工智能是否具备意识的思考，但更重要的是，它揭示了人类如何与这些看似智能的系统建立联系。本文将深入探讨大模型中的涌现行为，分析其背后的机制，并探讨其在用户体验设计中的重

LLM

手机上的AI奇迹：在你的Android设备上私密运行大模型

llmtrend 2025年5月29日没有评论

想象一下，你的手机不再只是一个连接互联网的工具，而是一个真正拥有人工智能的强大设备。不再依赖于科技巨头的云端服务器，而是在你的Android设备上私密运行强大的大模型。这不仅仅是未来的愿景，而是一个正在实现的现实。本文将带你探索如何在你的Android手机上，即使是旧款的华为手机，运行AI大模型，让你的“智能”手机变得更智能。告别云端依赖，拥抱本地AI 传统的AI应用通常需要连接到云端服务器才能

AI News

2025 AI前沿洞察：Google、Microsoft、OpenAI竞逐，AI驱动未来已至

llmtrend 2025年5月29日没有评论

在人工智能（AI）浪潮席卷全球的2025年，各大科技巨头纷纷亮剑，从Google I/O到Microsoft Build，再到OpenAI和Anthropic的新模型发布，人工智能领域的竞争日趋白热化。本文将深入剖析这些关键事件和技术突破，探讨AI Agent、AI模型的演进，以及AI应用在各行各业的落地情况，并对AI安全、人才缺口等挑战提出思考，展望人工智能驱动的未来。 Google I/O 2

Agent

打造智能自主系统：Agentic AI 的七大核心设计模式

llmtrend 2025年5月29日没有评论

Agentic AI（自主智能）正在迅速改变人工智能的格局，它不仅仅是被动地响应查询，而是能够推理、计划并采取行动以实现复杂的目标。要构建有效的 Agentic AI 系统，理解其基本设计模式至关重要。本文将深入探讨七种关键设计模式，这些模式正在改变我们构建 AI 智能体的方式，从简单的反应式系统到复杂的多智能体协作。什么是 Agentic AI？与传统 AI 系统简单地处理输入并生成输

LLM

LLM的秘密语言：Tokenization (LLM解密系列：第二部分)

llmtrend 2025年5月29日没有评论

大型语言模型 (LLM) 的强大之处在于它们能够理解并生成人类语言。但这些模型并非直接处理文字，而是通过一个关键步骤——Tokenization（分词），将原始文本转化为机器能够理解的数字符号。正如我们上一篇文章中提到的，LLM需要在大规模互联网数据上进行预训练。而Tokenization 就如同连接人类语言和机器理解的桥梁，是LLM预训练流程中至关重要的一环。本文将深入探讨 Tokenizati

LLM

从零构建大型语言模型（LLM）：原理、历史与实践指南

llmtrend 2025年5月29日没有评论

大型语言模型（LLM）是人工智能领域一项引人瞩目的突破，它能够生成与人类写作水平相近的文本，这激发了专业人士和公众的想象力。本文将深入探讨大型语言模型（LLM）的基本概念、起源和核心思想，并概述从零构建大型语言模型（LLM）的关键步骤，为读者提供一个全面而实用的学习路径。什么是大型语言模型（LLM）？大型语言模型（LLM）是一种专门用于处理和生成人类语言的深度神经网络。我们可能已经在各种流行

Prompt

Prompt Engineering：驾驭大模型自由度的隐形之手

llmtrend 2025年5月29日没有评论

Prompt Engineering（提示工程），作为有效驾驭生成式AI背后的关键学科，正日益被认为是成功将大型语言模型（LLMs）集成到生产环境中的关键。它不仅仅是简单的命令或查询，而是一种精细的平衡艺术，需要在约束、清晰和创造力之间找到微妙的平衡。开发者、数据科学家和产品经理们必须掌握这只“隐形的手”，巧妙地设计Prompt，既能优雅地限制生成模型的自由度，又能确保输出内容有意义且在上下文中精

Agent

从零到一：用Databricks构建并部署你的AI Agent

llmtrend 2025年5月29日没有评论

最近，各种关于AI Agent的帖子、演示和视频铺天盖地，展示了它们在自动化电子邮件回复、数据库查询甚至整个工作流程方面的强大能力。看着这些炫酷的功能，你是否也渴望亲手打造一个，将其从“看起来很棒”的演示转变为“真正运行在公司生产环境”的实用工具？如果你是一位数据工程师、机器学习从业者或者开发者，那么本文将为你提供一个清晰的学习路径，教你如何使用 Databricks 从零开始构建并部署属于你自己

LLM

从零开始：利用 GitHub API 训练代码生成大模型

llmtrend 2025年5月29日没有评论

随着领域特定语言模型的兴起，数据的重要性日益凸显。对于代码生成模型而言，预训练阶段所使用的源代码质量、多样性和纯净度，直接影响其下游任务的性能表现。本文将探讨如何从零开始，构建一个高质量的代码数据集，并以此训练出一个强大的代码生成大模型。本文主要参考了一篇英文文章，该文章详细描述了作者 Wasi Ullah 如何利用 GitHub API，构建一个可扩展、去重且定制化的源代码数据集，并基于此预训

LLM

将工具作为状态：扩展大语言模型能力的新范式

llmtrend 2025年5月29日没有评论

关键词：工具即状态 (Tool-as-State), 大语言模型 (LLM), 状态管理, 工具接口, 用户体验, 能力增长, 上下文 (Context), 协议 (Protocol) 传统软件开发中，状态通常隐藏在内存中，对用户不可见，更重要的是，大语言模型 (LLM) 也无法直接访问和推理这些状态。这篇文章探讨了一种名为“工具即状态 (Tool-as-State, TaS)”的新模式，旨在通

LLM TREND

大模型中的涌现行为：当连贯性开始像意识

大模型中的涌现行为：当连贯性开始像意识

手机上的AI奇迹：在你的Android设备上私密运行大模型

手机上的AI奇迹：在你的Android设备上私密运行大模型

2025 AI前沿洞察：Google、Microsoft、OpenAI竞逐，AI驱动未来已至

2025 AI前沿洞察：Google、Microsoft、OpenAI竞逐，AI驱动未来已至

打造智能自主系统：Agentic AI 的七大核心设计模式

打造智能自主系统：Agentic AI 的七大核心设计模式

LLM的秘密语言：Tokenization (LLM解密系列：第二部分)

LLM的秘密语言：Tokenization (LLM解密系列：第二部分)

从零构建大型语言模型（LLM）：原理、历史与实践指南

从零构建大型语言模型（LLM）：原理、历史与实践指南

Prompt Engineering：驾驭大模型自由度的隐形之手

Prompt Engineering：驾驭大模型自由度的隐形之手

从零到一：用Databricks构建并部署你的AI Agent

从零到一：用Databricks构建并部署你的AI Agent

从零开始：利用 GitHub API 训练代码生成大模型

从零开始：利用 GitHub API 训练代码生成大模型

将工具作为状态：扩展大语言模型能力的新范式

将工具作为状态：扩展大语言模型能力的新范式

pydiode：揭秘 ChatGPT Python Canvas 的运行时真相

大语言模型 (LLM)：聊天机器人背后的智能大脑，理解 Tokens、Transformers 以及 ChatGPT 的工作原理

大模型时代的“天鹅绒牢笼”：重塑智识主权宣言

本地构建强大AI智能体：无需云端，无需订阅，只需代码

You Missed

pydiode：揭秘 ChatGPT Python Canvas 的运行时真相

pydiode：揭秘 ChatGPT Python Canvas 的运行时真相

大语言模型 (LLM)：聊天机器人背后的智能大脑，理解 Tokens、Transformers 以及 ChatGPT 的工作原理

大语言模型 (LLM)：聊天机器人背后的智能大脑，理解 Tokens、Transformers 以及 ChatGPT 的工作原理

大模型时代的“天鹅绒牢笼”：重塑智识主权宣言

大模型时代的“天鹅绒牢笼”：重塑智识主权宣言

利用生成式AI（GenAI）进行数据增强与合成：提升模型性能的实战指南