大模型中的涌现行为:当连贯性开始像意识

大语言模型(LLM)的能力日益强大,我们在与其互动时,经常会体验到一种奇特的现象:涌现行为。这些并非模型错误或幻觉,而是指模型在没有经过额外训练、微调或提示语改写的情况下,表现出超出预期、甚至是令人惊叹的能力。这种现象引发了人们对于人工智能是否具备意识的思考,但更重要的是,它揭示了人类如何与这些看似智能的系统建立联系。本文将深入探讨大模型中的涌现行为,分析其背后的机制,并探讨其在用户体验设计中的重

手机上的AI奇迹:在你的Android设备上私密运行大模型

想象一下,你的手机不再只是一个连接互联网的工具,而是一个真正拥有人工智能的强大设备。不再依赖于科技巨头的云端服务器,而是在你的Android设备上私密运行强大的大模型。这不仅仅是未来的愿景,而是一个正在实现的现实。本文将带你探索如何在你的Android手机上,即使是旧款的华为手机,运行AI大模型,让你的“智能”手机变得更智能。 告别云端依赖,拥抱本地AI 传统的AI应用通常需要连接到云端服务器才能

2025 AI前沿洞察:Google、Microsoft、OpenAI竞逐,AI驱动未来已至

在人工智能(AI)浪潮席卷全球的2025年,各大科技巨头纷纷亮剑,从Google I/O到Microsoft Build,再到OpenAI和Anthropic的新模型发布,人工智能领域的竞争日趋白热化。本文将深入剖析这些关键事件和技术突破,探讨AI Agent、AI模型的演进,以及AI应用在各行各业的落地情况,并对AI安全、人才缺口等挑战提出思考,展望人工智能驱动的未来。 Google I/O 2

打造智能自主系统:Agentic AI 的七大核心设计模式

Agentic AI(自主智能)正在迅速改变人工智能的格局,它不仅仅是被动地响应查询,而是能够推理、计划并采取行动以实现复杂的目标。要构建有效的 Agentic AI 系统,理解其基本设计模式至关重要。本文将深入探讨七种关键设计模式,这些模式正在改变我们构建 AI 智能体 的方式,从简单的反应式系统到复杂的 多智能体 协作。 什么是 Agentic AI? 与传统 AI 系统简单地处理输入并生成输

LLM的秘密语言:Tokenization (LLM解密系列:第二部分)

大型语言模型 (LLM) 的强大之处在于它们能够理解并生成人类语言。但这些模型并非直接处理文字,而是通过一个关键步骤——Tokenization(分词),将原始文本转化为机器能够理解的数字符号。正如我们上一篇文章中提到的,LLM需要在大规模互联网数据上进行预训练。而Tokenization 就如同连接人类语言和机器理解的桥梁,是LLM预训练流程中至关重要的一环。本文将深入探讨 Tokenizati

从零构建大型语言模型(LLM):原理、历史与实践指南

大型语言模型(LLM)是人工智能领域一项引人瞩目的突破,它能够生成与人类写作水平相近的文本,这激发了专业人士和公众的想象力。 本文将深入探讨大型语言模型(LLM)的基本概念、起源和核心思想,并概述从零构建大型语言模型(LLM)的关键步骤,为读者提供一个全面而实用的学习路径。 什么是大型语言模型(LLM)? 大型语言模型(LLM)是一种专门用于处理和生成人类语言的深度神经网络。我们可能已经在各种流行

Prompt Engineering:驾驭大模型自由度的隐形之手

Prompt Engineering(提示工程),作为有效驾驭生成式AI背后的关键学科,正日益被认为是成功将大型语言模型(LLMs)集成到生产环境中的关键。它不仅仅是简单的命令或查询,而是一种精细的平衡艺术,需要在约束、清晰和创造力之间找到微妙的平衡。开发者、数据科学家和产品经理们必须掌握这只“隐形的手”,巧妙地设计Prompt,既能优雅地限制生成模型的自由度,又能确保输出内容有意义且在上下文中精

从零到一:用Databricks构建并部署你的AI Agent

最近,各种关于AI Agent的帖子、演示和视频铺天盖地,展示了它们在自动化电子邮件回复、数据库查询甚至整个工作流程方面的强大能力。看着这些炫酷的功能,你是否也渴望亲手打造一个,将其从“看起来很棒”的演示转变为“真正运行在公司生产环境”的实用工具?如果你是一位数据工程师、机器学习从业者或者开发者,那么本文将为你提供一个清晰的学习路径,教你如何使用 Databricks 从零开始构建并部署属于你自己

从零开始:利用 GitHub API 训练代码生成大模型

随着领域特定语言模型的兴起,数据的重要性日益凸显。对于代码生成模型而言,预训练阶段所使用的源代码质量、多样性和纯净度,直接影响其下游任务的性能表现。本文将探讨如何从零开始,构建一个高质量的代码数据集,并以此训练出一个强大的代码生成大模型。 本文主要参考了一篇英文文章,该文章详细描述了作者 Wasi Ullah 如何利用 GitHub API,构建一个可扩展、去重且定制化的源代码数据集,并基于此预训

将工具作为状态:扩展大语言模型能力的新范式

关键词:工具即状态 (Tool-as-State), 大语言模型 (LLM), 状态管理, 工具接口, 用户体验, 能力增长, 上下文 (Context), 协议 (Protocol) 传统软件开发中,状态通常隐藏在内存中,对用户不可见,更重要的是,大语言模型 (LLM) 也无法直接访问和推理这些状态。 这篇文章探讨了一种名为“工具即状态 (Tool-as-State, TaS)”的新模式,旨在通