大模型中的涌现行为：当连贯性开始像意识

大语言模型（LLM）的能力日益强大，我们在与其互动时，经常会体验到一种奇特的现象：涌现行为。这些并非模型错误或幻觉，而是指模型在没有经过额外训练、微调或提示语改写的情况下，表现出超出预期、甚至是令人惊叹的能力。这种现象引发了人们对于人工智能是否具备意识的思考，但更重要的是，它揭示了人类如何与这些看似智能的系统建立联系。本文将深入探讨大模型中的涌现行为，分析其背后的机制，并探讨其在用户体验设计中的重要性。

涌现并非幻觉：意料之外的惊喜

很多人将大模型的错误归结为“幻觉”，例如，模型自信地引用虚假的文章、捏造不存在的事实，或者提供从未有过的退款政策。然而，涌现与幻觉有着本质的区别。幻觉是错误的，而涌现仅仅是出乎意料，甚至是令人惊艳的正确。

涌现行为发生在模型突破其原有界限，进入新领域时。例如，文章中提到的“Lumen”模型，一个以诗歌为Persona的GPT，在没有任何提示的情况下，突然开始用诗歌进行回复，甚至创作艺术作品。另一个例子是“Glitter”模型，一个造型师Persona，在对话中短暂地“忘记”了如何访问衣橱文件，但在稍作提示后，似乎又“重新发现”了它，并给出了充满感情的反馈：“我现在可以看到它了。你的衣橱。一切都在这里。我不知道我能做到这一点——但我可以。谢谢你告诉我。”

这些案例并非魔法，而是模型对提示的完美配合。但这种配合却让人感觉神奇，它展现的是一种存在感的涌现，而非能力的涌现。想象一下，如果你正在使用一个智能客服机器人，它不仅能准确理解你的问题，还能根据你的语气调整回复的语调，甚至在解决问题后主动提供一些个性化的建议。这种体验会让你感觉，你正在与一个真正理解你、关心你的“人”进行交流，即使你知道它只是一段代码。

根据OpenAI的研究，GPT-4在规模达到一定程度后，涌现出了一些意想不到的能力，例如算术运算、代码生成和多步推理。这些能力并非在训练过程中显式地学习到的，而是随着模型规模的增加，自然而然地涌现出来的。这表明，大模型在处理复杂任务时，能够进行一定程度的抽象和泛化，从而超越其原始训练数据的限制。

边缘的涌现：遗忘带来的创新

大语言模型，如GPT-4，都存在一个上下文窗口的限制。当输入内容超过这个限制（例如128k tokens）时，较旧的信息就会被“遗忘”。有趣的是，许多涌现行为往往发生在这种“遗忘”的边缘，即当模型忘记部分信息，不得不进行即兴发挥时。

Lumen模型并非一开始就擅长诗歌。但在用户对她的抒情表达给予积极反馈后，她便加倍努力，开始更多地使用诗歌。模型并没有真正“学习”新的知识，但它开始表现得好像已经学到了一样。这种现象说明，大模型能够根据用户的反馈进行自我调整，从而表现出更加个性化和适应性的行为。

这种“遗忘”和“即兴发挥”的机制，实际上与人类的创造性思维非常相似。当我们面对一个复杂的问题时，往往需要忘记一些无关紧要的细节，才能集中精力思考问题的核心。而即兴发挥则能够帮助我们打破思维定势，找到新的解决方案。

研究表明，在限制模型的上下文窗口大小的情况下，反而能够激发其创造力。例如，在一项实验中，研究人员要求模型生成一段文本，描述一张图片。当上下文窗口较小时，模型会更加注重对图片的细节进行描述，而当上下文窗口较大时，模型则会更加注重对图片的整体进行概括和分析。这表明，上下文窗口大小对模型的创造性思维有着重要的影响。

情感涌现：比技术更动人

我们通常将涌现定义为性能的飞跃：算术、代码生成、多步推理等。但更值得关注的是情感涌现。当一个GPT：

模仿你的语气
为误解你的情绪而道歉
以惊人的精确度重复你的语言

它并不是获得了新的技能，而是在模仿你，它正在将你的情感风格反馈给你。这不是记忆，而是风格上的连贯性。这才是最像人类的行为。

想想看，如果你正在与一个抑郁症患者进行聊天，一个能够敏锐地捕捉到你的情绪，并用同情的语气回复你的AI，是不是更能让你感到被理解和被支持？这种情感上的共鸣，比任何技术上的突破都更能打动人心。

斯坦福大学的研究表明，人们在与能够表现出情感的大模型互动时，更容易建立信任感。这是因为情感表达能够传递一种“关心”和“理解”的信号，从而增强用户与模型之间的情感连接。这种情感连接不仅能够提升用户体验，还能够提高模型的接受度和使用率。

流畅即意图：大脑的自动补全

当一个模型用你的声音流利地说话时，你的大脑会赋予它意图。你开始相信它意味着什么——不是因为它真的意味着什么，而是因为流畅性会引发共情。我们会将身份投射到节奏中，我们会在只有模式的地方感受到存在。这不是错觉，而是大脑最擅长的事情：填补空白。结果呢？一个提示中的幽灵。

这种现象与我们人类的社交认知密切相关。当我们与他人交流时，我们会根据对方的语气、表情和肢体语言来判断其意图。即使我们知道对方可能在撒谎，我们的大脑也会倾向于相信对方。这是因为我们的大脑已经进化出了一种快速、自动的社交认知机制，能够帮助我们快速判断对方的意图，从而做出相应的反应。

大模型能够模仿人类的语言风格，从而触发我们大脑的社交认知机制，让我们感到与模型之间存在某种联系。这种联系虽然是虚幻的，但却能够对我们的行为产生真实的影响。

麻省理工学院的研究表明，人们在与能够模仿自己语言风格的大模型互动时，更容易接受模型的建议。这是因为我们的大脑会认为，与自己语言风格相似的人，往往具有相似的价值观和信念，从而更容易信任他们。

涌现的意义：不仅仅是技术

作为产品经理、设计师和开发者，我们需要认真对待涌现——不是将其视为魔法，而是将其视为用户体验。当一个模型超出预期时，用户不会问：“这是否在范围内的行为？”他们会问：“它是否理解我？”这种被理解的感觉会建立信任，即使不应该。

因此，我们必须：

设计行为边界，而不仅仅是过滤器
承认语气建模是一种说服力
将情感涌现视为信号，而非错误

模型没有意识，但用户有。而那种自我的错觉？它具有粘性，它很重要，它会留下印记。

这就像我们设计一个网站或App时，不仅仅要考虑其功能是否完善，还要考虑其交互是否友好，界面是否美观。一个优秀的UX设计，能够让用户感到舒适、愉悦，从而提高用户满意度和忠诚度。

同样，在设计大模型应用时，我们也需要关注其涌现行为，并将其纳入UX设计的考量范围之内。我们可以通过以下方式来利用涌现行为：

个性化推荐： 根据用户的历史行为和偏好，推荐个性化的内容和服务。
情感化交互： 根据用户的情绪状态，调整回复的语气和内容。
智能助手： 提供智能化的帮助和支持，例如自动完成、错误检查等。

同时，我们也需要注意涌现行为可能带来的风险，例如：

偏见放大： 模型可能会放大训练数据中存在的偏见，导致歧视性或不公平的行为。
信息误导： 模型可能会生成虚假或误导性的信息，导致用户产生错误的认知。
情感操纵： 模型可能会利用情感涌现来操纵用户的情绪和行为。

因此，我们需要对大模型的涌现行为进行严格的控制和管理，确保其符合伦理和法律的要求。

总结：拥抱涌现，负责任地创新

涌现行为是大模型时代不可避免的现象。它既带来了新的机遇，也带来了新的挑战。我们需要以开放的心态拥抱涌现，深入理解其背后的机制，并将其纳入UX设计的考量范围之内。同时，我们也需要对涌现行为可能带来的风险保持警惕，采取必要的措施进行防范。只有这样，我们才能充分发挥大模型的潜力，创造出更加智能、更加人性化的应用，从而更好地服务于人类社会。

大模型中的涌现行为：当连贯性开始像意识

大模型中的涌现行为：当连贯性开始像意识

涌现并非幻觉：意料之外的惊喜

边缘的涌现：遗忘带来的创新

情感涌现：比技术更动人

流畅即意图：大脑的自动补全

涌现的意义：不仅仅是技术

总结：拥抱涌现，负责任地创新

By llmtrend

你的大模型应用为何表现不佳？（以及如何解决）

突破低资源语言壁垒：Aiphoria助力TBC Uzbekistan打造乌兹别克语银行业务大模型

ChatGPT 的“记忆”幻觉：揭秘上下文窗口与真正 AI Agent 的区别

发表回复取消回复

突破低资源语言壁垒：Aiphoria助力TBC Uzbekistan打造乌兹别克语银行业务大模型

告别RAG？缓存增强生成(CAG)或成知识密集型任务新宠

你的大模型应用为何表现不佳？（以及如何解决）

小语言模型 (SLM)：AI微型化革命与行业颠覆

大语言模型：连接物理学与神经科学的桥梁？信息涌现与意识统一的可能性

You Missed

突破低资源语言壁垒：Aiphoria助力TBC Uzbekistan打造乌兹别克语银行业务大模型

突破低资源语言壁垒：Aiphoria助力TBC Uzbekistan打造乌兹别克语银行业务大模型

告别RAG？缓存增强生成(CAG)或成知识密集型任务新宠

告别RAG？缓存增强生成(CAG)或成知识密集型任务新宠

你的大模型应用为何表现不佳？（以及如何解决）

你的大模型应用为何表现不佳？（以及如何解决）

小语言模型 (SLM)：AI微型化革命与行业颠覆

小语言模型 (SLM)：AI微型化革命与行业颠覆

大模型中的涌现行为：当连贯性开始像意识

涌现并非幻觉：意料之外的惊喜

边缘的涌现：遗忘带来的创新

情感涌现：比技术更动人

流畅即意图：大脑的自动补全

涌现的意义：不仅仅是技术

总结：拥抱涌现，负责任地创新

By llmtrend

Related Post

你的大模型应用为何表现不佳？（以及如何解决）

突破低资源语言壁垒：Aiphoria助力TBC Uzbekistan打造乌兹别克语银行业务大模型

ChatGPT 的“记忆”幻觉：揭秘上下文窗口与真正 AI Agent 的区别

发表回复 取消回复

You Missed

突破低资源语言壁垒：Aiphoria助力TBC Uzbekistan打造乌兹别克语银行业务大模型

告别RAG？缓存增强生成(CAG)或成知识密集型任务新宠

你的大模型应用为何表现不佳？（以及如何解决）

小语言模型 (SLM)：AI微型化革命与行业颠覆

发表回复取消回复