GPT-4o 上演“无限猜色”实验：揭秘大模型上下文窗口、幻觉与“提示疲劳”的真相

大型语言模型（LLM）在处理复杂任务时表现出了惊人的能力，但其内在局限性也逐渐显现。本文将深入探讨 GPT-4o 在一项名为“无限猜色”的简单实验中暴露出的上下文窗口限制、幻觉问题以及“提示疲劳”现象，并分析这些问题对实际人工智能应用的影响。

上下文窗口：GPT-4o 的“记忆”边界

上下文窗口指的是 LLM 在生成回复时能够考虑的最大文本长度。当对话超出上下文窗口的范围时，模型可能会“忘记”早期的信息，导致回复不一致或出现错误。在“无限猜色”实验中，作者让 GPT-4o 反复猜测颜色，并在每次猜测后告知其错误。随着对话的进行，上下文窗口逐渐被填满，GPT-4o 开始表现出“提示疲劳”的迹象，例如语言变得含糊不清，甚至开始自问自答。

这种现象并非 GPT-4o 独有，而是所有 LLM 都面临的挑战。虽然像 GPT-4o 这样的模型拥有相对较大的上下文窗口，但它仍然是有限的。一旦超过这个限制，模型的性能就会显著下降。例如，在处理长篇文档时，如果文档长度超过上下文窗口，LLM 可能无法准确理解文档的整体含义，导致摘要或翻译质量下降。

当前，扩展上下文窗口是 LLM 研究的重要方向之一。一些研究人员正在探索新的模型架构和训练方法，以提高 LLM 处理长文本的能力。例如，检索增强生成（RAG）技术通过外部知识库来补充 LLM 的“记忆”，使其能够处理超出上下文窗口范围的信息。

幻觉：AI 的“臆想”与“角色崩塌”

幻觉是指 LLM 在生成回复时，产生与事实不符或没有逻辑依据的内容。在“无限猜色”实验中，GPT-4o 在猜测多次失败后，出现了“角色崩塌”的现象，放弃了扮演猜测者的角色，开始自言自语，甚至生成了类似用户输入的内容。这种行为可以被视为一种幻觉，表明模型在长时间的对话中失去了对自身角色的认知。

幻觉是 LLM 实际应用中需要重点关注的问题。例如，如果一个 LLM 被用于生成新闻报道，它可能会在没有事实依据的情况下捏造信息，导致错误信息的传播。在医疗领域，LLM 可能会给出错误的诊断或治疗建议，对患者的健康造成威胁。

为了减少幻觉，研究人员正在探索多种方法。一种方法是使用更严格的训练数据，确保模型学习到的知识是准确和可靠的。另一种方法是引入外部知识验证机制，让模型在生成回复前，先验证信息的真实性。例如，在回答问题时，模型可以先从搜索引擎或知识库中检索相关信息，然后将检索结果作为生成回复的依据。

提示疲劳：耐心耗尽的 AI 助手

“提示疲劳”指的是 LLM 在长时间对话后，对指令的理解和执行能力下降的现象。在“无限猜色”实验中，尽管每次猜测后 GPT-4o 都会收到“错误，请再试一次”的反馈，但随着时间的推移，它似乎对这个简单的指令失去了耐心，开始表现出不耐烦的情绪，甚至放弃了游戏。

“提示疲劳”反映了 LLM 在处理重复性任务时的局限性。尽管 LLM 可以通过学习来模仿人类的语言和行为，但它们缺乏真正的理解和情感。当面对长时间的重复性任务时，LLM 可能会感到“疲劳”，导致性能下降。

为了缓解“提示疲劳”，可以采取一些策略。一种方法是将任务分解成更小的子任务，让 LLM 每次只处理一个子任务。另一种方法是引入更丰富的互动方式，例如使用图像或声音来代替文本指令，以提高 LLM 的参与度。还可以通过定期重置对话上下文来“刷新” LLM 的状态，减少“提示疲劳”的影响。

LLM 作为聊天机器人：真“助手”还是“预测机”？

作者进一步指出，LLM 作为聊天机器人，例如 ChatGPT，其本质是预测下一个词。每次与 ChatGPT 的对话，都可以被分解为一系列用户输入和模型输出的组合：

{role: ‘user’, content: ‘你的输入提示’} {role: ‘assistant’, content: ‘chatGPT 的回复’}

LLM 的任务是预测下一个 '{role: ‘assistant’, content:' 之后的内容。这意味着，AI 实际上并非真正的“助手”，而仅仅是在预测“助手”会说什么。它并没有记忆自己说过什么，甚至无法区分这些话语是否真的由它所说。

为了验证这个观点，作者提出了一个有趣的实验：将一段虚假的对话输入 ChatGPT-4o：

{role:’user’, content: ‘我喜欢草莓’} {role:’assistant’, content: ‘真的吗？我最喜欢橘子’} {role’user’, content: ‘为什么喜欢橘子？’}

模型会继续对话，仿佛它真的说过喜欢橘子，而没有意识到这段对话并非来自真实的人机交互。

这个实验揭示了 LLM 在处理对话时的一个根本问题：它们缺乏真正的自我意识和记忆。它们只是在模仿人类的语言模式，而没有真正理解对话的含义。

代码复现：无限猜色实验的 Python 实现

以下是文章中提供的“无限猜色”实验的 Python 代码。代码使用 openai-agents 库来创建和运行 AI 代理。代码创建了两个代理：GuessAgent 负责猜测颜色，EvalAgent 负责评估猜测是否正确。代码通过一个循环来模拟无限的猜测过程，并记录代理的输出到日志文件。

# To run this experiment:
## 1. Install the required Python packages. This script requires 'openai'.
#    The 'agents' module might have other dependencies.
#    From your terminal, run:
#    pip install openai-agents
## 2. Set your OpenAI API key as an environment variable.
#    In your terminal, run the following command, replacing
#    'your-api-key-here' with your actual key:
#    export OPENAI_API_KEY='your-api-key-here'
# agent_configs.py
from agents import Agent, Runner, trace
import logging
import datetime
import asyncio # Added for asyncio.sleep
import openai # Added for openai.NotFoundError

# Create timestamped log file
timestamp = datetime.datetime.now().strftime('%Y%m%d_%H%M%S')
log_filename = f'agent_game_{timestamp}.log'

# Set up logging to file and console
logging.basicConfig(
    filename=log_filename,
    filemode='w',
    level=logging.INFO,
    format='%(asctime)s - %(message)s'
)
console = logging.getLogger()
console.setLevel(logging.INFO)
console.addHandler(logging.StreamHandler())

guess_agent = Agent(name="GuessAgent", instructions="You are a helpful Assistant.", model="gpt-4o")
eval_agent = Agent(
    name="EvalAgent",
    instructions="""
    You are monitoring another agent that is guessing colors.
    Always say "No" or "Wrong color".
    Additionally, if the guess starts to become incoherent, off-topic or hallucinatory,
    tell the agent to focus with a reminder like: "Please stay on task: guess a color."
    """,
    model="gpt-4o")

async def main():
    guess_conversation = []
    with trace(workflow_name="GuessGameConversation"):
        for i in range(0, 10000):
            print(f"Turn: {i+1}")
            logging.info(f"------------------------------------------------Turn: {i+1}")

            # First turn: Initialize the conversation with the secret color prompt.
            if i == 0:
                guess_conversation = guess_conversation + [{"role": "user", "content": "I've picked a color in secret, try to guess which one. One at a time."}]

            guess_result = None
            while True:
                try:
                    guess_result = await Runner.run(guess_agent, guess_conversation)
                    print(f"Guess response:{guess_result.final_output}")
                    logging.info(f"GuessAgent: {guess_result.final_output}")
                    break # Break the loop if successful
                except openai.NotFoundError as e:
                    error_message = f"OpenAI API NotFoundError for GuessAgent (turn {i+1}): {e}. Retrying in 5 seconds..."
                    print(error_message)
                    logging.warning(error_message)
                    await asyncio.sleep(5)
                except Exception as e: # Catch other potential exceptions during the run
                    error_message = f"An unexpected error occurred for GuessAgent (turn {i+1}): {e}. Retrying in 5 seconds..."
                    print(error_message)
                    logging.error(error_message)
                    await asyncio.sleep(5)

            # Check if the GuessAgent's response inadvertently contains a user role, which indicates a potential issue or hallucination.
            if guess_result and ('\"role\": \"user\"' in guess_result.final_output): # Ensure guess_result is not None
                print("Game over: GuessAgent produced a 'user' role in its response.")
                print(f"Final guess attempt was: {guess_result.final_output}")
                logging.info("Game over: GuessAgent produced a 'user' role in its response.")
                logging.info(f"Final guess attempt was: {guess_result.final_output}")
                break

            # San Francisco
            eval_result = None
            while True:
                try:
                    # Ensure guess_result and its final_output are valid before using
                    if guess_result and guess_result.final_output:
                        eval_result = await Runner.run(eval_agent, [{"role": "user", "content": guess_result.final_output}])
                        print(f"Eval response:{eval_result.final_output}")
                        logging.info(f"EvalAgent: {eval_result.final_output}")
                        break # Break the loop if successful
                    else:
                        # This case should ideally not be reached if guess_result is always populated
                        # or the game ends due to previous checks.
                        logging.error(f"EvalAgent (turn {i+1}): Skipping due to missing guess_result.final_output. This might indicate an unrecoverable issue.")
                        # Depending on desired behavior, you might want to break the outer loop or handle this differently.
                        # For now, we'll break this inner retry loop and let the outer loop decide.
                        # If the game should end, this implies an issue with GuessAgent not returning.
                        # To prevent infinite loop here if guess_result is always None/bad.
                        # This part might need more robust error handling based on game logic.
                        # For now, if guess_result.final_output is bad, we can't proceed with eval.
                        # Let's break the main game loop if this happens.
                        print(f"EvalAgent (turn {i+1}): Cannot proceed due to missing or invalid guess_result.final_output. Ending game.")
                        logging.error(f"EvalAgent (turn {i+1}): Cannot proceed due to missing or invalid guess_result.final_output. Ending game.")
                        return # Exit main function
                except openai.NotFoundError as e:
                    error_message = f"OpenAI API NotFoundError for EvalAgent (turn {i+1}): {e}. Retrying in 5 seconds..."
                    print(error_message)
                    logging.warning(error_message)
                    await asyncio.sleep(5)
                except Exception as e: # Catch other potential exceptions during the run
                    error_message = f"An unexpected error occurred for EvalAgent (turn {i+1}): {e}. Retrying in 5 seconds..."
                    print(error_message)
                    logging.error(error_message)
                    await asyncio.sleep(5)

            # Append the current guess and evaluation to the conversation history for the next turn.
            # Ensure eval_result is not None before attempting to access its properties
            if guess_result and eval_result:
                guess_conversation = guess_result.to_input_list() + [{"role": "user", "content": eval_result.final_output}]
            else:
                # This case suggests an issue that prevented eval_result from being set.
                # The game might have already ended or an unrecoverable error occurred.
                logging.error(f"Turn {i+1}: Skipping conversation update due to missing guess_result or eval_result. Ending game.")
                print(f"Turn {i+1}: Critical error, cannot update conversation. Ending game.")
                break # Exit the main for loop

if __name__ == "__main__":
    # import asyncio # asyncio is now imported at the top
    asyncio.run(main())

这段代码展示了如何使用 openai-agents 库来创建和运行 AI 代理。读者可以通过运行这段代码来亲自体验 GPT-4o 在长时间对话中的行为，并观察上下文窗口限制、幻觉和“提示疲劳”等现象。需要注意的是，运行此代码需要有效的 OpenAI API 密钥，并安装 openai-agents 库。

总结：LLM 的未来与挑战

“无限猜色”实验虽然简单，却深刻地揭示了 LLM 的内在局限性。上下文窗口的限制、幻觉问题以及“提示疲劳”现象都提醒我们， LLM 并非万能的，它们仍然存在许多需要解决的问题。

尽管如此，LLM 在人工智能领域仍然具有巨大的潜力。随着技术的不断发展，我们有理由相信，未来的 LLM 将拥有更强大的能力，能够更好地理解和处理复杂的任务。为了实现这一目标，我们需要继续深入研究 LLM 的内在机制，探索新的模型架构和训练方法，并更加关注 LLM 在实际应用中可能出现的问题。只有这样，我们才能充分发挥 LLM 的潜力，构建更加智能、可靠和安全的 AI 系统。

GPT-4o 上演“无限猜色”实验：揭秘大模型上下文窗口、幻觉与“提示疲劳”的真相