大模型技术的飞速发展,不仅体现在模型能力的提升上,更体现在其应用方式的创新上。并非所有基于大模型的工作流程都是“Agentic”的。理解Agentic与Non-Agentic工作流之间的差异,对于充分利用LLM(Large Language Model)的能力至关重要。本文将深入探讨这两种模式,并通过具体案例分析,帮助读者更好地理解并应用这些模式。

1. 工作流:从规则到智能

工作流,本质上是完成特定任务的一系列步骤。传统的自动化工作流,例如费用审批,往往基于预先设定的规则:金额小于50元的餐饮费用自动批准,大于50元则需提交至财务部门审核。这种规则驱动的工作流简单直接,但缺乏灵活性。

而基于LLM的AI工作流则更具智能化。它们可以分为Agentic和Non-Agentic两种类型。Non-Agentic工作流依赖于预定义的流程,LLM在其中扮演着数据处理的角色;而Agentic工作流则赋予LLM更大的自主性,使其能够根据环境动态调整行为,完成复杂的任务。

2. Non-Agentic 工作流:效率至上

Non-Agentic工作流的核心特点是确定性。LLM在其中扮演着“工具”的角色,执行预先设定的任务。常见的Non-Agentic模式包括:

  • Prompt 链接(Prompt Chaining):Prompt 链接是一种顺序执行的模式,其中一个LLM的输出直接作为下一个LLM的输入。例如,可以使用Prompt 链接来编写文章:首先,一个LLM生成文章大纲;然后,另一个LLM根据大纲填充内容;最后,第三个LLM将各个部分整合为完整的文章。这种模式的优势在于能够将复杂的任务分解为简单的步骤,提高效率。prompt_chaining_essay_writer.py 提供了一个示例。

    • 实际案例:内容生成平台可以使用Prompt 链接来自动化博客文章的创作。例如,用户提供一个主题,系统首先使用LLM生成大纲,然后使用另一个LLM根据大纲填充内容,最后使用第三个LLM进行润色和校对。
  • 路由(Routing):路由模式利用LLM对用户输入进行分类,并将输入转发到最合适的LLM进行处理。例如,一个问答系统可以使用路由模式来区分通用问题和代码问题。对于通用问题,系统可以使用更轻量级的LLM(如gpt-4o-mini)来快速回答;对于代码问题,系统可以使用更专业的LLM(如gpt-4.1)来生成更准确的代码。routing_question_answering.py 提供了一个示例。

    • 实际案例:在线客服系统可以使用路由模式来区分用户的意图。例如,用户咨询产品信息时,系统将其路由到产品知识库;用户需要技术支持时,系统将其路由到技术支持团队。
  • 并行化(Parallelization):并行化模式将一个任务分解为多个独立的子任务,并使用多个LLM并行处理这些子任务。然后,将各个LLM的输出聚合起来,生成最终的结果。例如,可以使用并行化模式来制定一个软件开发计划:首先,使用不同的LLM模拟不同的角色(如数据科学家、软件工程师、产品经理、UX设计师)生成各自的计划;然后,使用另一个LLM将这些计划整合为完整的开发计划。parallelization_development_planner.py 提供了一个示例。

    • 实际案例:市场调研公司可以使用并行化模式来快速分析大量的用户反馈数据。例如,将用户评论分发给多个LLM,每个LLM负责分析评论的情感倾向和主题,然后将分析结果汇总起来,生成全面的用户反馈报告。

3. Agentic 工作流:自主性与智能

Agentic工作流赋予AI Agent更大的自主性。Agent可以根据当前状态和目标,自主选择行动,并与环境进行交互。常见的Agentic模式包括:

  • 反思(Reflection):反思模式允许Agent检查自身的输出,并根据反馈进行改进。例如,可以使用反思模式来生成高质量的代码。Agent首先使用LLM生成代码;然后,另一个LLM对代码进行评估,并提供改进建议;Agent根据建议修改代码,并再次进行评估,直到代码达到预期的质量。reflection_coding.py 提供了一个示例。

    • 实际案例:AI写作助手可以使用反思模式来提高文章的质量。例如,Agent可以首先生成一篇文章,然后使用另一个LLM评估文章的语法、逻辑和表达,并提供修改建议。Agent根据建议修改文章,并再次进行评估,直到文章达到预期的质量。
  • 工具使用(Tool Use):工具使用模式允许Agent访问外部工具(如函数、API)来与外部世界进行交互。例如,可以使用工具使用模式来构建一个SQL查询生成器。Agent接收用户的自然语言查询,并使用工具与数据库进行交互,生成相应的SQL查询。tool_use_query_writer.py 提供了一个示例。Agent 可以通过 “ReAct” (Reasoning and Action) 模式,决定何时需要使用工具,并将其输出整合到后续的推理中。

    • 实际案例:智能家居系统可以使用工具使用模式来控制家电设备。例如,用户可以通过语音命令要求系统打开电视、调节灯光或设置空调温度。Agent接收用户的语音命令,并使用工具与家电设备进行交互,完成相应的操作。
  • 协调者-工作者(Orchestrator-Worker):协调者-工作者模式将一个复杂的任务分解为多个子任务,并将这些子任务分配给不同的Agent(工作者)执行。一个专门的Agent(协调者)负责制定计划,分配任务,并收集结果。一个合成器(Synthesizer)LLM 收集工作者的结果并进行综合,形成最终的输出。这种模式特别适用于需要多人协作完成的任务。 orchestrator-worker_research_agent.py 提供了一个示例。协调者可以动态地创建子任务列表,这与并行化模式的主要区别。

    • 实际案例:科研团队可以使用协调者-工作者模式来完成一个大型的研究项目。协调者负责制定研究计划,将研究任务分配给不同的研究人员,并协调各个研究人员的工作。研究人员负责执行各自的研究任务,并将研究结果提交给协调者。协调者将所有研究结果整合起来,生成最终的研究报告。
  • 多Agent(Multi-Agent):多Agent模式涉及多个Agent的协同工作,每个Agent扮演不同的角色,并负责不同的任务。Agent之间可以进行通信和协作,共同完成一个目标。常见的Multi-Agent模式包括:

    • 协调者/管理者模式:一个Agent负责协调和管理其他Agent的工作。

    • 蜂群模式:多个Agent独立行动,并根据环境的变化进行调整。

    • 实际案例:软件开发团队可以使用多Agent模式来提高开发效率。例如,一个Agent可以扮演项目经理的角色,负责制定项目计划,分配任务,并跟踪进度;另一个Agent可以扮演开发人员的角色,负责编写代码;第三个Agent可以扮演测试人员的角色,负责测试代码。这些Agent协同工作,共同完成软件开发项目。

4. 选择合适的模式

选择Agentic还是Non-Agentic工作流,取决于具体的应用场景和需求。

  • Non-Agentic工作流适用于任务明确、流程固定的场景。例如,文本摘要、内容翻译等。Non-Agentic工作流的优势在于效率高、可控性强。
  • Agentic工作流适用于任务复杂、需要自主决策的场景。例如,智能客服、自动化代码生成等。Agentic工作流的优势在于灵活性强、适应性强。

| 特性 | Non-Agentic 工作流 | Agentic 工作流 |
| ————– | —————————– | ——————————- |
| 任务类型 | 明确、固定 | 复杂、需要自主决策 |
| 自主性 | 低 | 高 |
| 灵活性 | 低 | 高 |
| 适用场景 | 文本摘要、内容翻译等 | 智能客服、自动化代码生成等 |
| 优势 | 效率高、可控性强 | 灵活性强、适应性强 |
| 局限性 | 缺乏自主性和适应性 | 实现难度较高、需要更多资源 |

5. LLM 的未来:Agentic 趋势

随着大模型技术的不断发展,Agentic工作流将成为主流趋势。未来的LLM将更加智能、自主,能够更好地理解人类意图,并与外部世界进行交互。这将为各行各业带来革命性的变革。例如,未来的智能客服系统将能够自主解决复杂的问题,而无需人工干预;未来的自动化代码生成系统将能够根据用户需求,自主生成高质量的代码。

虽然Agentic工作流潜力巨大,但也面临着一些挑战。例如,如何保证Agent的安全性、可靠性和可解释性?如何设计高效的Agent框架?这些问题需要学术界和工业界共同努力解决。

6. 结语

理解Agentic和Non-Agentic工作流的差异,是掌握大模型应用的关键。选择合适的模式,并结合实际应用场景,才能充分发挥LLM的潜力,创造更大的价值。随着技术的不断进步,我们有理由相信,Agentic工作流将在未来的AI领域扮演越来越重要的角色,并引领新一轮的创新浪潮。通过深入了解这些模式,并持续探索其可能性,我们才能更好地迎接大模型带来的机遇和挑战。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注