Agentic AI 的兴起,让我们重新审视大语言模型(LLM)的潜力。与其仅仅依赖 LLM 本身的预测能力,不如借助 Agentic AI 将其转化为能够自主行动、解决问题的智能体。本文将以 AWS Bedrock 为例,深入探讨 Agentic AI 的构建方法,并分析其优势与局限,帮助读者了解这项技术的实际应用价值。

大语言模型(LLM)的局限与 RAG 的突破

大语言模型(LLM)在自然语言处理领域取得了显著进展,能够生成流畅、连贯的文本,进行复杂的问答,甚至编写代码。然而,LLM 的核心仍然是基于大量数据进行预测,其知识来源于训练数据集。当面对需要实时信息或特定领域知识的任务时,LLM 往往表现出不足。

为了弥补这一缺陷,检索增强生成(RAG)应运而生。RAG 框架通过在生成答案前,从外部知识库检索相关信息,为 LLM 提供了上下文信息。这就像为 LLM 配备了一个“超能力搜索引擎”,使其能够根据实时信息生成更加准确、有用的答案。举例来说,如果你询问 LLM “今天北京的空气质量如何?”,单纯的 LLM 可能无法回答,但集成 RAG 框架后,它可以通过检索最新的空气质量数据,给出准确的答案。

Agentic AI:超越被动响应,主动解决问题

Agentic AI 在 RAG 的基础上更进一步,它不仅能够利用外部知识,还能自主规划任务、选择工具并执行行动,最终达成目标。与被动接收指令并生成答案的传统 LLM 不同,Agentic AI 拥有“自主性”,可以像一个智能助手一样,根据目标自主完成任务。

例如,一个 Agentic AI 可以被赋予“预订飞往纽约的机票”的任务。它会首先确定机票预订所需的关键信息(出发地、目的地、日期、时间),然后利用合适的工具(机票预订 API)搜索航班信息,比较价格和时间,最终选择最合适的航班并完成预订。整个过程中,Agentic AI 无需人工干预,完全自主完成任务。

AWS Bedrock:构建 Agentic AI 的理想平台

AWS Bedrock 是一项完全托管的服务,让你可以通过 API 使用来自 Amazon 和领先 AI 初创公司的各种高性能基础模型(FM)。它简化了 Agentic AI 的构建过程,让开发者能够更专注于业务逻辑的实现,而无需花费大量精力在底层基础设施的搭建上。

Bedrock 提供了多种基础模型,包括 Amazon Titan、AI21 Labs 的 Jurassic-2、Anthropic 的 Claude 和 Stability AI 的 Stable Diffusion。开发者可以根据自己的需求选择合适的模型,并利用 Bedrock 提供的工具和服务,快速构建 Agentic AI 应用。

使用 AWS Bedrock 构建股票投资助手:实战演练

本文作者利用 AWS Bedrock 构建了一个简单的股票投资助手,展示了 Agentic AI 的实际应用。这个助手可以查询股票信息、比较公司市值,并将重要的投资信息保存到提醒列表中。

以下是构建过程的关键步骤:

  1. 选择基础模型: 选择 Amazon 的 Nova Pro 模型,用于文本生成和推理。

  2. 创建 Action Groups: 定义 Action Groups,作为 LLM 执行实际任务的工具。这里创建了一个名为 StockFinancialReport 的 Action Group,包含两个函数:retrieve_financial_infosave_reminders_for_investing

    • retrieve_financial_info(company_stock_ticker):根据股票代码,从外部 API 获取公司财务信息。

    • save_reminders_for_investing(notes):将投资提醒信息保存到 S3 存储桶中。

  3. 定义 Lambda 函数: 使用 Python 编写 Lambda 函数,实现 Action Groups 中定义的函数功能。

    • retrieve_financial_info 函数使用 Alpha Vantage 提供的免费 API 获取股票财务信息,并对返回的 JSON 数据进行清洗,以减少 token 使用量。

    • save_reminders_for_investing 函数将投资提醒信息保存到 S3 存储桶中,模拟 AI 的信息传递。

  4. 测试 Agent: 在 Bedrock 的测试窗口中,输入指令,例如 “Compare the market cap of Google and Apple. Save a reminder to check the company with the larger market cap.”。Bedrock 会详细记录所有操作步骤,包括 API 调用和数据处理过程。

    通过测试,可以看到 Agentic AI 成功获取了 Google 和 Apple 的市值信息,比较了大小,并将 “Check AAPL, Apple Inc.” 添加到了 S3 存储桶中的提醒列表中。

Agentic AI 的优势与局限

Agentic AI 相较于传统的 LLM,具有以下优势:

  • 自主性: 能够自主规划任务、选择工具并执行行动,无需人工干预。
  • 灵活性: 可以根据不同的任务需求,选择不同的工具和服务,适应性更强。
  • 效率: 可以自动化完成重复性任务,提高工作效率。

然而,Agentic AI 也存在一些局限:

  • 可靠性: Agentic AI 的行为受到基础模型、Action Groups 和外部 API 的影响,任何一个环节出现问题都可能导致任务失败。因此,需要进行充分的测试和监控,确保其可靠性。
  • 安全性: Agentic AI 拥有执行行动的能力,如果设计不当,可能存在安全风险。例如,一个恶意设计的 Agentic AI 可能会利用 Action Groups 发起攻击,造成损失。
  • 可解释性: Agentic AI 的决策过程可能比较复杂,难以解释。这给调试和优化带来了挑战,也可能引发伦理问题。

Agentic AI 的未来展望:多智能体协作与更广泛的应用

虽然 Agentic AI 仍处于发展初期,但其潜力巨大。未来,我们可以期待以下发展趋势:

  • 多智能体协作: 多个 Agentic AI 协同工作,共同完成复杂的任务。例如,一个智能体负责信息收集,另一个智能体负责数据分析,还有一个智能体负责决策执行。
  • 更广泛的应用: Agentic AI 将被应用于更多领域,例如客户服务、金融分析、医疗诊断、智能制造等。
  • 更强大的工具: 更多功能强大的 Action Groups 将被开发出来,为 Agentic AI 提供更丰富的工具箱。
  • 更智能的决策: 基础模型将变得更加智能,能够做出更明智的决策,提高 Agentic AI 的效率和可靠性。

结论:拥抱 Agentic AI 的时代

Agentic AI 的出现,是大语言模型领域的一个重要里程碑。它赋予 LLM 自主行动的能力,使其能够解决更复杂的问题。虽然 Agentic AI 仍存在一些局限,但其潜力巨大,未来将在各个领域发挥重要作用。作为开发者,我们应该积极拥抱 Agentic AI 的时代,探索其应用场景,并不断改进其性能,共同推动 Agentic AI 的发展。通过 AWS Bedrock 这样的平台,我们可以更便捷地构建和部署 Agentic AI 应用,抓住这一技术浪潮带来的机遇。理解并掌握 Agentic AI,将成为未来技术竞争力的重要组成部分。