Intent-kit：构建可信赖的大模型应用，摆脱“意大利面条式规则”和“LLM猜测”

在构建基于大型语言模型（LLM）的工具时，你是否经常感到头疼？每次想要创建一个既智能又具有确定性的聊天机器人、自动化流程或人工智能驱动的工作流时，几乎都要重新发明轮子。LLM虽然强大，但其不可预测性、难以约束以及现有库要么完全依赖黑盒AI，要么退回到脆弱的基于规则的匹配方式，都让开发者们苦不堪言。当你追求可组合性、可靠性和可审计性时（尤其是在交付给用户的产品中），往往只能依靠各种临时拼凑的解决方案。现在，有了 Intent-kit，一切将变得不同。

Intent-kit 是一个通用的 Python 框架，旨在帮助开发者构建意图驱动的分类和执行系统，无论你是想开发聊天机器人、自动化工具还是定制工作流应用程序，它都能完美胜任。它的核心优势在于，允许开发者将基于规则的逻辑、LLM 或者自定义分类器进行任意组合，从而摆脱 “意大利面条式规则” 和 “LLM 猜测” 的困境，构建可预测、可测试且适合生产环境的系统。

意图驱动：从混乱到秩序，清晰定义系统能力

意图驱动 是 Intent-kit 的核心理念。传统的 LLM 应用开发中，开发者往往直接将用户输入丢给 LLM，让其自由发挥。这种方式虽然简单，但结果往往难以预测，容易出现幻觉或者不符合预期的输出。Intent-kit 强调预先定义所有系统的能力、约束和依赖关系，将用户意图显式化，从而实现对 LLM 行为的精确控制。

例如，假设我们要开发一个电商客服机器人。传统的做法可能是直接让 LLM 回答用户的问题，但这种方式可能会导致机器人给出不准确或不相关的信息。使用 Intent-kit，我们可以首先定义机器人的意图，比如“查询订单状态”、“修改收货地址”、“申请退货”等等。然后，我们可以为每个意图定义相应的参数和执行逻辑。当用户输入“我的订单状态是什么”时，Intent-kit 会将其识别为“查询订单状态”的意图，并提取订单号等参数，然后调用相应的 API 查询订单状态并返回给用户。

通过这种 意图驱动 的方式，我们可以将 LLM 的能力限制在预定义的范围内，避免其自由发挥带来的风险，从而提高系统的可靠性和可预测性。

分类器：灵活组合，融合经典与 AI 的力量

Intent-kit 的强大之处在于其 分类器 的灵活性。它支持各种分类方法，包括关键词、正则表达式、自定义机器学习模型和 LLM，而且默认情况下没有任何依赖。这意味着开发者可以根据自己的需求选择最合适的分类器，并将它们组合在一起，构建混合型的分类系统。

例如，对于一些简单的意图，我们可以使用关键词或正则表达式进行匹配，例如判断用户是否在问候语，可以使用正则表达式 r"你好|您好|hello|hi"。对于更复杂的意图，比如“推荐一款适合跑步的耳机”，我们可以使用 LLM 进行分类。Intent-kit 允许我们将这两种分类器组合在一起，首先使用关键词或正则表达式判断用户是否在问候，如果是，则直接回复问候语；如果不是，则使用 LLM 判断用户的意图，并执行相应的逻辑。

这种灵活的 分类器 组合方式，既可以充分利用 LLM 的强大能力，又可以避免过度依赖 LLM 带来的风险，从而实现性能和可靠性的平衡。而且因为 Intent-kit 无默认依赖，开发者可以自由选择自己熟悉的 LLM 模型，比如 OpenAI 的 GPT 系列，或者开源的 Llama 2。

可组合性 & 确定性：告别“黑盒”，构建可信赖的系统

可组合性 和 确定性 是 Intent-kit 的另一个关键优势。传统的 LLM 应用往往是一个黑盒，开发者很难理解其内部的工作原理，也难以预测其输出结果。Intent-kit 通过预先定义所有有效的意图、参数和上下文，实现了对系统的完全控制。这意味着，你定义了什么，系统就做什么，不会有任何意外、幻觉或“魔法”。

例如，假设我们要开发一个旅行预订助手。使用 Intent-kit，我们可以首先定义所有可能的旅行目的地、出发日期、人数等参数。然后，我们可以为每个目的地定义相应的旅行线路、酒店和机票信息。当用户输入“我想预订去北京的旅行，3天，2个人”时，Intent-kit 会提取目的地、天数和人数等参数，并根据这些参数查询相应的旅行线路、酒店和机票信息，然后返回给用户。

由于我们预先定义了所有可能的信息，所以系统不会返回任何不存在的旅行目的地或酒店信息，从而保证了系统的 确定性 和可靠性。同时，Intent-kit 允许我们将不同的功能模块组合在一起，比如将机票预订模块和酒店预订模块组合成一个完整的旅行预订流程，从而实现系统的 可组合性。

这种 可组合性 和 确定性，使得 Intent-kit 非常适合构建需要高度可靠性的企业级应用。

可扩展性：按需引入 LLM，拥抱未来的无限可能

Intent-kit 的 可扩展性 体现在你可以根据需要添加 LLM。只有当你需要时，才需要引入 LLM。你可以插入自己的业务逻辑、API 或分类器，轻松扩展系统的功能。这意味着，你可以先使用简单的规则和逻辑构建系统的核心功能，然后随着业务的发展，逐步引入 LLM 来增强系统的智能性。

例如，在电商客服机器人中，我们可以先使用关键词和正则表达式处理常见的咨询问题，比如“如何退货”、“订单在哪里”，然后当用户提出更复杂的问题时，比如“推荐一款性价比高的笔记本电脑”，我们再使用 LLM 进行回答。

这种按需引入 LLM 的方式，既可以降低系统的开发成本，又可以保证系统的性能和可靠性。同时，Intent-kit 的 可扩展性 也使得系统可以适应未来的技术发展，随时引入最新的 LLM 和其他 AI 技术。

可测试性 & 可调试性：告别猜测，精准定位问题

可测试性 和 可调试性 是 Intent-kit 的另一个重要特性。Parameter extraction（参数提取）、routing（路由）和 context flow（上下文流程）都是可检查、可单元测试和生产就绪的。这使得开发者可以轻松地测试和调试系统，及时发现并修复问题。

例如，我们可以使用 Intent-kit 的 Eval API 来测试系统的性能。Eval API 允许开发者提供自己的数据集，以 YAML 或 JSON 示例的形式组织，然后自动测试和验证整个工作流，从而评估图/分类器在真实数据上的表现。开发者可以自定义评估指标，比如准确率、召回率等，从而全面评估系统的性能。

通过这种 可测试性 和 可调试性，开发者可以更加自信地发布系统，并及时发现和修复问题，从而提高系统的可靠性和用户体验。

Eval API：用真实数据驱动，保证交付质量

Intent-kit 的 Eval API 是一个非常强大的功能，它允许开发者使用自己的数据集来测试和验证整个工作流。你可以使用 YAML 或 JSON 格式的数据集，其中包含各种用户输入和预期输出。Eval API 会自动运行这些数据集，并生成详细的测试报告，帮助你发现系统中的问题。

使用 Eval API，你可以：

不再手动测试：自动评估图/分类器在真实数据上的表现，而不仅仅是凭猜测。
自定义评估：引入特定领域的用例和回归测试。
获得可操作的报告：快速发现漏洞、错误或意外行为，并在发布之前进行修复。

例如，对于电商客服机器人，我们可以创建一个包含各种用户咨询问题的数据集，比如“我的订单在哪里”、“如何退货”、“推荐一款性价比高的笔记本电脑”等等。然后，我们可以使用 Eval API 运行这个数据集，并生成测试报告，从而评估机器人在处理这些问题时的准确率和效率。

通过 Eval API，我们可以自信地交付确定性的、AI 驱动的工作流，并准确了解系统在实际应用中的表现。

生产环境就绪：不仅仅是 Demo，更是可维护的产品

Intent-kit 从一开始就面向生产环境设计。它不仅仅是一个可以用来展示 Demo 的工具，更是一个可以用来构建可维护产品的框架。它提供的 确定性、可测试性 和 可调试性，使得开发者可以更加自信地将系统部署到生产环境，并长期维护。

与很多其他的 LLM 应用框架不同，Intent-kit 更加注重系统的可靠性和可维护性。它提供的各种工具和特性，可以帮助开发者构建出高质量的、可扩展的、可维护的 LLM 应用。

案例分析：从 Demo 到产品，Intent-kit 的实际应用

为了更好地理解 Intent-kit 的优势，我们来看几个实际的应用案例：

智能客服机器人：使用 Intent-kit 构建的智能客服机器人可以处理各种用户咨询问题，包括订单查询、退货申请、产品推荐等。通过 意图驱动 的方式，我们可以精确控制机器人的行为，避免其给出不准确或不相关的信息。
自动化工作流：使用 Intent-kit 构建的自动化工作流可以自动执行各种任务，比如数据清洗、报表生成、邮件发送等。通过 可组合性 的方式，我们可以将不同的功能模块组合在一起，构建复杂的自动化流程。
智能家居控制：使用 Intent-kit 构建的智能家居控制系统可以通过语音指令控制家中的各种设备，比如灯光、空调、电视等。通过 可扩展性 的方式，我们可以随时引入新的设备和功能，不断扩展系统的能力。

这些案例都展示了 Intent-kit 在实际应用中的强大潜力。它可以帮助开发者构建各种智能化的应用，提高工作效率，改善用户体验。

总结：停止缝合破碎的工作流，开始用 Intent 构建

Intent-kit 的出现，旨在解决 LLM 应用开发中的各种痛点，帮助开发者构建可信赖的、可维护的大模型应用。它通过 意图驱动、分类器 组合、可组合性、确定性、可扩展性、可测试性 和 可调试性 等特性，实现了对 LLM 行为的精确控制，提高了系统的可靠性和可预测性。

如果你正在构建基于 LLM 的工具，或者正在为 LLM 应用的可靠性和可维护性而烦恼，那么 Intent-kit 绝对值得你尝试。它将帮助你摆脱 “意大利面条式规则” 和 “LLM 猜测” 的困境，构建出真正具有价值的 LLM 应用。

停止缝合破碎的工作流吧！开始用 Intent 构建！

相关链接：

文档： https://docs.intentkit.io
代码： https://github.com/Stephen-Collins-tech/intent-kit
安装： pip install intent-kit
pip install intent-kit[openai] (使用 OpenAI SDK)

如果你有任何问题或反馈，欢迎在 GitHub 上提交 issue 或者通过 LinkedIn 联系作者。

Intent-kit：构建可信赖的大模型应用，摆脱“意大利面条式规则”和“LLM猜测”