Deep Research 简介

Deep Research 是 OpenAI 为其 Pro 用户推出的一个强大的新工具,旨在彻底改变复杂、多步骤研究任务的执行方式。这个工具的设计理念是,用户只需提供一个提示,Deep Research 就能独立完成工作——它能够找到、分析并综合数百个在线资源,创建出一份达到研究分析师水平的综合报告。Deep Research 基于即将推出的 OpenAI o3 模型的一个版本,该模型针对网页浏览和数据分析进行了优化,它利用推理能力搜索、解释和分析互联网上的大量文本、图像和 PDF 文件,并根据遇到的信息灵活调整。

Deep Research 与推理模型的区别

Deep Research 模型专门处理信息综合和多步骤研究任务,而推理模型则擅长逻辑问题解决和复杂推理任务。尽管推理模型在处理复杂问题时表现出色,但它们可能会过于冗长,变得“cheong hei”(粤语中意为“长篇大论”)。

构建概念验证(POC)

在启动这个项目时,开发者设定了几个目标:尽可能使用现成的库/框架、创建一个简单的前端界面,并且不花费200美元。基于这些目标,开发者选择了以下技术方案:

  • Streamlit:用作前端,让用户输入研究主题,查看生成的响应,并以 Markdown 格式下载报告。它还支持本地测试,设置简单。
  • LangGraph:这是一个新工具,它能够使用自然语言管理有向无环图(DAGs)的工作流程,非常适合这个用例。
  • Tavily:一个专门的搜索引擎,能够在一次调用中处理搜索、抓取、过滤和提取。它提供了1000个积分的慷慨免费层,非常适合原型开发(大约30多个查询)。

POC 工作流程

POC 的工作流程被设计得非常简单。研究过程分为三个主要阶段:

  1. 用户输入阶段:用户输入研究主题,启动研究过程。
  2. 规划和研究阶段:系统根据五个关键部分生成结构化的研究大纲:引言、当前状态、分析、结论、参考文献。
  3. 写作和输出阶段:最后阶段涉及将综合内容编译成一份连贯的报告,结果是一个经过润色和全面性的文档。还提供了以 Markdown 格式下载报告的选项。

扩展功能

这种实现的一个优势是其灵活性,可以扩展并集成额外的功能。以下是三个假设场景,以说明其潜力:

方法 1:与向量数据库集成以改善 RAG

工具与向量数据库集成,通过提供上下文相关的信息来改善大型语言模型(LLM)的响应。用户输入查询或主题,处理提示并检索相关信息,存储研究数据的嵌入,并查询知识库(KB)以找到上下文相似的信息。检索到的上下文数据被输入到 LLM 中,作为补充信息以生成响应。

方法 2:为 RAG 构建专有知识库

批量作业并行处理多个主题。生成的输出被嵌入并存储在知识库中,稍后用于为 LLM 提供上下文信息。用户输入一系列主题进行批量深度研究处理,工具根据主题生成全面的研究输出,研究输出被存储和索引在知识库中,以便将来检索。当用户启动研究时,从知识库中检索相关数据,并作为上下文提供给 LLM。

方法 3:与摘要功能集成

使用摘要步骤来压缩内容并强调研究输出中的关键点。用户输入查询或主题,进行彻底的研究并编制详细报告,然后将详细报告提炼成简洁的摘要。摘要用作上下文,以便 LLM 生成响应。

Deep Research 在公共服务和政府中的用例

政策发展和分析

政府机构可以利用这个工具,通过从多个来源编制数据,对政策选项进行全面分析。

监管合规

协助监控和解释监管变化,可能减少手动和繁琐的合规流程。还有助于确保遵守不断演变的法律和标准。

危机管理和灾难响应

从各种在线渠道快速收集和综合信息,并提供可操作的洞察,以支持及时响应。特别是对于我们的家庭团队在紧急情况下。

公共沟通和参与

生成适合公开传播的报告。通过一致的沟通帮助建立政府机构和公民之间的信任。

工作和技能经济

策划全球就业市场趋势和经济趋势的洞察。帮助政府机构设计有效的就业援助计划。

公众情绪

通过评估来自多个来源的公民反馈,识别反复出现的问题或改进领域。这可能导致公共服务效率和公民满意度的提高。

Deep Research 是一个强大的工具,它展示了人工智能在深度研究和信息综合方面的潜力。通过利用最新的技术,如 GPT-4o 和 Tavily,这个工具能够为政府和公共服务领域带来革命性的变化。随着技术的不断发展和集成,我们可以预见 Deep Research 将在政策制定、监管合规、危机管理、公共沟通和工作技能经济等多个领域发挥重要作用。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注