1975 年,Altair 8800 的诞生开启了个人计算的时代,但操作它的方式却极其原始,需要通过拨动开关来输入二进制指令。如今,我们拥有了像 GPT-4、Claude 和 Gemini 这样强大的大语言模型(LLMs),但使用它们仍然面临着挑战,仿佛回到了 Altair 时代。本文将探讨大语言模型目前所处的阶段,以及如何通过抽象层的构建,让更多人能够轻松驾驭这些强大的工具,就像当年 BASIC 语言让计算机走进千家万户一样。这或许是大语言模型领域的“Altair BASIC 时刻”。

1. 回到 1975:拨动开关编程的时代

想象一下,没有屏幕、没有键盘,只有一堆拨动开关和闪烁的灯。这就是 1975 年的计算机编程体验。程序员需要通过拨动开关设置二进制数字(1 和 0),代表指令或内存地址。然后,按下按钮将指令存储到内存中。这个过程必须一遍又一遍地重复,一次一个字节。如果犯了错误,就必须从头开始。这种编程方式不仅需要技术知识,还需要极大的耐心和毅力。只有极少数极客才能驾驭。

这与今天使用大语言模型面临的挑战有着惊人的相似之处。虽然 LLMs 具备强大的能力,可以撰写文章、编写代码、回复邮件等,但要有效地使用它们,需要掌握一系列微妙的规则,例如:最佳的 prompt 结构是什么?如何管理长文档的Token?如何添加记忆?如何保持模型基于事实?如何将多个模型链接在一起?如何避免幻觉?

2. BASIC 的诞生:计算领域的革命

Bill Gates 和 Paul Allen 意识到,如果普通人能够使用文字而不是开关与计算机交互,那么这台机器将会变得更加强大。因此,他们编写了一个名为 BASIC(Beginner’s All-purpose Symbolic Instruction Code)的编程语言版本,可以在 Altair 上运行。

突然,人们不再需要拨动开关,只需键入简单的代码,例如:

10 PRINT "HELLO WORLD"
20 GOTO 10

计算机就会按照指令执行。BASIC 就像一个翻译器,连接了人类和机器。你不需要了解二进制或硬件内部结构,只需要有逻辑思维,表达你想要的结果即可。这个小小的解释器仅占用 4KB 内存,却开启了微软的崛起,并推动了个人计算革命。

3. 大语言模型:能力强大但难于驾驭

现在,让我们快进到 2025 年。我们拥有了像 GPT-4、Claude 和 Gemini 这样强大的大语言模型。这些模型可以执行各种复杂的任务,但它们仍然难以正确使用。

原因在于,大多数人不知道如何有效地与它们“交谈”。例如,prompt 工程就成为了一门新兴的学科。我们需要学习如何设计有效的提示语,以便让模型能够理解我们的意图并给出准确的答案。此外,Token 限制也是一个重要的考虑因素。由于 LLMs 处理文本的长度受到限制,我们需要采取一些技巧来管理长文档,例如将文档分割成较小的块,或者使用摘要技术。

4. Andrej Karpathy 的警告:软件堆栈正在改变

在最近的一次主题演讲中,人工智能研究员 Andrej Karpathy 提出了关于软件编写方式的新思路。他将软件发展分为三个时代:

  • Software 1.0:传统的代码,由人类逐行编写。
  • Software 2.0:机器学习,通过在数据上训练模型来学习模式。
  • Software 3.0:自然语言作为接口。我们描述我们想要什么,模型会找出如何去做。

Karpathy 认为,我们目前尚未完全进入 Software 3.0 时代。大语言模型很强大,但也存在一些问题。它们会忘记事情,会编造事实,而且它们不知道自己不知道什么。因此,Karpathy 建议我们不要构建完全自主的“机器人”,而是构建副驾驶(co-pilots)——辅助我们但仍然由我们掌控的工具。

5. 构建大语言模型的 BASIC:新的抽象层

就像当年 Bill Gates 和 Paul Allen 所做的那样,我们今天也需要为 AI 构建新的抽象层。他们没有发明新的芯片,也没有改变硬件,而是构建了一个新的交互方式,让每个人都可以使用计算机。

我们需要工具、语言和平台,它们位于 LLMs 之上,使其更易于使用。例如:

  • 无需担心 Token 限制或记忆窗口的界面。
  • 可以将多个 LLMs 组合成工作流,而无需编写数千行编排代码的工具。
  • 可以访问工具、搜索引擎、数据库的 AI,而无需构建自定义管道。

这些新的层将像现代操作系统一样,将你的意图翻译成 LLMs 可以可靠执行的结构化任务。例如,LangChain 和 LlamaIndex 这样的框架正在尝试解决这些问题,它们提供了一系列工具和模块,可以帮助开发者构建更复杂的 LLM 应用程序。

AI 领域的赢家不仅是那些构建最佳原始模型的人,而是那些将这些模型封装在直观、安全且强大的工具中的人,就像 BASIC 封装机器代码一样。

6. 历史的教训:抽象的重要性

Altair 的故事告诉我们:抽象很重要。你可以拥有世界上最强大的引擎,但如果没有人会驾驶它,它就是无用的。BASIC 让普通人可以使用计算能力。我们同样需要为 LLMs 做到这一点。

随着可访问性的提高,采用率会呈爆炸式增长。BASIC 诞生后,Altair 不再只是极客的玩具,而是成为了每个人的计算机。

我们正处于一个新时代的开端。Altair 看起来不像 iPhone,但它是第一步。今天的 AI 工具可能感觉笨拙,但它们正在铺平道路。例如,Midjourney 和 Stable Diffusion 这样的图像生成模型,通过简单的文字描述就能创造出令人惊叹的图像,极大地降低了创意设计的门槛。

7. 似曾相识的分岔路口

1975 年,我们站在一个分岔路口:将计算保留给极客,还是使其普及?Gates 和 Allen 选择了普及,一切都改变了。

今天,我们面临着同样的抉择。我们可以将 AI 锁定在复杂的层层之下,仅供研究人员和 prompt 工程师使用。或者,我们可以构建 “LLMs 的 BASIC”——一个使 AI 像编写句子一样可用和直观的层。

总有一天,你可以要求 AI 构建一个应用程序、管理你的财务、生成一个故事,甚至总结一个 YouTube 视频——它就会正常工作。

那一天尚未到来。但它正在到来。它会感觉很像 Altair 上的那些闪烁的灯最终拼出:

“HELLO WORLD.”

8. 总结:迎接大语言模型的普及时代

大语言模型的潜力毋庸置疑,但要真正释放其力量,我们需要构建更易于使用的工具和平台,就像当年 BASIC 为计算机所做的那样。通过构建新的抽象层,简化 prompt 工程的复杂性,解决 Token 限制等问题,我们可以让更多人能够轻松驾驭这些强大的模型,从而推动 AI 的普及和创新。让我们一起迎接 大语言模型 的 “Altair BASIC 时刻”,让 AI 真正地服务于每个人。而现在,许多公司都在朝着这个方向努力,例如专注于AI Agent 平台的 秘塔AI搜索,无需用户进行复杂的Prompt设计,即可快速完成信息查询和总结。未来,随着技术的不断发展,AI 的应用场景将会越来越广泛,为我们的生活和工作带来更多的便利。