大型语言模型(LLM)层出不穷,它们承诺着革命性的功能,试图颠覆现有的秩序。市场上的营销宣传让人目不暇接,LLM的世界越来越像2000年代末的智能手机大战。既有不断创新、逐步改进的大公司,也有一群勇敢的新创公司,它们都希望在代码和商业的数字竞技场中获得关注。其中,Claude 3.7 Sonnet就是这场竞争中的一匹黑马。

Claude 3.7 Sonnet是什么?

Claude 3.7 Sonnet来自Anthropic公司,它定位为一个能够理解微妙指令、承认错误,并从复杂信息中提取深刻见解的语言模型。这些都是我们希望从任何人类员工那里得到的功能,更不用说AI了。在代码生成、解释视觉数据和创造不同形式的写作等领域,这个LLM在许多功能上表现出色。但市场上也有成千上万的其他模型能做到这一点。

Sonnet的独特之处

那么,Claude 3.7 Sonnet与其他著名的LLM如ChatGPT、Gemini等相比有何不同?在基准评估中的能力表现揭示了一些明显的强项。

我可以确认,根据我所阅读的数据,Sonnet在涉及视觉空间数学思维时表现出色。这些是让工程师们早上兴奋起床的东西,Sonnet在这方面很强!还有互动学习环境,这可以为企业学习节省大量成本,因为它将通过使用自适应技术加快员工入职培训。

Sonnet还有一个巨大的输出限制,在“扩展思维”设置下可以达到128,000个token。那么?这为更长的输出和更广泛的答案细微差别和能力提供了空间。如果那句话还没有让你迷失!

你想要数字?我有数字。还有事实!大型模型系统组织(LMSYS)的“聊天机器人竞技场”定期对各种LLM进行基准测试。在人类被要求表达偏好的盲测中,Claude 3模型有时与GPT-4相匹配或超越。

Token时间

在LLM中,数据以token的形式表达,这基本上定义了数据处理的大小和范围。让我们讨论token计数!

  • Claude 3.7 Sonnet:输入跨度高达200k个token,可能的最大产量高达128k。
  • GPT-4:输入范围最高可达128k个token大小,但输出更为保守,大约在16,400左右。
  • Gemini 2.0 Flash:输入范围巨大,跨度达到百万(具体来说是一个酷酷的一百万)。但是……在响应端的最大容量只有8,192!

这讲述了一个有趣的故事!数据显示,Gemini 2.0 Flash在输入方面的广度超过了其他产品。而Sonnet在回复方面最大化。

这实际上意味着什么?复杂的文档分析可能会倾向于Gemini,因为它可以捕捉每一个可能的信号和提示,而长篇报告撰写(比如创建文档或撰写报告)则完全符合Claude及其衍生产品的优势。最好的类比是不同的镜头,专门针对需求。

Sonnet特别适合利用和增强复杂的数据分析,它能够处理复杂性。记住:数字从不撒谎。除非它们这样做。但那些是你的社会科学研究人员,不是我们工程师……

为什么营销人员应该关心?

为什么营销人员,或CMO,应该关心这一切?因为LLM不仅是未来,也是你的现在。它们将影响营销部门在未来十年内将参与的几乎所有活动。根据麦肯锡公司的数据,生成性AI每年可以为全球营销和销售增加1.6至2.6万亿美元。如果这些万亿美元落在你的公司或其他任何地方,真的取决于你是否决定加入这场竞赛。或者押错了马——今天的LLM!

  • 内容创作——LLM很快将开始为你的性能营销所需的无尽内容变体进行创作。想象一下,每天创建数十篇博客文章或不同版本的广告副本进行A/B测试……一直都是这样,而且都是高端副本。好吧,那个梦想已经实现了!
  • 受众洞察——你真的了解你的客户吗?LLM现在能够提供深入分析,不仅提供事实,还提供潜在的战略方向。客户对信息的反应如何?他们是否比社会意识营销更受折扣的吸引?想知道哪个年龄段真的喜欢紫色袜子?
  • 个性化——你希望营销以个性化的一对一方式进行,并且始终如此,同时从不失去语调!人工智能来了。规模真的可以提供个性化的关注。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注