LLM

利用多步提示法,轻松生成高质量的单元测试:大模型时代的测试利器

在软件开发过程中,单元测试的重要性不言而喻。但编写高质量、可维护的单元测试往往令开发者头疼。尤其是在面对复杂逻辑的函数时,如何全面覆盖各种边界情况,避免疏漏,成为一项挑战。本文将介绍一种简单而可靠的方法,利用多步提示法,借助大模型的力量,高效生成高质量的单元测试,极大地降低测试的心理负担,提升开发效率。 明确函数功能:理解是测试的基础 编写单元测试的第一步,也是最关键的一步,是深入理解被测函数的具

探索“古早味”AI:康奈尔“设计与构建AI解决方案”项目学习心得(一)

在人工智能(AI)领域日新月异的今天,重新审视被称为“古早味AI”(Good Old-Fashioned AI,简称GOFAI)的符号规则AI,显得尤为重要。最近,我参加了康奈尔大学eCornell的“设计与构建AI解决方案”认证项目,在Lutz Finger教授的指导下,深入学习了GOFAI,尤其是符号规则AI。本文将分享我从该项目第二模块“探索古早味AI”中的一些关键学习心得,重点探讨符号规则

AI赋能生物学:突破与挑战并存,基础知识仍是关键

近年来,人工智能(AI)尤其是大型语言模型(LLM)的迅猛发展,如同一场数字淘金热,吸引着各行各业的人们竞相追逐。然而,在这股热潮之下,我们是否忽略了真正的基础知识?特别是在生物学领域,AI的应用潜力巨大,但盲目追求新工具,而忽视其内在原理,可能会导致误用、滥用,甚至适得其反。本文将深入探讨AI赋能生物学的现状,揭示其突破与挑战,并强调基础知识的重要性。 LLM:生物学领域的语言大师 大型语言模型

TiRex:基于xLSTM和连续块掩码的零样本时序预测新突破

近年来,大模型技术的发展日新月异,其中零样本预测能力尤为引人注目。零样本预测,即在没有任何训练数据的情况下,仅凭先验知识或少量示例(In-Context Learning, ICL)完成预测任务,极大地降低了模型部署成本和数据依赖性。本文将深入探讨名为TiRex的创新模型,该模型在零样本时序预测领域取得了突破性进展,尤其是在长短期预测方面,超越了以往的SOTA模型。 背景与挑战:传统时序预测模型的

LegalSearchLM:大模型赋能法律检索,要素生成重塑判例发现

在法律科技(LegalTech)领域,法律判例检索(Legal Case Retrieval, LCR)一直是至关重要的环节,它直接关系到法律专家的工作效率和司法公正的维护。然而,传统判例检索方法在面对海量数据和复杂法律关系时,往往显得力不从心。近期,一项名为 LegalSearchLM 的创新研究,尝试以生成式检索的视角,将判例检索转化为法律要素生成问题,并构建了大规模的LEGAR BENCH基

Transformer架构:大型语言模型(LLM)背后的秘密武器

大型语言模型(LLM),如ChatGPT、Gemini和Llama,正在以惊人的速度改变我们与人工智能交互的方式。它们强大能力的背后,隐藏着一个核心结构——Transformer架构。本文将深入浅出地解析Transformer架构,让你了解它如何驱动这些令人印象深刻的AI模型。 1. Transformer:超越传统序列模型的革新 在Transformer出现之前,循环神经网络(RNNs)和长短期

从零开始训练Transformer:深入指南,玩转大模型技术

在大模型技术浪潮下,从零开始训练Transformer模型已成为解锁特定领域潜力,实现定制化AI解决方案的关键。本文将深入探讨Transformer模型的预训练全流程,重点解析如何驾驭大规模数据集,构建专属分词器,并通过多GPU加速训练,最终打造高性能的大模型。我们将结合PyTorch的Accelerate库,揭示分布式训练的奥秘,助您在法律、生物医药、软件工程等领域,充分利用海量无标签数据,提升

基于区块链共识的LLM输出验证:构建更可靠的人工智能系统

随着大型语言模型(LLM)日益渗透到我们日常使用的工具和决策系统中,人们对其可靠性和可信度的担忧也日益增加。本文从区块链技术的去中心化共识机制中汲取灵感,提出了一个多模型共识验证框架,旨在提升人工智能输出的可靠性和可信度。通过查询多样化的AI模型集群,并以多数原则验证输出结果,我们可以构建出更强大、可审计、更透明的AI系统。这就像为LLM配备了一个“轮胎修理包”,能够在人工智能尚不完善的情况下,更

大语言模型 Tokenization:原理、应用与潜在风险

Tokenization(分词) 是大语言模型(LLM)中至关重要的一步,它将原始文本转化为模型可以理解和处理的数字形式。本文将深入探讨 Tokenization 的工作原理,特别是字节对编码(BPE)方法,以及它如何与大语言模型协同工作,最后分析 Tokenization 可能带来的副作用,例如 LLM 无法正确拼写单词和“触发词”现象。 字节对编码(BPE):LLM 的核心分词技术 字节对编码

“无流”的幻觉:OpenAI Agents SDK 结构化输出的流式传输陷阱与解决方案

在大模型技术蓬勃发展的今天,我们常常会被“一切顺利”的表象所迷惑。就像 Cilia Madani 在其文章中描述的那样,一个基于 OpenAI Agents SDK 构建的,能够输出结构化 JSON 的投资建议 AI 代理,在非流式传输模式下运行完美。然而,一旦涉及到 流式传输,问题就接踵而至。本文将深入探讨 OpenAI Agents SDK 在处理 结构化输出 时,特别是涉及到 JSON 格式