6 月 2025

LegalSearchLM:大模型赋能法律检索,要素生成重塑判例发现

在法律科技(LegalTech)领域,法律判例检索(Legal Case Retrieval, LCR)一直是至关重要的环节,它直接关系到法律专家的工作效率和司法公正的维护。然而,传统判例检索方法在面对海量数据和复杂法律关系时,往往显得力不从心。近期,一项名为 LegalSearchLM 的创新研究,尝试以生成式检索的视角,将判例检索转化为法律要素生成问题,并构建了大规模的LEGAR BENCH基

TiRex:基于xLSTM和连续块掩码的零样本时序预测新突破

近年来,大模型技术的发展日新月异,其中零样本预测能力尤为引人注目。零样本预测,即在没有任何训练数据的情况下,仅凭先验知识或少量示例(In-Context Learning, ICL)完成预测任务,极大地降低了模型部署成本和数据依赖性。本文将深入探讨名为TiRex的创新模型,该模型在零样本时序预测领域取得了突破性进展,尤其是在长短期预测方面,超越了以往的SOTA模型。 背景与挑战:传统时序预测模型的

大模型时代的连接器:MCP与A2A如何重塑AI生态?

人工智能领域的快速发展,如同打开了潘多拉的魔盒,各种创新层出不穷。然而,每一个突破性的进展往往伴随着新的挑战。大模型的能力日益强大,但在实际应用中却面临着信息孤岛的困境。例如,ChatGPT无法直接读取Slack线程,Claude也无法访问您的数据库。企业内部署的各种智能体(agents)各自独立运行,虽然具备一定的智能,但缺乏有效的连接与协作。随着企业不断堆叠模型、智能体和API,真正的瓶颈不再

人工智能浪潮:算法、数据与生活变革的深度解读

人工智能 (AI) 并非科幻电影中拥有独立意识的个体,而是一系列精密的算法,它们在海量数据的驱动下,以前所未有的方式重塑着我们的生活。本文将深入探讨人工智能如何通过算法和数据驱动,颠覆并深刻影响我们生活的方方面面,揭示其背后的技术原理和应用前景。 大数据:人工智能腾飞的燃料 如果说算法是人工智能的发动机,那么大数据就是驱动这台发动机的燃料。没有庞大的数据集,再精妙的算法也难以发挥作用。原文中提到,

AI赋能生物学:突破与挑战并存,基础知识仍是关键

近年来,人工智能(AI)尤其是大型语言模型(LLM)的迅猛发展,如同一场数字淘金热,吸引着各行各业的人们竞相追逐。然而,在这股热潮之下,我们是否忽略了真正的基础知识?特别是在生物学领域,AI的应用潜力巨大,但盲目追求新工具,而忽视其内在原理,可能会导致误用、滥用,甚至适得其反。本文将深入探讨AI赋能生物学的现状,揭示其突破与挑战,并强调基础知识的重要性。 LLM:生物学领域的语言大师 大型语言模型

探索“古早味”AI:康奈尔“设计与构建AI解决方案”项目学习心得(一)

在人工智能(AI)领域日新月异的今天,重新审视被称为“古早味AI”(Good Old-Fashioned AI,简称GOFAI)的符号规则AI,显得尤为重要。最近,我参加了康奈尔大学eCornell的“设计与构建AI解决方案”认证项目,在Lutz Finger教授的指导下,深入学习了GOFAI,尤其是符号规则AI。本文将分享我从该项目第二模块“探索古早味AI”中的一些关键学习心得,重点探讨符号规则

Transformer架构:大型语言模型(LLM)背后的秘密武器

大型语言模型(LLM),如ChatGPT、Gemini和Llama,正在以惊人的速度改变我们与人工智能交互的方式。它们强大能力的背后,隐藏着一个核心结构——Transformer架构。本文将深入浅出地解析Transformer架构,让你了解它如何驱动这些令人印象深刻的AI模型。 1. Transformer:超越传统序列模型的革新 在Transformer出现之前,循环神经网络(RNNs)和长短期

基于 OpenAPI Schema、RAG 和 LLMs 的 API 自动化测试用例生成:Caseforge 的探索与实践

随着微服务架构的普及,API 端点的数量呈指数级增长,全面彻底地测试这些 API 的成本也随之水涨船高。即使存在 OpenAPI (Swagger) 规范,编写 API 测试用例仍然是一项手动、重复性的工作。那么,我们是否可以仅仅依靠 OpenAPI schema 自动生成有意义的 测试用例呢?近年来,大型语言模型 (LLMs) 的崛起为我们提供了一种新的可能性。本文将深入探讨如何结合 OpenA

大模型评测:从技术到伦理,迈向可信赖的AI未来

随着大型语言模型(LLMs)在各个领域迅速普及,对它们的评测变得至关重要。本文深入探讨了LLM评测的原理、方法、挑战以及伦理考量,并分析了如何利用评测框架来确保LLM的性能、可靠性和安全性,最终构建一个可信赖的AI未来。 1. 领域特定模型评测的必要性 通用LLM侧重于广泛的语言能力,而领域特定模型则通过在特定领域数据集上的针对性训练,在特定行业(如医疗、法律、金融)中表现出色。Bloomberg

大模型技术前沿:从RAG到自主Agent的演进与微调

随着大模型 (LLM) 技术的飞速发展,我们正步入一个全新的智能系统时代。这些模型正从静态、通用型的模式,向着动态、特定任务型的系统转变,具备了实时推理和自主行为的能力。这一变革的核心驱动力在于两项关键技术进步:检索增强生成 (RAG) 和 自主Agent 的涌现。本文将深入探讨这些技术,并对比传统RAG与图RAG系统,以及对Agent层级进行分类,同时也会涉及到对大模型进行微调的技术,以提升其在