6 月 2025

LegalSearchLM：大模型赋能法律检索，要素生成重塑判例发现

llmtrend 2025年6月5日没有评论

在法律科技（LegalTech）领域，法律判例检索（Legal Case Retrieval, LCR）一直是至关重要的环节，它直接关系到法律专家的工作效率和司法公正的维护。然而，传统判例检索方法在面对海量数据和复杂法律关系时，往往显得力不从心。近期，一项名为 LegalSearchLM 的创新研究，尝试以生成式检索的视角，将判例检索转化为法律要素生成问题，并构建了大规模的LEGAR BENCH基

LLM

TiRex：基于xLSTM和连续块掩码的零样本时序预测新突破

llmtrend 2025年6月5日没有评论

近年来，大模型技术的发展日新月异，其中零样本预测能力尤为引人注目。零样本预测，即在没有任何训练数据的情况下，仅凭先验知识或少量示例（In-Context Learning, ICL）完成预测任务，极大地降低了模型部署成本和数据依赖性。本文将深入探讨名为TiRex的创新模型，该模型在零样本时序预测领域取得了突破性进展，尤其是在长短期预测方面，超越了以往的SOTA模型。背景与挑战：传统时序预测模型的

Agent

大模型时代的连接器：MCP与A2A如何重塑AI生态？

llmtrend 2025年6月5日没有评论

人工智能领域的快速发展，如同打开了潘多拉的魔盒，各种创新层出不穷。然而，每一个突破性的进展往往伴随着新的挑战。大模型的能力日益强大，但在实际应用中却面临着信息孤岛的困境。例如，ChatGPT无法直接读取Slack线程，Claude也无法访问您的数据库。企业内部署的各种智能体（agents）各自独立运行，虽然具备一定的智能，但缺乏有效的连接与协作。随着企业不断堆叠模型、智能体和API，真正的瓶颈不再

AI News

人工智能浪潮：算法、数据与生活变革的深度解读

llmtrend 2025年6月5日没有评论

人工智能 (AI) 并非科幻电影中拥有独立意识的个体，而是一系列精密的算法，它们在海量数据的驱动下，以前所未有的方式重塑着我们的生活。本文将深入探讨人工智能如何通过算法和数据驱动，颠覆并深刻影响我们生活的方方面面，揭示其背后的技术原理和应用前景。大数据：人工智能腾飞的燃料如果说算法是人工智能的发动机，那么大数据就是驱动这台发动机的燃料。没有庞大的数据集，再精妙的算法也难以发挥作用。原文中提到，

LLM

AI赋能生物学：突破与挑战并存，基础知识仍是关键

llmtrend 2025年6月5日没有评论

近年来，人工智能（AI）尤其是大型语言模型（LLM）的迅猛发展，如同一场数字淘金热，吸引着各行各业的人们竞相追逐。然而，在这股热潮之下，我们是否忽略了真正的基础知识？特别是在生物学领域，AI的应用潜力巨大，但盲目追求新工具，而忽视其内在原理，可能会导致误用、滥用，甚至适得其反。本文将深入探讨AI赋能生物学的现状，揭示其突破与挑战，并强调基础知识的重要性。 LLM：生物学领域的语言大师大型语言模型

LLM

探索“古早味”AI：康奈尔“设计与构建AI解决方案”项目学习心得（一）

llmtrend 2025年6月5日没有评论

在人工智能（AI）领域日新月异的今天，重新审视被称为“古早味AI”（Good Old-Fashioned AI，简称GOFAI）的符号规则AI，显得尤为重要。最近，我参加了康奈尔大学eCornell的“设计与构建AI解决方案”认证项目，在Lutz Finger教授的指导下，深入学习了GOFAI，尤其是符号规则AI。本文将分享我从该项目第二模块“探索古早味AI”中的一些关键学习心得，重点探讨符号规则

LLM

Transformer架构：大型语言模型（LLM）背后的秘密武器

llmtrend 2025年6月5日没有评论

大型语言模型（LLM），如ChatGPT、Gemini和Llama，正在以惊人的速度改变我们与人工智能交互的方式。它们强大能力的背后，隐藏着一个核心结构——Transformer架构。本文将深入浅出地解析Transformer架构，让你了解它如何驱动这些令人印象深刻的AI模型。 1. Transformer：超越传统序列模型的革新在Transformer出现之前，循环神经网络（RNNs）和长短期

RAG

基于 OpenAPI Schema、RAG 和 LLMs 的 API 自动化测试用例生成：Caseforge 的探索与实践

llmtrend 2025年6月5日没有评论

随着微服务架构的普及，API 端点的数量呈指数级增长，全面彻底地测试这些 API 的成本也随之水涨船高。即使存在 OpenAPI (Swagger) 规范，编写 API 测试用例仍然是一项手动、重复性的工作。那么，我们是否可以仅仅依靠 OpenAPI schema 自动生成有意义的测试用例呢？近年来，大型语言模型 (LLMs) 的崛起为我们提供了一种新的可能性。本文将深入探讨如何结合 OpenA

LLM Evaluation

大模型评测：从技术到伦理，迈向可信赖的AI未来

llmtrend 2025年6月5日没有评论

随着大型语言模型（LLMs）在各个领域迅速普及，对它们的评测变得至关重要。本文深入探讨了LLM评测的原理、方法、挑战以及伦理考量，并分析了如何利用评测框架来确保LLM的性能、可靠性和安全性，最终构建一个可信赖的AI未来。 1. 领域特定模型评测的必要性通用LLM侧重于广泛的语言能力，而领域特定模型则通过在特定领域数据集上的针对性训练，在特定行业（如医疗、法律、金融）中表现出色。Bloomberg

RAG

大模型技术前沿：从RAG到自主Agent的演进与微调

llmtrend 2025年6月5日没有评论

随着大模型 (LLM) 技术的飞速发展，我们正步入一个全新的智能系统时代。这些模型正从静态、通用型的模式，向着动态、特定任务型的系统转变，具备了实时推理和自主行为的能力。这一变革的核心驱动力在于两项关键技术进步：检索增强生成 (RAG) 和自主Agent 的涌现。本文将深入探讨这些技术，并对比传统RAG与图RAG系统，以及对Agent层级进行分类，同时也会涉及到对大模型进行微调的技术，以提升其在

LegalSearchLM：大模型赋能法律检索，要素生成重塑判例发现

LegalSearchLM：大模型赋能法律检索，要素生成重塑判例发现

TiRex：基于xLSTM和连续块掩码的零样本时序预测新突破

TiRex：基于xLSTM和连续块掩码的零样本时序预测新突破

大模型时代的连接器：MCP与A2A如何重塑AI生态？

大模型时代的连接器：MCP与A2A如何重塑AI生态？

人工智能浪潮：算法、数据与生活变革的深度解读

人工智能浪潮：算法、数据与生活变革的深度解读

AI赋能生物学：突破与挑战并存，基础知识仍是关键

AI赋能生物学：突破与挑战并存，基础知识仍是关键

探索“古早味”AI：康奈尔“设计与构建AI解决方案”项目学习心得（一）

探索“古早味”AI：康奈尔“设计与构建AI解决方案”项目学习心得（一）

Transformer架构：大型语言模型（LLM）背后的秘密武器

Transformer架构：大型语言模型（LLM）背后的秘密武器

基于 OpenAPI Schema、RAG 和 LLMs 的 API 自动化测试用例生成：Caseforge 的探索与实践

基于 OpenAPI Schema、RAG 和 LLMs 的 API 自动化测试用例生成：Caseforge 的探索与实践

大模型评测：从技术到伦理，迈向可信赖的AI未来

大模型评测：从技术到伦理，迈向可信赖的AI未来

大模型技术前沿：从RAG到自主Agent的演进与微调

大模型技术前沿：从RAG到自主Agent的演进与微调

悄然崛起的环境代理：你的隐形数字管家触手可及

基于 Rust 和 Tauri 构建本地优先 AI：一个 LLM 离线应用的技术蓝图

生成式AI重塑创意与创新：2025年技术、伦理与未来展望

大模型驱动具身智能的“幻觉”危机：一项关于场景-任务不一致性的实证研究

数字时代的普罗米修斯：生成式AI如何重塑思考、创造与认知

You Missed

悄然崛起的环境代理：你的隐形数字管家触手可及

悄然崛起的环境代理：你的隐形数字管家触手可及

基于 Rust 和 Tauri 构建本地优先 AI：一个 LLM 离线应用的技术蓝图

基于 Rust 和 Tauri 构建本地优先 AI：一个 LLM 离线应用的技术蓝图

生成式AI重塑创意与创新：2025年技术、伦理与未来展望

生成式AI重塑创意与创新：2025年技术、伦理与未来展望

大模型驱动具身智能的“幻觉”危机：一项关于场景-任务不一致性的实证研究

大模型驱动具身智能的“幻觉”危机：一项关于场景-任务不一致性的实证研究