llmtrend, Author at LLM TREND

RAG：检索增强生成技术如何赋能大语言模型

llmtrend 2025年5月31日没有评论

大语言模型（LLM）如ChatGPT曾经会自信地给出“现在是2021年”这样的错误答案，原因在于其训练数据截止于2021年，无法获知之后的信息。解决这一问题的关键并非简单地每年更新数据，而是采用了一种更为智能的方法：检索增强生成 (Retrieval-Augmented Generation，简称RAG)。RAG技术的出现，让人们惊呼：“现在它们可以连接互联网了，我们可以开始大展身手了！”而不再像

LLM

大型语言模型（LLM）如何变革医疗健康：从研究实验室到患者床旁

llmtrend 2025年5月31日没有评论

近年来，大型语言模型（LLM），如GPT-4，已经超越了通用对话领域，进入了医疗健康等专业领域。随着医疗数据的日益复杂、医生文档负担的加重，以及对个性化患者互动需求的增加，LLM正在成为强大的工具，可以彻底改变我们管理、提供和改善医疗健康的方式。这篇文章将探讨LLM如何在医学研究、患者互动和健康信息管理这三大现代医疗健康创新支柱中发挥作用，以及面临的挑战和未来的发展方向。核心就在于，如何以安全

LLM

大模型赋能文本生成：AI 写作者的崛起与内容创作的未来

llmtrend 2025年5月31日没有评论

在人工智能浪潮的推动下，我们已经步入了一个机器能够书写的时代。这里的“书写”不仅仅是简单的命令或关键词罗列，而是能够生成完整的博客文章、引人入胜的营销文案，甚至是功能完善的代码。这场变革的核心驱动力，正是诸如 GPT-4、Claude 和 Gemini 等大模型 (Large Language Models, LLMs)。这些模型将曾经被认为不可能完成的任务——达到人类水平的写作能力——转化为一种

LLM

大模型智能体高级课程综述：推理、学习、规划、安全与应用

llmtrend 2025年5月31日没有评论

本篇文章对 Dawn Song 教授及其团队开设的《大模型智能体高级课程》进行综述，课程涵盖了大模型智能体的核心技术，包括推理、学习、规划、多模态应用、以及至关重要的安全问题。课程深入探讨了如何利用大型语言模型（LLM）构建具备复杂任务处理能力的智能体，并在数学证明、代码生成、漏洞检测等多个领域展示了 LLM 智能体的强大潜力。本文将围绕这些关键词，逐一剖析课程的核心内容与亮点。推理：提升 LL

LLM

大模型智能体在数学推理领域的突破：UC Berkeley Spring 2025 进展解读

llmtrend 2025年5月31日没有评论

近年来，大模型（LLM）智能体在各个领域展现出惊人的潜力，尤其是在数学推理方面。UC Berkeley 在2024年秋季和2025年春季开设了一系列关于生成式AI智能体的课程，其中2025年春季的重点在于数学推理能力的提升。本次课程的重点在于探索如何利用大模型解决复杂的数学问题，并验证其推理的准确性。本文将深入探讨该课程中关于数学推理的关键讨论，并着重分析其在形式化数学、自形式化和强化学习等方面的

Agent

Agentic AI：大模型驱动的业务工作流自动化，UI测试迎来革命性变革

llmtrend 2025年5月31日没有评论

在当今快节奏、软件驱动的商业环境中，手动测试正逐渐成为瓶颈。诸如登录、数据录入和审批等关键业务工作流需要持续验证。然而，传统的测试自动化工具（如Selenium和Cypress）仍然依赖于人工编写的脚本和脆弱的选择器，这些选择器很容易因前端的微小改动而失效。现在，一种名为 Agentic AI 的全新范式正在崛起，它利用大模型（LLMs）充当智能代理，能够理解业务指令、解读Web环境并在浏览器中执

LLM

探索前沿：2025春季高级大型语言模型智能体（LLM Agents）MOOC学习心得

llmtrend 2025年5月31日没有评论

2025年春季，我参加了高级大型语言模型智能体（LLM Agents）MOOC课程，这是一次令人振奋的学习之旅。课程内容涵盖了推理、规划、定理证明以及AI安全等多个关键领域，深入浅出地展现了当前agentic AI的最新进展以及未来的发展方向。通过学习，我不仅掌握了各种inference-time和post-training技术，还对如何构建能够推理、规划和验证代码或证明的端到端智能体有了更深刻的

LLM

解锁Gen AI中MCP的潜力：释放自主性与战略视野

llmtrend 2025年5月31日没有评论

在大模型时代，Gen AI（生成式人工智能）正以前所未有的速度重塑各行各业。要真正释放Gen AI的潜力，关键在于构建一个强大且灵活的框架，确保AI能够理解、适应并服务于现实世界的复杂需求。MCP（模型上下文协议）应运而生，它为Gen AI提供了一个清晰的上下文环境，赋予其更强的自主性与战略视野。本文将深入探讨MCP在Gen AI领域的关键作用、优势以及未来发展方向，帮助企业更好地利用这一技术驱动

AI News

AI的“魔镜”与BuzzFeed的“芭比”：解析表征偏差与AI的局限性

llmtrend 2025年5月31日没有评论

BuzzFeed近期因发布（后删除）由AI生成的各国芭比形象而引发争议，这些图像迅速走红，同时也因其反映出的表征偏差而备受批评。这一事件引出了关于AI偏差的重要问题，以及这些模型如何解读和呈现现实。本文将深入探讨AI中的偏差问题，并结合BuzzFeed芭比案例，分析其背后深层原因与潜在影响。 AI：一面反映训练数据的“魔镜” AI模型并非天生“邪恶”，其本质是学习训练数据的产物。如果训练数据本身就

LLM

自我奖励训练 (SRT): 大语言模型 (LLM) 通过多数投票实现自我改进，及其潜在风险

llmtrend 2025年5月31日没有评论

大语言模型 (LLM) 正在不断突破人工智能的边界，尤其是在数学等复杂的推理任务中。然而，要实现这一突破，需要海量的训练数据。随着计算资源的持续扩展，高质量、人工生成的数据的可用性正日益成为一个重要的瓶颈。本文将深入探讨自我奖励训练 (SRT) 的概念，这是一种新型的训练方法，允许 LLM 在无需过多人工干预的情况下，通过多数投票机制进行自我改进，但同时也要警惕其潜在的风险。数据瓶颈与传统 LL

llmtrend

RAG：检索增强生成技术如何赋能大语言模型

RAG：检索增强生成技术如何赋能大语言模型

大型语言模型（LLM）如何变革医疗健康：从研究实验室到患者床旁

大型语言模型（LLM）如何变革医疗健康：从研究实验室到患者床旁

大模型赋能文本生成：AI 写作者的崛起与内容创作的未来

大模型赋能文本生成：AI 写作者的崛起与内容创作的未来

大模型智能体高级课程综述：推理、学习、规划、安全与应用

大模型智能体高级课程综述：推理、学习、规划、安全与应用

大模型智能体在数学推理领域的突破：UC Berkeley Spring 2025 进展解读

大模型智能体在数学推理领域的突破：UC Berkeley Spring 2025 进展解读

Agentic AI：大模型驱动的业务工作流自动化，UI测试迎来革命性变革

Agentic AI：大模型驱动的业务工作流自动化，UI测试迎来革命性变革

探索前沿：2025春季高级大型语言模型智能体（LLM Agents）MOOC学习心得

探索前沿：2025春季高级大型语言模型智能体（LLM Agents）MOOC学习心得

解锁Gen AI中MCP的潜力：释放自主性与战略视野

解锁Gen AI中MCP的潜力：释放自主性与战略视野

AI的“魔镜”与BuzzFeed的“芭比”：解析表征偏差与AI的局限性

AI的“魔镜”与BuzzFeed的“芭比”：解析表征偏差与AI的局限性

自我奖励训练 (SRT): 大语言模型 (LLM) 通过多数投票实现自我改进，及其潜在风险

自我奖励训练 (SRT): 大语言模型 (LLM) 通过多数投票实现自我改进，及其潜在风险

大模型时代：Prompt管理驯服AI巨兽，释放业务价值

如何将 ChatGPT 级别的智能融入你的 iOS 应用：上下文感知助手架构解析

大型语言模型（LLM）：技术革新、社会影响与未来展望

不用重新训练，大模型成本也能降 40%：Tokenizer（分词器）优化才是关键

欧盟的AI监管新战线：大模型会成为下一个“操作系统”吗？

You Missed

大模型时代：Prompt管理驯服AI巨兽，释放业务价值

大模型时代：Prompt管理驯服AI巨兽，释放业务价值

如何将 ChatGPT 级别的智能融入你的 iOS 应用：上下文感知助手架构解析

如何将 ChatGPT 级别的智能融入你的 iOS 应用：上下文感知助手架构解析

大型语言模型（LLM）：技术革新、社会影响与未来展望

大型语言模型（LLM）：技术革新、社会影响与未来展望

不用重新训练，大模型成本也能降 40%：Tokenizer（分词器）优化才是关键

不用重新训练，大模型成本也能降 40%：Tokenizer（分词器）优化才是关键