大模型 Archives - Page 5 of 15

CANINE：谷歌颠覆传统，无需分词也能驾驭多语言的大模型

llmtrend 2025年6月10日没有评论

大语言模型（LLM）长期依赖分词技术将文本分解成更小的单元，然后才能进行理解和处理。然而，谷歌的CANINE模型（Character-Aware Neural Input Encoding）以一种革命性的方式挑战了这一范式。CANINE无需预先进行分词，而是直接处理原始的 Unicode 字符，从而在多语言处理、低资源语言以及问答任务中展现出惊人的能力。本文将深入探讨 CANINE 的核心原理、优

LLM Evaluation

大模型“思考”的幻觉：苹果AI研究揭示的真相

llmtrend 2025年6月10日没有评论

近年来，大模型在各种基准测试中表现出色，似乎拥有了强大的推理能力。然而，苹果公司的一项最新研究“思考的幻觉” （The Illusion of Thinking）对此提出了质疑，该研究深入探讨了大模型是否真的具备人类般的推理能力，还是仅仅在模拟思考的过程。本文将深入剖析这项研究，揭示大模型在解决复杂问题时所面临的挑战，并探讨当前评估指标的局限性。现有评估指标的不足 “思考的幻觉”论文首先指出了当

LLM

函数调用：大模型从“能说会道”到“能做会用”的关键一步

llmtrend 2025年6月10日没有评论

函数调用（Function Calling）正在成为大型语言模型（LLM）领域的一项颠覆性技术。它赋予了LLM与外部工具、API和服务进行交互的能力，使其不再仅仅是生成文本的机器，而是能够真正解决实际问题的智能助手。本文将深入探讨函数调用的原理、优势以及未来应用，并结合具体案例展示其如何驱动大模型能力的进化。从泛泛而谈到精准执行：函数调用原理详解过去，大模型的能力主要体现在文本生成、语言理解和

LLM

大模型时代的“搅拌机效应”：过度简化风格的隐忧

llmtrend 2025年6月9日没有评论

大模型（LLM）技术日新月异，深刻地影响着我们写作的方式。当我们向大模型寻求编辑建议时，它常常倾向于过度简化，就像一个无情的“搅拌机”，将原本富有层次的文本搅拌成千篇一律的格式。本文探讨了这种过度简化带来的隐忧，以及如何巧妙地利用大模型，避免陷入这种“搅拌机效应”。 1. 大模型：工具还是枷锁？核心关键词：大模型，工具性将大模型视为写作工具，本无可厚非。它可以帮助我们检查语法错误、优化语言表达

LLM

大模型语境下的情感分析：超越“正面/负面”的深度解读

llmtrend 2025年6月9日没有评论

传统的情感分析往往局限于简单的关键词匹配，难以准确捕捉语境下的真实情感。然而，随着大模型（LLMs）技术的飞速发展，我们终于有机会让机器像人类一样“读懂”情感，实现更准确、更 nuanced 的情感分析。本文将深入探讨大模型如何提升情感分析的精准度，并阐述其在实际应用中的价值。关键词：传统情感分析的局限性长久以来，情感分析依赖于简单的词汇评分系统，例如，“高兴”被赋予+1分，“悲伤”被赋予-1

LLM

释放Rustdoc Markdown的力量：赋能大模型，构建智能软件开发生态

llmtrend 2025年6月9日没有评论

在软件开发领域，大模型（LLMs）正以前所未有的速度改变着我们的工作方式。然而，要真正发挥大模型在复杂代码库中的潜力，仅仅依靠其海量的通用知识库是不够的。本文将深入探讨如何利用Rust语言的Rustdoc Markdown，提取精准的上下文信息，赋能大模型，最终构建一个更智能、高效的软件开发生态。通过将结构化的Rust代码文档转化为易于理解的Markdown格式，我们可以显著提升大模型在代码生成、

LLM

Google Gemini 2.5 Pro 预览版：长文本处理能力超越 OpenAI O3，揭示大模型发展新方向

llmtrend 2025年6月9日没有评论

Google 的 Gemini 2.5 Pro 预览版在长文本处理方面取得了令人瞩目的突破，在 Fiction.Live 基准测试中，处理 192K tokens（约 150 万字符）的长文本时，准确率超过 90%，超越了 OpenAI 的 O3 模型。这一结果不仅标志着长文本理解能力的新高度，也揭示了大模型发展的新方向，即从单纯追求参数规模转向真正理解和高效处理海量信息。作为长期关注大语言模型发

LLM

大模型技术入门：从传统编程到神经网络的演进之路

llmtrend 2025年6月9日没有评论

随着人工智能技术的飞速发展，大模型（LLM）如ChatGPT、Claude、Sora、Midjourney等正深刻地改变着各行各业，尤其是在电影和创意领域。本文旨在为非技术背景的读者，特别是影视从业者和对AI感兴趣的人士，深入浅出地解析大模型的工作原理，帮助大家理解这些AI“故事讲述者”背后的机制，以及为何仅仅预测下一个单词就能产生如此惊艳、类人的结果。本文将从传统编程与机器学习的对比、向量与矩阵

LLM

大模型时代，警惕“自动化偏见”：信任的迷雾与理性的坚守

llmtrend 2025年6月9日没有评论

在人工智能，尤其是大模型（LLMs）技术日新月异的今天，我们正面临着前所未有的信任危机——一种名为“自动化偏见”的认知陷阱。这种偏见是指人们过度依赖自动化系统，即使系统出错也倾向于无条件接受其输出结果的倾向。本文将深入探讨自动化偏见如何影响我们对大模型的信任，并分析其潜在的风险与应对策略。自动化偏见：信任的根源与陷阱自动化偏见并非新生事物，早在计算机普及之初就已存在。人们对计算机的信任源于其理

LLM

大模型时代工程师的进化：架构师、工匠、规划师与氛围组

llmtrend 2025年6月9日没有评论

导语：在大模型技术浪潮席卷软件工程领域的今天，我们正经历一场前所未有的变革。软件工程师不再仅仅是代码的编写者，而是需要重新审视自身角色，适应新的工作方式。本文将深入探讨在大模型时代，软件工程师的几种典型角色：架构师、工匠、规划师与氛围组，帮助你认清自身定位，把握时代脉搏。大模型带来的根本性变革大模型（Large Language Models，LLMs）的出现，不仅仅是为软件工程师们提供了一

大模型

CANINE：谷歌颠覆传统，无需分词也能驾驭多语言的大模型

CANINE：谷歌颠覆传统，无需分词也能驾驭多语言的大模型

大模型“思考”的幻觉：苹果AI研究揭示的真相

大模型“思考”的幻觉：苹果AI研究揭示的真相

函数调用：大模型从“能说会道”到“能做会用”的关键一步

函数调用：大模型从“能说会道”到“能做会用”的关键一步

大模型时代的“搅拌机效应”：过度简化风格的隐忧

大模型时代的“搅拌机效应”：过度简化风格的隐忧

大模型语境下的情感分析：超越“正面/负面”的深度解读

大模型语境下的情感分析：超越“正面/负面”的深度解读

释放Rustdoc Markdown的力量：赋能大模型，构建智能软件开发生态

释放Rustdoc Markdown的力量：赋能大模型，构建智能软件开发生态

Google Gemini 2.5 Pro 预览版：长文本处理能力超越 OpenAI O3，揭示大模型发展新方向

Google Gemini 2.5 Pro 预览版：长文本处理能力超越 OpenAI O3，揭示大模型发展新方向

大模型技术入门：从传统编程到神经网络的演进之路

大模型技术入门：从传统编程到神经网络的演进之路

大模型时代，警惕“自动化偏见”：信任的迷雾与理性的坚守

大模型时代，警惕“自动化偏见”：信任的迷雾与理性的坚守

大模型时代工程师的进化：架构师、工匠、规划师与氛围组

大模型时代工程师的进化：架构师、工匠、规划师与氛围组

大模型 Prompt 工程的本质：从 “成为 (Be)” 到 “行动 (Do)” 的飞跃

构建 MCP 服务器：通往智能 AI 集成的指南

使用 Foundry Local 构建 Blazor 本地 AI 聊天应用：从 Ollama 到完全本地化

LangChain实战指南：基于Groq的极速LLM应用开发

AI Agent的记忆力：构建智能体的核心基石

You Missed

大模型 Prompt 工程的本质：从 “成为 (Be)” 到 “行动 (Do)” 的飞跃

大模型 Prompt 工程的本质：从 “成为 (Be)” 到 “行动 (Do)” 的飞跃

构建 MCP 服务器：通往智能 AI 集成的指南

构建 MCP 服务器：通往智能 AI 集成的指南

使用 Foundry Local 构建 Blazor 本地 AI 聊天应用：从 Ollama 到完全本地化

使用 Foundry Local 构建 Blazor 本地 AI 聊天应用：从 Ollama 到完全本地化

LangChain实战指南：基于Groq的极速LLM应用开发

LangChain实战指南：基于Groq的极速LLM应用开发