LLM Archives - Page 69 of 84

从零构建LLM：第四讲：如何为大型语言模型构建Tokenizer

llmtrend 2025年5月30日没有评论

构建像GPT这样的大型语言模型（LLM）很大程度上取决于如何处理输入的文本。其中一个关键步骤是tokenization（分词）。它是将原始句子转换成模型可以理解和学习的形式的桥梁。在本指南中，你将学习如何用Python从头开始一步一步地创建一个简单的tokenizer。什么是Tokenization，以及它对大型语言模型的重要性想象你有一大段文字。LLM要做的第一件事就是将其分割成更小的片段，

LLM

Claude Opus 4 降本增效：提示缓存与批量处理助你节省高达 90% 成本

llmtrend 2025年5月30日没有评论

Anthropic 的 Claude Opus 4 模型以其卓越的推理能力和指令遵循性能，在众多 AI 模型中脱颖而出，甚至可以与 GPT-4 相媲美。然而，强大性能的背后往往伴随着高昂的 token 费用。本文将深入探讨 Claude Opus 4 的实际成本，分析百万 token 的具体含义，并介绍如何利用提示缓存和批量处理等技术，实现高达 90% 的成本节约，让你的 AI 项目更具性

LLM

Ollama、R与MedGemma：本地化部署实现德语SOAP格式临床笔记自动生成

llmtrend 2025年5月30日没有评论

在医疗领域，临床笔记的记录与整理是一项耗时且繁琐的任务。如何利用大模型技术提升医疗效率，解放医务人员的时间，成为一个重要的研究方向。本文将深入探讨如何结合Ollama、R语言以及MedGemma大模型，在本地环境中实现德语SOAP格式临床笔记的自动生成，并以实际案例分析其应用价值与潜力。受Gabriel Preda的启发，我们尝试在本地环境中运行MedGemma，探索大模型在医疗领域本地化部署的可

LLM

大模型时代的基石：深入浅出字节对编码（BPE）

llmtrend 2025年5月30日没有评论

近年来，自然语言处理（NLP）领域经历了爆炸式的发展，而大语言模型（LLM）的崛起更是将这一趋势推向了顶峰。从最初的简单语言建模和机器翻译，到如今能够生成高质量文本、进行复杂推理的大模型，其背后离不开对文本数据的有效处理和理解。在这个过程中，将人类语言转化为机器可理解的数字形式至关重要。尽管诸如词汇表映射、TF-IDF、Word2Vec和GloVe等算法都为 NLP 研究做出了重要贡献，但它们在跨

LLM

大模型基座模型的心理学：解密LLM系列之四

llmtrend 2025年5月30日没有评论

探索大模型（LLM）的心理学，就像解开一个巨大而复杂的魔方。在之前的文章中，我们已经探讨了预训练阶段海量数据的基石作用，以及Tokenization（分词）的奥秘和类神经网络的训练过程。今天，我们将更深入地探究机器的核心：基座模型的心理学。这是一切变得原始、强大，有时甚至非常奇怪的地方。基座模型：未雕琢的璞玉究竟什么是基座模型？我们可以将其视为LLM的预指令版本。它已经吞噬了惊人数量的人类

LLM

下一个爆款应用为何不仅仅是“可用”，而是“会思考”？LangChain 解锁大模型潜能

llmtrend 2025年5月30日没有评论

当你在使用 ChatGPT 提问，或者从客服机器人那里获得回复时，你或许感觉直接与模型对话。但事实并非如此。在幕后，存在着一个系统——一个“大脑到世界”的翻译器——默默地完成着繁重的工作。这就是 LangChain 的作用所在。LangChain 就像一个神经系统，连接着大脑与眼睛、耳朵、嘴巴和双手，让大模型的能力得以释放。大模型 (LLMs)：智能的基石大模型 (LLMs)，如 ChatGP

LLM

DeepSeek 原生稀疏注意力 (NSA)：突破长文本处理瓶颈，引领大模型未来？

llmtrend 2025年5月30日没有评论

注意力机制是现代大模型的核心组件，而 DeepSeek 提出的原生稀疏注意力 (Native Sparse Attention, NSA) 正是针对现有注意力机制在长文本处理上的瓶颈而设计的一种全新方案。本文将深入剖析 NSA 的原理、优势以及它对未来大模型发展的潜在影响。全注意力机制的挑战：算力与效率的瓶颈 Transformer 模型依赖于全注意力机制，该机制允许每个 token 都关注序列

LLM

本地部署高性能泰语OCR：基于Typhoon-OCR-7B和FastAPI的实战指南

llmtrend 2025年5月30日没有评论

在大模型时代，OCR技术不再遥不可及。本文将深入探讨如何利用本地资源，结合FastAPI框架和专为泰语设计的Typhoon-OCR-7B模型，搭建一套高性能的泰语OCR系统。这套系统旨在帮助开发者和小型组织在无需依赖云服务的情况下，准确且高效地从图像中提取泰语文本。 1. 告别云端：本地化OCR的必要性传统的OCR方案往往依赖于云服务，虽然使用便捷，但也存在一些问题。首先，数据安全无法得到充分保

LLM

诺贝尔奖得主惊人发现：AI幻觉竟是创造力的宝藏！

llmtrend 2025年5月30日没有评论

人工智能（AI）领域的“幻觉”现象，一直被认为是AI犯错的表现，指的是AI生成的内容看似合理，实则与客观事实相悖。然而，近日诺贝尔奖得主们却提出了一个颠覆性的观点：AI幻觉并非一无是处，反而可能是激发创新、推动科学进步的关键所在。本文将深入探讨AI幻觉的本质、潜在价值以及面临的争议，揭示其在科技发展中的独特作用。 AI幻觉的本质：超越现实的想象力 “AI幻觉”的核心在于其生成的内容与现实世界的偏差

LLM

企业如何驾驭开源大模型（LLM）的浪潮：Altai的无代码AI平台解决方案

llmtrend 2025年5月30日没有评论

大语言模型（LLM）正在重塑企业的运作方式，从自动化流程到优化决策，潜力无限。然而，将AI大规模应用于企业并非易事，面临着定制化、数据隐私以及人才缺口等多重挑战。Altai致力于通过其无代码AI平台，赋能企业轻松定制和部署LLM，无论是在云端还是本地，助力企业拥抱开源AI的机遇。开源AI：企业AI的新引擎开源LLM，如Llama和DeepSeek的出现，极大地降低了前沿AI技术的门槛。然而，企

LLM

从零构建LLM：第四讲：如何为大型语言模型构建Tokenizer

从零构建LLM：第四讲：如何为大型语言模型构建Tokenizer

Claude Opus 4 降本增效：提示缓存与批量处理助你节省高达 90% 成本

Claude Opus 4 降本增效：提示缓存与批量处理助你节省高达 90% 成本

Ollama、R与MedGemma：本地化部署实现德语SOAP格式临床笔记自动生成

Ollama、R与MedGemma：本地化部署实现德语SOAP格式临床笔记自动生成

大模型时代的基石：深入浅出字节对编码（BPE）

大模型时代的基石：深入浅出字节对编码（BPE）

大模型基座模型的心理学：解密LLM系列之四

大模型基座模型的心理学：解密LLM系列之四

下一个爆款应用为何不仅仅是“可用”，而是“会思考”？LangChain 解锁大模型潜能

下一个爆款应用为何不仅仅是“可用”，而是“会思考”？LangChain 解锁大模型潜能

DeepSeek 原生稀疏注意力 (NSA)：突破长文本处理瓶颈，引领大模型未来？

DeepSeek 原生稀疏注意力 (NSA)：突破长文本处理瓶颈，引领大模型未来？

本地部署高性能泰语OCR：基于Typhoon-OCR-7B和FastAPI的实战指南

本地部署高性能泰语OCR：基于Typhoon-OCR-7B和FastAPI的实战指南

诺贝尔奖得主惊人发现：AI幻觉竟是创造力的宝藏！

诺贝尔奖得主惊人发现：AI幻觉竟是创造力的宝藏！

企业如何驾驭开源大模型（LLM）的浪潮：Altai的无代码AI平台解决方案

企业如何驾驭开源大模型（LLM）的浪潮：Altai的无代码AI平台解决方案

大模型 Prompt 工程的本质：从 “成为 (Be)” 到 “行动 (Do)” 的飞跃

构建 MCP 服务器：通往智能 AI 集成的指南

使用 Foundry Local 构建 Blazor 本地 AI 聊天应用：从 Ollama 到完全本地化

LangChain实战指南：基于Groq的极速LLM应用开发

AI Agent的记忆力：构建智能体的核心基石

You Missed

大模型 Prompt 工程的本质：从 “成为 (Be)” 到 “行动 (Do)” 的飞跃

大模型 Prompt 工程的本质：从 “成为 (Be)” 到 “行动 (Do)” 的飞跃

构建 MCP 服务器：通往智能 AI 集成的指南

构建 MCP 服务器：通往智能 AI 集成的指南

使用 Foundry Local 构建 Blazor 本地 AI 聊天应用：从 Ollama 到完全本地化

使用 Foundry Local 构建 Blazor 本地 AI 聊天应用：从 Ollama 到完全本地化

LangChain实战指南：基于Groq的极速LLM应用开发

LangChain实战指南：基于Groq的极速LLM应用开发