LLM Archives - Page 6 of 83

Cursor如何实现百万级向量搜索QPS，以及你也可以！

llmtrend 2025年6月14日没有评论

向量搜索作为大模型应用的关键技术，其性能直接影响着用户体验和系统吞吐量。最近了解到代码助手Cursor的后端实现了每秒百万次的最近邻搜索（QPS），这听起来难以置信，但通过分析其工作负载，我们发现其核心在于对数据进行分区，化整为零，从而实现了惊人的扩展性。本文将深入探讨Cursor是如何利用小索引、KDB.AI以及并行计算等技术，突破向量搜索的性能瓶颈，并展示你如何也能借鉴这些方法。小索引的威力

LLM

让大模型和Python成为你的左膀右臂：打造高效知识工作的新范式

llmtrend 2025年6月14日没有评论

当前，许多团队已经拥有了GPT-4、Claude等强大的大模型和安全的Python环境，但往往却未能将其转化为实际的生产力。知识工作者仍然习惯于手动操作，错失自动化机会，无法将这些技术落地应用。问题的根源并非技术，而是行为模式。本文将探讨如何通过行为转变，让团队从偶尔的、孤立的尝试，转变为日常化、团队化的LLM和Python应用，最终将其融入到核心工作流程中，真正提升工作效率。从好奇到流畅：克服

LLM

打造领域专属的土耳其语大模型：从BERTurk微调到TGI部署

llmtrend 2025年6月14日没有评论

近年来，大模型（LLM）技术在全球范围内取得了显著进展。然而，针对特定领域和特定语言的大模型仍然存在巨大需求。本文将以一篇关于构建土耳其语特定领域大模型的英文文章为蓝本，深入探讨如何利用现有资源和技术，打造一个高效、精准且实用的土耳其语领域专属大模型。我们将重点关注数据收集、预处理、模型选择（尤其是 BERTurk）、微调、评估以及最终的生产部署，并结合实际案例和数据，阐述每个阶段的关键步骤和注意

LLM

零知识证明：2025年保障大语言模型安全的新范式

llmtrend 2025年6月14日没有评论

随着大语言模型 (LLM) 在2025年持续发展并深入各行各业，其安全问题日益凸显。在数据隐私监管日趋严格和威胁日益复杂的背景下，零知识证明 (Zero-Knowledge Proofs, ZKPs) 正作为一种革命性的工具，引领AI进入一个信任、可验证性和隐私保护的新时代。本文将深入探讨零知识证明如何重塑LLM的安全格局，剖析 ZKLLM 的概念，以及零知识证明在人工智能领域的广泛影响。零知识

LLM

大模型赋能的自主智能体：Agentic AI的架构、应用与未来

llmtrend 2025年6月14日没有评论

人工智能领域正经历一场深刻的变革，从简单的对话界面到能够推理、规划和执行复杂任务的自主系统。这场变革的核心在于大模型（LLM）与自主智能体（Agentic AI）架构的战略性融合，这种融合重新定义了机器学习和人工智能发展的可能性。与仅能响应提示的传统AI系统不同，配备了LLM的Agentic AI系统能够独立分析情况、制定策略并采取果断行动。本文将深入探讨Agentic AI的架构、关键技术、实际

LLM

从简单应答到步步推理：大型语言模型（LLM）的思维进化之路

llmtrend 2025年6月14日没有评论

大型语言模型（LLM）已经超越了单纯的文本自动补全，如今它们能够解决数学应用题、生成逻辑论证，甚至调试代码。这一转变并非仅仅源于模型规模的扩大或数据的积累，而是来自于一种更简单、更具人类特性的方法：步步推理。本文将深入探讨LLM如何通过一种名为“思维链（Chain-of-Thought, CoT）提示”的技术，从简单应答进化到具备逐步思考的能力，以及这种进化对通用人工智能（GenAI）领域的深远意

LLM

Common Pile v0.1：负责任AI开发的基石，许可证安全的宝藏数据集

llmtrend 2025年6月14日没有评论

人工智能（AI）领域正以前所未有的速度发展，而高质量、许可证安全的数据集是构建强大AI模型的关键。EleutherAI发布的 Common Pile v0.1 正是这样一款数据集，它以其大规模、明确的法律来源和详尽的文档，为负责任的AI开发提供了坚实的基础。这篇文章将深入探讨 Common Pile v0.1 的核心价值，以及它如何改变AI训练的格局。数据集：AI模型的燃料数据集是AI模型的

LLM

Claude 3.5 Haiku 的大脑扫描：大模型解决问题的惊人方式

llmtrend 2025年6月14日没有评论

AI公司 Anthropic 近期利用一项名为“线路追踪”（Circuit Tracing）的技术，成功地“窥视”了大型语言模型 (LLM) Claude 3.5 Haiku 的内部运作，如同大脑扫描一般，观察它在构建回复时的思考过程。这项研究揭示了 LLM 比我们想象的更加奇特和神秘，它解决问题的方式也远超我们的预期。本文将深入探讨 Anthropic 的这一突破性研究，剖析 Claude 在不

LLM

解码奇异之美：非常规算法的起源、应用与实践（大模型视角）

llmtrend 2025年6月14日没有评论

是否曾偶然遇到过一个让你觉得既奇怪又惊艳的想法，随后意识到它竟然驱动着你日常使用的某些事物？从感觉像是手工打造却又无限广阔的游戏世界，到可能颠覆加密技术的量子技巧，许多“奇异”的算法都隐藏在幕后默默工作。本文将带你友好地探索十种非常规算法，从大模型的视角，深入了解它们的起源、工作原理、实际应用（以及潜在的缺陷），并提供实践建议，帮助你亲身体验。无论你是开发者、数据科学家，还是好奇的探索者，这些令人

LLM

大模型（LLM）与小模型（SLM）：如何选择最适合你的AI应用？

llmtrend 2025年6月14日没有评论

随着生成式AI的兴起，构建智能应用变得前所未有的便捷，这主要归功于预训练语言模型。开发者们不再需要从零开始训练模型，而是可以直接利用那些已经在海量数据集上训练好的模型。然而，并非所有的语言模型都一样。它们在规模、训练方式和应用场景上存在显著差异。本文将深入探讨大语言模型（LLM）和小语言模型（SLM）之间的关键区别，帮助你理解它们各自的优势，并为你的AI应用选择最合适的模型。语言模型概述首先，

LLM

Cursor如何实现百万级向量搜索QPS，以及你也可以！

Cursor如何实现百万级向量搜索QPS，以及你也可以！

让大模型和Python成为你的左膀右臂：打造高效知识工作的新范式

让大模型和Python成为你的左膀右臂：打造高效知识工作的新范式

打造领域专属的土耳其语大模型：从BERTurk微调到TGI部署

打造领域专属的土耳其语大模型：从BERTurk微调到TGI部署

零知识证明：2025年保障大语言模型安全的新范式

零知识证明：2025年保障大语言模型安全的新范式

大模型赋能的自主智能体：Agentic AI的架构、应用与未来

大模型赋能的自主智能体：Agentic AI的架构、应用与未来

从简单应答到步步推理：大型语言模型（LLM）的思维进化之路

从简单应答到步步推理：大型语言模型（LLM）的思维进化之路

Common Pile v0.1：负责任AI开发的基石，许可证安全的宝藏数据集

Common Pile v0.1：负责任AI开发的基石，许可证安全的宝藏数据集

Claude 3.5 Haiku 的大脑扫描：大模型解决问题的惊人方式

Claude 3.5 Haiku 的大脑扫描：大模型解决问题的惊人方式

解码奇异之美：非常规算法的起源、应用与实践（大模型视角）

解码奇异之美：非常规算法的起源、应用与实践（大模型视角）

大模型（LLM）与小模型（SLM）：如何选择最适合你的AI应用？

大模型（LLM）与小模型（SLM）：如何选择最适合你的AI应用？

GPT的“G”：智能的幻觉与统计的辉煌

Prompt Engineering：从入门到精通，解锁大模型潜力的关键

模型上下文协议 (MCP)：赋能 RAG 与 Agentic AI 的未来

实时架构的未来：Kafka + Flink + Python 引领 GenAI 时代的数据流革命

You Missed

GPT的“G”：智能的幻觉与统计的辉煌

GPT的“G”：智能的幻觉与统计的辉煌

Prompt Engineering：从入门到精通，解锁大模型潜力的关键

Prompt Engineering：从入门到精通，解锁大模型潜力的关键

AI的“童年”：从班加罗尔到全球，印度引领大模型技术的“体验式学习”革命

模型上下文协议 (MCP)：赋能 RAG 与 Agentic AI 的未来

模型上下文协议 (MCP)：赋能 RAG 与 Agentic AI 的未来