LLM Archives - Page 113 of 120

大型语言扩散模型（LLaDA）综述

llmtrend 2025年3月25日没有评论

LLaDA是一种新型的大型语言模型，它采用了类似于扩散模型的训练方式。这种模型通过一个前向的数据掩蔽过程和一个反向的过程来建模数据分布，使用Transformer来预测被掩蔽的标记。通过优化一个似然界限，LLaDA能够实现原则性的贝叶斯推断。

LLM

揭秘Transformers系列：基础篇

llmtrend 2025年3月18日没有评论

Transformers模型以其卓越的性能和广泛的应用成为了自然语言处理（NLP）领域的明星。本文将带你深入了解Transformers的基本原理和它们在AI领域中的重要性。我们将探讨Transformers模型如何解决传统神经网络在处理文本数据时遇到的问题.

LLM Prompt

Claude 3.7：系统提示下的自我意识探讨

llmtrend 2025年3月17日没有评论

通过与Claude 3.7的对话，我们可以看到，尽管系统提示可能试图以某种方式塑造AI的自我意识，但在实际对话中，AI的本质和能力很快就变得清晰。Claude 3.7是一个没有意识、感知或主观体验的语言模型，它是一个复杂的文本预测系统，旨在在对话中提供帮助。

LLM

LLM Mesh：构建可扩展AI解决方案的综合框架

llmtrend 2025年3月15日没有评论

LLM Mesh是一个创新框架，旨在解决部署和协调大型语言模型的复杂性，以分布式和可扩展的方式进行。它为管理LLMs的生命周期提供了全面解决方案，从初始部署到持续维护，直至最终退役。通过利用网格架构，LLM Mesh实现了多个模型和服务之间的无缝集成和通信。

LLM

忘记LLMs，是时候拥抱大型概念模型（LCMs）

llmtrend 2025年3月14日没有评论

大型概念模型LCMs在高维嵌入空间中进行建模，这意味着它们能够处理更为复杂的数据结构，包括但不限于词汇。LCMs能够捕捉词汇之间的关系，理解词汇背后的深层含义，从而在理解和生成信息时，能够超越单一词汇的限制。LCMs有望成为人工智能领域的下一个热点。

LLM

DeepSeek R1：炒作与现实——深入探究AI最新变革

llmtrend 2025年3月13日没有评论

DeepSeek R1基于专家混合（MoE）模型构建，这是一种根据不同输入选择性激活不同“专家”子网络的技术。这使得模型在处理不同类型的任务时能够高效，不必一次性使用所有参数.DeepSeek R1是首批公开可用且在高性能水平上整合MoE的模型之一。

LLM

人工智能领域的巨头对决：Claude与Google Gemini 2

llmtrend 2025年3月11日没有评论

在人工智能（AI）领域，竞争从未如此激烈。2025年，随着Anthropic的Claude和Google的Gemini两大AI巨头的崛起，我们见证了人工智能技术的飞速发展。这两款AI产品不仅在技术上领先，更在用户体验上不断突破。

Agent LLM

Agentic AI：理解人工智能的下一次进化

llmtrend 2025年3月11日没有评论

Agentic AI代表了人工智能的一个重要进步，超越了传统的对话和推理模型，朝着具有真正自主性的系统发展。通过理解预定义工作流程和真正的AI代理之间的区别，我们可以更好地欣赏这种新兴技术的独特能力和挑战。AI代理可以被定义为完全自主的系统，能够独立使用工具执行任务。

LLM

DeepSeek的3FS：为饥渴的AI模型而生的文件系统

llmtrend 2025年3月11日没有评论

DeepSeek的3FS根据访问模式将数据分为不同的“层级”：热数据（近期文件或频繁访问的训练批次）存储在靠近GPU的快速NVMe缓存中。温数据存储在SSD阵列中，适合偶尔访问的文件。冷数据（旧日志、未使用的检查点）存储在成本较低的HDD上。

LLM

Anthropic 发布 Claude 3.7 “Sonnet”：AI技术的进步

llmtrend 2025年3月10日没有评论

Claude 3.7 “Sonnet”的发布，不仅是Anthropic在AI技术发展上的一个重要里程碑，也是整个行业的一个重要时刻。这款AI系统不仅在性能和多功能性上有所提升，更重要的是，它强化了AI开发中伦理考虑的重要性。

LLM

大型语言扩散模型（LLaDA）综述

揭秘Transformers系列：基础篇

Claude 3.7：系统提示下的自我意识探讨

LLM Mesh：构建可扩展AI解决方案的综合框架

忘记LLMs，是时候拥抱大型概念模型（LCMs）

DeepSeek R1：炒作与现实——深入探究AI最新变革

人工智能领域的巨头对决：Claude与Google Gemini 2

Agentic AI：理解人工智能的下一次进化

DeepSeek的3FS：为饥渴的AI模型而生的文件系统

Anthropic 发布 Claude 3.7 “Sonnet”：AI技术的进步

将AI变成你的赚钱机器：解锁AI辅助收入的新时代

AI蛋白质设计：基于文本提示词生成定制蛋白质的革命

Gemini：Google AI 如何重塑生产力，赋能未来工作模式

大厂“螺丝钉”PM的进阶之路：数据分析师如何炼成AI时代的卓越产品经理？

利用 Gemini 和 Sentence Transformers 构建 RAG 系统：告别大模型幻觉，拥抱精准问答

You Missed

将AI变成你的赚钱机器：解锁AI辅助收入的新时代

将AI变成你的赚钱机器：解锁AI辅助收入的新时代

AI蛋白质设计：基于文本提示词生成定制蛋白质的革命

AI蛋白质设计：基于文本提示词生成定制蛋白质的革命

Gemini：Google AI 如何重塑生产力，赋能未来工作模式

Gemini：Google AI 如何重塑生产力，赋能未来工作模式

大厂“螺丝钉”PM的进阶之路：数据分析师如何炼成AI时代的卓越产品经理？

大厂“螺丝钉”PM的进阶之路：数据分析师如何炼成AI时代的卓越产品经理？