LLM Archives - Page 87 of 88

深入剖析大模型技术综述

llmtrend 2025年2月22日没有评论

大语言模型（LLMs）能够理解人类语言并生成高度拟人的文本内容，广泛应用于诸多领域。从智能客服到智能写作，从语言翻译到知识问答，大语言模型的身影无处不在。因此，深入了解大模型技术的原理、应用、实践方法、面临的伦理问题及局限，对把握这一前沿技术的发展脉络和正确应用至关重要。

LLM

长上下文窗口：革新文档编写工作的强大力量

llmtrend 2025年2月21日没有评论

长上下文窗口作为大型语言模型的一大特色功能，在文档编写中展现出了巨大的潜力和价值。它不仅提高了文档编写的效率和准确性，还使得文档更加贴近用户的实际需求和使用场景。对于文档编写者而言，掌握和利用好长上下文窗口这一工具将是我们不断提升文档质量和用户体验的关键所在。

LLM

大模型量化：提升效率的关键技术

llmtrend 2025年2月16日没有评论

大模型量化是指将模型中的高精度参数（如32位浮点数）转换为低精度参数（如8位或4位整数）的过程，旨在减少模型的存储空间和计算复杂度，同时尽可能保持模型的性能。量化技术可以分为两类：静态量化和动态量化。静态量化在模型训练完成后进行，而动态量化则在模型推理过程中动态调整参数精度。

LLM

DeepSeek-R1模型蒸馏技术详解

llmtrend 2025年2月15日没有评论

DeepSeek - R1 模型蒸馏是一项具有重要意义和应用价值的技术，通过合理的步骤和方法，能够将强大的大模型知识传递到小型模型中，为各种应用场景提供高效、低成本的解决方案。随着技术的不断发展和完善，相信蒸馏技术在人工智能领域将发挥更大的作用。

LLM

探秘模型压缩：让 AI 轻装上阵的魔法

llmtrend 2025年2月14日没有评论

从早期简单的神经网络到如今参数动辄数以亿计的大型语言模型，这种增长带来了诸多问题，如高昂的计算成本、巨大的存储需求等。为解决这些问题，模型压缩技术应运而生，它模型在保持性能的同时，变得更小、更快、更高效。本文将深入剖析模型压缩的多种关键技术及其应用。

LLM

知识蒸馏是什么：一项革命性的机器学习技术

llmtrend 2025年2月13日没有评论

知识蒸馏是什么？知识蒸馏，顾名思义，是指将大型、复杂模型（或模型集合）中的知识转移到一个较小的单一模型中，该小型模型能够在现实世界的约束条件下实现实际应用。这一过程实际上是一种模型压缩技术，其目标是在不显著损失性能的前提下，使模型更加易于部署。

LLM

deepseek解析：技术革新与未来展望

llmtrend 2025年2月13日没有评论

deepseek解析：DeepSeek是一款集高效推理、多模态融合及对垂直领域深度优化于一体的大规模预训练语言模型。该模型旨在打破“规模决定一切”的传统桎梏，追求“轻量级参数，卓越性能”的完美平衡，同时摆脱对大算力的过度依赖，为复杂任务提供一站式解决方案。

LLM

DeepSeek-R1模型与Claude 3.5 Sonnet 对决：AI 领域的巅峰较量

llmtrend 2025年2月12日没有评论

DeepSeek-R1模型是由 DeepSeek AI 研发的聚焦推理的模型，其核心技术之一是强化学习（RL）。通过大规模的强化学习，它无需依赖监督微调就能提升推理能力。这种独特的方式让模型能够探索思维链（CoT）来解决复杂问题，

LLM

DeepSeek多模态大模型Janus-Pro：开启AI多模态新纪元

llmtrend 2025年2月11日没有评论

DeepSeek多模态大模型旨在统一处理涉及文本、图像、视频等多种模态的任务。它采用了一种新颖的架构，将视觉编码分解为独立的路径，同时利用统一的Transformer框架进行处理。这种设计不仅提高了模型在处理复杂任务时的灵活性和效率，还使其在多模态理解和生成方面展现出了卓越的能力。

LLM

大模型蒸馏：解锁大语言模型潜能的密钥

llmtrend 2025年2月10日没有评论

大模型蒸馏是一种技术，旨在通过训练一个更小、更高效的模型来模仿一个更大、已训练好的模型的输出。这一技术的核心在于，它能够在减少计算需求和模型大小的同时，捕捉到原模型的知识。这意味着，尽管仅针对特定的训练任务，开发者仍然能够获得与大型模型相当的结果，但成本更低，处理速度更快。

LLM

深入剖析大模型技术综述

长上下文窗口：革新文档编写工作的强大力量

大模型量化：提升效率的关键技术

DeepSeek-R1模型蒸馏技术详解

探秘模型压缩：让 AI 轻装上阵的魔法

知识蒸馏是什么：一项革命性的机器学习技术

deepseek解析：技术革新与未来展望

DeepSeek-R1模型与Claude 3.5 Sonnet 对决：AI 领域的巅峰较量

DeepSeek多模态大模型Janus-Pro：开启AI多模态新纪元

大模型蒸馏：解锁大语言模型潜能的密钥

大模型时代：Prompt管理驯服AI巨兽，释放业务价值

如何将 ChatGPT 级别的智能融入你的 iOS 应用：上下文感知助手架构解析

大型语言模型（LLM）：技术革新、社会影响与未来展望

不用重新训练，大模型成本也能降 40%：Tokenizer（分词器）优化才是关键

欧盟的AI监管新战线：大模型会成为下一个“操作系统”吗？

You Missed

大模型时代：Prompt管理驯服AI巨兽，释放业务价值

大模型时代：Prompt管理驯服AI巨兽，释放业务价值

如何将 ChatGPT 级别的智能融入你的 iOS 应用：上下文感知助手架构解析

如何将 ChatGPT 级别的智能融入你的 iOS 应用：上下文感知助手架构解析

大型语言模型（LLM）：技术革新、社会影响与未来展望

大型语言模型（LLM）：技术革新、社会影响与未来展望

不用重新训练，大模型成本也能降 40%：Tokenizer（分词器）优化才是关键

不用重新训练，大模型成本也能降 40%：Tokenizer（分词器）优化才是关键