Deepseek Archives - Page 2 of 3

DeepSeek 如何在架构、成本和优化上脱颖而出

llmtrend 2025年2月27日没有评论

DeepSeek 作为人工智能领域的创新先锋，以其独特的技术优势和创新理念，重新定义了高性能语言模型的发展路径。它通过智能的工程设计和高效的资源管理，打破了传统观念中依赖大规模硬件投入才能发展高性能 AI 的定式，证明了通过创新技术同样可以实现卓越的成果。

LLM

5分钟内本地运行DeepSeek模型

llmtrend 2025年2月27日没有评论

在人工智能技术飞速发展的今天，DeepSeek AI提供了一系列强大的开源模型，这些模型针对编程、研究和多模态任务进行了优化。如果你想要在你的机器上本地运行这些模型，或者在云端使用它们，本文帮助你在五分钟内设置DeepSeek-R1模。

LLM

DeepSeek-R1模型蒸馏技术详解

llmtrend 2025年2月15日没有评论

DeepSeek - R1 模型蒸馏是一项具有重要意义和应用价值的技术，通过合理的步骤和方法，能够将强大的大模型知识传递到小型模型中，为各种应用场景提供高效、低成本的解决方案。随着技术的不断发展和完善，相信蒸馏技术在人工智能领域将发挥更大的作用。

LLM

deepseek解析：技术革新与未来展望

llmtrend 2025年2月13日没有评论

deepseek解析：DeepSeek是一款集高效推理、多模态融合及对垂直领域深度优化于一体的大规模预训练语言模型。该模型旨在打破“规模决定一切”的传统桎梏，追求“轻量级参数，卓越性能”的完美平衡，同时摆脱对大算力的过度依赖，为复杂任务提供一站式解决方案。

LLM

DeepSeek-R1模型与Claude 3.5 Sonnet 对决：AI 领域的巅峰较量

llmtrend 2025年2月12日没有评论

DeepSeek-R1模型是由 DeepSeek AI 研发的聚焦推理的模型，其核心技术之一是强化学习（RL）。通过大规模的强化学习，它无需依赖监督微调就能提升推理能力。这种独特的方式让模型能够探索思维链（CoT）来解决复杂问题，

LLM

DeepSeek多模态大模型Janus-Pro：开启AI多模态新纪元

llmtrend 2025年2月11日没有评论

DeepSeek多模态大模型旨在统一处理涉及文本、图像、视频等多种模态的任务。它采用了一种新颖的架构，将视觉编码分解为独立的路径，同时利用统一的Transformer框架进行处理。这种设计不仅提高了模型在处理复杂任务时的灵活性和效率，还使其在多模态理解和生成方面展现出了卓越的能力。

Prompt

7 个 DeepSeek提示词策略，有效提升DeepSeek回答质量

llmtrend 2025年2月10日没有评论

DeepSeek 以其卓越的性能和创新的技术，为人们的学习、工作和生活带来了前所未有的便利。而提示词作为与 DeepSeek 交互的关键，掌握一套高效的deepseek提示词，能让我们充分发挥它的潜力，解决各种复杂问题，提升自身能力。

LLM

DeepSeek vs ChatGPT 对比深度剖析：AI 领域的激烈角逐

llmtrend 2025年2月9日没有评论

DeepSeek vs ChatGPT 对比：ChatGPT 由 OpenAI 开发，几乎成为了 “AI 助手” 的代名词。它能够生成高度拟人化的文本，广泛应用于各种场景。DeepSeek 则是 AI 领域的新兴力量。它致力于以自然、对话式的方式提供答案，并且在功能设计上有诸多亮点。

RL

探索 DeepSeek R1 中的强化学习

llmtrend 2025年2月9日没有评论

DeepSeek 中的强化学习技术代表了人工智能领域的前沿探索，其蕴含的创新理念和实践成果为该领域的未来发展描绘了一幅充满希望的蓝图。随着技术的不断成熟和应用场景的不断拓展，强化学习必将在人工智能的发展进程中发挥更为关键的作用，推动人工智能技术迈向新的高度。

LLM

DeepSeek-R1：开源大模型的创新先锋

llmtrend 2025年2月7日没有评论

DeepSeek-R1 的成功展示了开源大语言模型的潜力。它证明了通过合理的训练方法和优质的数据集，可以在降低训练成本和时间的同时，实现与行业领先模型相媲美的性能。基础模型的选择、训练算法的优化以及数据处理的精细程度，都是影响模型性能的关键因素。

Deepseek

DeepSeek 如何在架构、成本和优化上脱颖而出

5分钟内本地运行DeepSeek模型

DeepSeek-R1模型蒸馏技术详解

deepseek解析：技术革新与未来展望

DeepSeek-R1模型与Claude 3.5 Sonnet 对决：AI 领域的巅峰较量

DeepSeek多模态大模型Janus-Pro：开启AI多模态新纪元

7 个 DeepSeek提示词策略，有效提升DeepSeek回答质量

DeepSeek vs ChatGPT 对比深度剖析：AI 领域的激烈角逐

探索 DeepSeek R1 中的强化学习

DeepSeek-R1：开源大模型的创新先锋

从预训练到策略优化：大型语言模型 (LLM) 如何实现与人类意图对齐

Spring AI赋能：利用工具调用（Tool Calling）构建更强大的大语言模型应用

2025年值得关注的五大 Agentic AI框架：迎接自主智能新时代

本地部署 DeepSeek-R1：使用 Ollama 轻松驾驭大模型

You Missed

从预训练到策略优化：大型语言模型 (LLM) 如何实现与人类意图对齐

从预训练到策略优化：大型语言模型 (LLM) 如何实现与人类意图对齐

Spring AI赋能：利用工具调用（Tool Calling）构建更强大的大语言模型应用

Spring AI赋能：利用工具调用（Tool Calling）构建更强大的大语言模型应用

AI 内容捷径：为什么过度依赖 AI 写作会损害你的 WordPress 网站 SEO？

2025年值得关注的五大 Agentic AI框架：迎接自主智能新时代

2025年值得关注的五大 Agentic AI框架：迎接自主智能新时代