Deepseek

深度剖析 DeepSeek v3：大语言模型的新突破

llmtrend 2025年2月7日没有评论

DeepSeek V3的成功不仅是对现有技术的突破，更是对未来大型语言模型（LLM）发展方向的一次深刻洞察。通过引入多头潜在注意力、无辅助损失的负载均衡策略、多令牌预测、低精度训练与细粒度8位量化以及双管并行化机制等创新技术，DeepSeek V3在多个方面实现了超越。

探索前沿：DeepSeek-R1 与 DeepSeek-V3 大模型的突破之路

llmtrend 2025年2月6日没有评论

DeepSeek不仅打破了传统AI模型开发的高成本壁垒，还推动了AI技术的普及和应用。DeepSeek-R1和DeepSeek-V3作为DeepSeek的代表性模型，在数学、代码编写、逻辑推理以及自然语言处理等领域展现出了卓越的性能和广泛的应用潜力。

DeepSeek：新一代LLM的探索与革新

llmtrend 2025年2月6日没有评论

基准测试是衡量AI模型性能的重要指标。DeepSeek的模型在多个基准测试中均取得了优异的成绩。例如，DeepSeek LLM在多个LLM基准测试中超越了其他开源模型；DeepSeek Coder在代码生成和理解任务中表现出色等

从预训练到策略优化：大型语言模型 (LLM) 如何实现与人类意图对齐

Spring AI赋能：利用工具调用（Tool Calling）构建更强大的大语言模型应用

AI 内容捷径：为什么过度依赖 AI 写作会损害你的 WordPress 网站 SEO？

2025年值得关注的五大 Agentic AI框架：迎接自主智能新时代