2 月 2025

什么是COT（Chain of Thought Prompting）

llmtrend 2025年2月8日没有评论

COT技术是一种自然语言处理（NLP）领域的创新方法，旨在通过引导AI系统逐步思考问题的过程，从而提高其推理能力。在Wei等人（2022）的研究中，首次提出了COT提示的概念，即通过中间推理步骤实现复杂推理能力,这种方法模仿了人类的解题方式.

LLM

DeepSeek-R1：开源大模型的创新先锋

llmtrend 2025年2月7日没有评论

DeepSeek-R1 的成功展示了开源大语言模型的潜力。它证明了通过合理的训练方法和优质的数据集，可以在降低训练成本和时间的同时，实现与行业领先模型相媲美的性能。基础模型的选择、训练算法的优化以及数据处理的精细程度，都是影响模型性能的关键因素。

LLM

深度剖析 DeepSeek v3：大语言模型的新突破

llmtrend 2025年2月7日没有评论

DeepSeek V3的成功不仅是对现有技术的突破，更是对未来大型语言模型（LLM）发展方向的一次深刻洞察。通过引入多头潜在注意力、无辅助损失的负载均衡策略、多令牌预测、低精度训练与细粒度8位量化以及双管并行化机制等创新技术，DeepSeek V3在多个方面实现了超越。

RAG

探索高级检索增强生成（RAG）技术：提升 AI 系统性能的关键路径

llmtrend 2025年2月6日没有评论

高级 RAG 技术从不同角度对传统 RAG 系统进行了优化和拓展，有效解决了其面临的诸多挑战。这些技术在提升检索精度、增强上下文理解、优化回复生成等方面发挥着重要作用，为开发更智能、更高效、更准确的 AI 系统提供了有力支持。

Prompt

七种高级提示工程（prompt engineering）技巧，解锁LLM的潜力

llmtrend 2025年2月6日没有评论

高级提示工程技巧为从大型语言模型中提取最大价值提供了强大的框架。通过仔细构建提示，包括迭代推理、逐步分析以及反馈循环，用户可以成为更有效的用户，即使面对最复杂的查询，也能从模型中获取详细、准确且可操作的响应。这些技巧不仅提高了模型的准确性，还增强了用户对答案的信任度和满意度。

LLM

探索前沿：DeepSeek-R1 与 DeepSeek-V3 大模型的突破之路

llmtrend 2025年2月6日没有评论

DeepSeek不仅打破了传统AI模型开发的高成本壁垒，还推动了AI技术的普及和应用。DeepSeek-R1和DeepSeek-V3作为DeepSeek的代表性模型，在数学、代码编写、逻辑推理以及自然语言处理等领域展现出了卓越的性能和广泛的应用潜力。

LLM

DeepSeek：新一代LLM的探索与革新

llmtrend 2025年2月6日没有评论

基准测试是衡量AI模型性能的重要指标。DeepSeek的模型在多个基准测试中均取得了优异的成绩。例如，DeepSeek LLM在多个LLM基准测试中超越了其他开源模型；DeepSeek Coder在代码生成和理解任务中表现出色等

PDF解析

MinerU：AI时代的优质PDF解析工具

llmtrend 2025年2月5日没有评论

MinerU作为一款面向AI时代的优质PDF解析工具，在功能和性能方面都表现出了不俗的实力和潜力。它不仅能够满足科研人员、开发者及数据科学家在处理科学文献和数据报告时的需求，还能够为商业数据分析、自动化文档处理及内容管理与出版等领域提供有力支持。

AI Tools

10个有用的AI tools，助力开发者高效工作

llmtrend 2025年2月5日没有评论

10个AI tools在代码编写、文档生成、模型比较、代码审查、多媒体处理、测试案例生成、文件搜索、文档助理、Git仓库优化以及UI组件生成等方面都具有显著的优势和应用价值。它们不仅能够帮助开发者提高工作效率和创造力，还能从繁琐的重复性工作中解脱出来，专注于更具创新性的任务。

AI News

Qwen 2.5-Max在多项基准测试中超越DeepSeek V3

llmtrend 2025年2月5日没有评论

Qwen 2.5-Max经过了超过20万亿个token的预训练，并通过了包括监督微调（Supervised Fine-Tuning，SFT）和人类反馈强化学习（Reinforcement Learning from Human Feedback，RLHF）等尖端技术的精细调优

什么是COT（Chain of Thought Prompting）

DeepSeek-R1：开源大模型的创新先锋

深度剖析 DeepSeek v3：大语言模型的新突破

探索高级检索增强生成（RAG）技术：提升 AI 系统性能的关键路径

七种高级提示工程（prompt engineering）技巧，解锁LLM的潜力

探索前沿：DeepSeek-R1 与 DeepSeek-V3 大模型的突破之路

DeepSeek：新一代LLM的探索与革新

MinerU：AI时代的优质PDF解析工具

10个有用的AI tools，助力开发者高效工作

Qwen 2.5-Max在多项基准测试中超越DeepSeek V3

大型语言模型 (LLM)：原理、应用与实践指南

2025年大模型前沿架构：量化创新深度解析

基于FastAPI与RAG的电商智能聊天机器人：从入门到实践

LLM赋能：一个Spring Boot应用如何替代五个微服务API？

大模型推理的幻觉：Apple揭示AI“思考”的局限性

You Missed

大型语言模型 (LLM)：原理、应用与实践指南

大型语言模型 (LLM)：原理、应用与实践指南

2025年大模型前沿架构：量化创新深度解析

2025年大模型前沿架构：量化创新深度解析

基于FastAPI与RAG的电商智能聊天机器人：从入门到实践

基于FastAPI与RAG的电商智能聊天机器人：从入门到实践

LLM赋能：一个Spring Boot应用如何替代五个微服务API？

LLM赋能：一个Spring Boot应用如何替代五个微服务API？