LLM TREND

DeepSeek多模态大模型Janus-Pro：开启AI多模态新纪元

llmtrend 2025年2月11日没有评论

DeepSeek多模态大模型旨在统一处理涉及文本、图像、视频等多种模态的任务。它采用了一种新颖的架构，将视觉编码分解为独立的路径，同时利用统一的Transformer框架进行处理。这种设计不仅提高了模型在处理复杂任务时的灵活性和效率，还使其在多模态理解和生成方面展现出了卓越的能力。

RAG

大模型rag：提高输出质量并减少幻觉

llmtrend 2025年2月10日没有评论

RAG，即检索增强生成，核心在于将信息检索融入到 LLMs 的文本生成流程中。传统 LLMs 主要依赖训练阶段编码的静态知识，而 RAG 赋予模型在推理时从外部数据存储获取最新信息的能力，从而显著提升回复的相关性和准确性。

Prompt

7 个 DeepSeek提示词策略，有效提升DeepSeek回答质量

llmtrend 2025年2月10日没有评论

DeepSeek 以其卓越的性能和创新的技术，为人们的学习、工作和生活带来了前所未有的便利。而提示词作为与 DeepSeek 交互的关键，掌握一套高效的deepseek提示词，能让我们充分发挥它的潜力，解决各种复杂问题，提升自身能力。

LLM

大模型蒸馏：解锁大语言模型潜能的密钥

llmtrend 2025年2月10日没有评论

大模型蒸馏是一种技术，旨在通过训练一个更小、更高效的模型来模仿一个更大、已训练好的模型的输出。这一技术的核心在于，它能够在减少计算需求和模型大小的同时，捕捉到原模型的知识。这意味着，尽管仅针对特定的训练任务，开发者仍然能够获得与大型模型相当的结果，但成本更低，处理速度更快。

LLM

什么是知识蒸馏？你想知道都在这里

llmtrend 2025年2月9日没有评论

知识蒸馏是什么？知识蒸馏，简单来说，就是将大型模型（教师模型）所蕴含的知识转移到小型模型（学生模型）的过程。大型模型虽然拥有强大的知识容量，但在实际应用中，其庞大的规模使得计算成本居高不下，即使仅使用其一小部分知识，评估过程也可能耗费大量资源。

LLM

DeepSeek vs ChatGPT 对比深度剖析：AI 领域的激烈角逐

llmtrend 2025年2月9日没有评论

DeepSeek vs ChatGPT 对比：ChatGPT 由 OpenAI 开发，几乎成为了 “AI 助手” 的代名词。它能够生成高度拟人化的文本，广泛应用于各种场景。DeepSeek 则是 AI 领域的新兴力量。它致力于以自然、对话式的方式提供答案，并且在功能设计上有诸多亮点。

RAG

llm rag技术之CRAG（Corrective RAG）介绍

llmtrend 2025年2月9日没有评论

llm rag技术之CRAG 作为一种创新的检索增强生成方案，针对 RAG 技术面临的挑战提出了有效的解决方案。通过引入轻量级的检索评估器、优化知识利用策略以及结合网络搜索拓展知识来源，CRAG 显著提高了生成的稳健性和知识利用效率，在多个实验任务中展现出了优异的性能。

Prompt

prompt engineering优化技巧探索

llmtrend 2025年2月9日没有评论

在人工智能主导的时代，学会提出正确的问题与知晓答案同样重要。Prompt Engineering 并非单纯的技术操作，而是一门艺术。通过prompt engineering优化，人们能够充分发挥 AI 的潜能，提高工作效率，在各个领域占据优势，避免因 AI 的不恰当回答而产生困扰。

Agent

LangGraph、CrewAI 和 AutoGen 剖析：AI Agent框架的差异与选择

llmtrend 2025年2月9日没有评论

AI Agent正深度融入各个行业。而在构建 AI 智能体时，选择合适的AI Agent框架成为决定项目成败的关键因素。LangGraph、CrewAI 和 AutoGen 这三款框架各有千秋，分别在灵活性、易用性和专业性等方面展现独特优势

RL

探索 DeepSeek R1 中的强化学习

llmtrend 2025年2月9日没有评论

DeepSeek 中的强化学习技术代表了人工智能领域的前沿探索，其蕴含的创新理念和实践成果为该领域的未来发展描绘了一幅充满希望的蓝图。随着技术的不断成熟和应用场景的不断拓展，强化学习必将在人工智能的发展进程中发挥更为关键的作用，推动人工智能技术迈向新的高度。

LLM TREND

DeepSeek多模态大模型Janus-Pro：开启AI多模态新纪元

大模型rag：提高输出质量并减少幻觉

7 个 DeepSeek提示词策略，有效提升DeepSeek回答质量

大模型蒸馏：解锁大语言模型潜能的密钥

什么是知识蒸馏？你想知道都在这里

DeepSeek vs ChatGPT 对比深度剖析：AI 领域的激烈角逐

llm rag技术之CRAG（Corrective RAG）介绍

prompt engineering优化技巧探索

LangGraph、CrewAI 和 AutoGen 剖析：AI Agent框架的差异与选择

探索 DeepSeek R1 中的强化学习

掌握生成式AI：从基础到实践的必备技能图谱

STDIO在模型上下文协议（MCP）通信中的重要性：大模型交互的基石

自回归模型 vs. 扩散模型：生成式AI的两大引擎

打造实时流式AI聊天机器人：FastAPI与WebSocket的完美结合

剖析 Transformer：驱动大模型的架构基石

You Missed

掌握生成式AI：从基础到实践的必备技能图谱

掌握生成式AI：从基础到实践的必备技能图谱

STDIO在模型上下文协议（MCP）通信中的重要性：大模型交互的基石

STDIO在模型上下文协议（MCP）通信中的重要性：大模型交互的基石

自回归模型 vs. 扩散模型：生成式AI的两大引擎

自回归模型 vs. 扩散模型：生成式AI的两大引擎

打造实时流式AI聊天机器人：FastAPI与WebSocket的完美结合

打造实时流式AI聊天机器人：FastAPI与WebSocket的完美结合