3 月 2025

探索大型语言模型的推理能力

llmtrend 2025年3月4日没有评论

虽然LLMs有时看起来像魔法，但归根结底，它们是生成下一个标记的概率模型。正如我们所探讨的，链式思考和从少到多提示等方法帮助大型语言模型更有效地处理复杂任务。使LLMs表现出高级推理能力的努力正在进行中，正如我们所介绍的推理模型和技巧所示。

Agent

探索 smolagents：由 Hugging Face 提供的轻量级 AI 代理框架

llmtrend 2025年3月4日没有评论

smolagents 是一个轻量级框架，用于构建自主的 AI 驱动代理。它以极简的架构设计，使开发者能够在不依赖大型、单一模型的情况下实现特定任务的 AI。smolagents 由 Hugging Face 提供，为轻量级、高效的 AI 代理提供了一种全新的解决方案。

LLM

Diffusion LLMs：语言人工智能的下一个巨大飞跃？

llmtrend 2025年3月4日没有评论

Diffusion LLMs的核心思想是从一个简单的、高熵的状态开始，然后逐步引入信息，直到达到一个更具体、低熵的最终状态。在文本生成中，这个过程可以想象为从一个随机的、无意义的单词序列开始，然后逐步调整单词，直到形成一个连贯、有意义的句子或段落。

LLM

多模态大模型是什么

llmtrend 2025年3月4日没有评论

多模态大模型是什么？多模态大模型是指能够同时处理和理解多种类型数据（如文本、图像、音频、视频等）的人工智能模型。与传统的单一模态模型（如仅处理文本或仅处理图像）相比，多模态大模型的最大特点在于其能够将不同模态的数据结合起来，实现更复杂、更智能的任务。

Prompt

LLM 安全提示技术剖析

llmtrend 2025年3月3日没有评论

LLM 安全提示技术：通过人工审查测试LLM的输出至关重要，以确保响应符合期望的公平和准确性标准。依赖单一的LLM可能不总是提供最平衡的观点。因此，建议使用多个LLM生成响应。这种方法通过利用不同模型的优势并减轻任何单一LLM中可能存在的个体偏见，有助于获得更全面和无偏见的观点。

LLM

如何通过工具调用使大模型（LLM）更智能

llmtrend 2025年3月3日没有评论

工具调用函数是一种编程技术，它允许一个程序或系统调用外部工具或服务来执行特定的任务。在LLM的背景下，这些工具可以是其他AI模型、数据库查询、API调用等。通过这种方式，LLM可以扩展其能力，不仅仅局限于其预训练的知识，而是能够实时地获取和处理信息，从而提供更加准确和相关的回答。

LLM

DeepSeek开源周第四天：优化并行策略的革命

llmtrend 2025年3月3日没有评论

DeepSeek开源周第四天有DualPipe，一个双向管道并行的魔法师，以及EPLB，一个为专家混合（MoE）模型构建的专家并行负载均衡器。它们一起形成了一个强大的组合，正在改变我们对大规模训练的看法。准备好看看它们是如何工作的吗？

Prompt

提升大型语言模型性能：礼貌性在提示中的作用

llmtrend 2025年3月3日没有评论

礼貌性在提示中的作用：礼貌性是人类社会交流中的一个重要方面，它涉及到尊重、考虑他人感受和遵守社会规范。在语言交流中，礼貌性不仅能够促进有效的沟通，还能够建立和维护良好的人际关系。对于LLM而言，理解和生成礼貌的语言同样重要，因为它能够提高模型的可接受度和用户满意度。

Fine-tuning

通过人类反馈进行LLM微调

llmtrend 2025年3月3日没有评论

为了使LLMs更符合人类的偏好和需求，研究者们采用了多种方法来微调这些模型，其中包括基于人类反馈的强化学习（RLHF）和直接策略优化（DPO）。本文将探讨这两种方法的基本原理，并分析它们如何帮助我们根据人类的偏好来进行LLM微调。

LLM

DeepSeek-V3 ：人工智能中专家混合（MoE）的最智能应用

llmtrend 2025年3月3日没有评论

DeepSeek-V3 MoE通过自适应偏置校正消除了对辅助损失的需求。它不是手动强制专家平衡，而是让模型学习一个偏置项，每个训练步骤后动态调整。如果一个专家在一个批次中接收了太多的标记，它的偏置就会减少，使其在下一步中被选择的可能性降低

探索大型语言模型的推理能力

探索 smolagents：由 Hugging Face 提供的轻量级 AI 代理框架

Diffusion LLMs：语言人工智能的下一个巨大飞跃？

多模态大模型是什么

LLM 安全提示技术剖析

如何通过工具调用使大模型（LLM）更智能

DeepSeek开源周第四天：优化并行策略的革命

提升大型语言模型性能：礼貌性在提示中的作用

通过人类反馈进行LLM微调

DeepSeek-V3 ：人工智能中专家混合（MoE）的最智能应用

大型语言模型 (LLM)：原理、应用与实践指南

2025年大模型前沿架构：量化创新深度解析

基于FastAPI与RAG的电商智能聊天机器人：从入门到实践

LLM赋能：一个Spring Boot应用如何替代五个微服务API？

大模型推理的幻觉：Apple揭示AI“思考”的局限性

You Missed

大型语言模型 (LLM)：原理、应用与实践指南

大型语言模型 (LLM)：原理、应用与实践指南

2025年大模型前沿架构：量化创新深度解析

2025年大模型前沿架构：量化创新深度解析

基于FastAPI与RAG的电商智能聊天机器人：从入门到实践

基于FastAPI与RAG的电商智能聊天机器人：从入门到实践

LLM赋能：一个Spring Boot应用如何替代五个微服务API？

LLM赋能：一个Spring Boot应用如何替代五个微服务API？