Fine-tuning Archives

利用数据合成解锁函数调用能力：微调SLM的新思路

llmtrend 2025年6月13日没有评论

函数调用是现代语言模型的一项强大特性，使其能够与外部工具、API和服务无缝交互。然而，确保你的AI助手能够以正确的参数进行正确的函数调用并非易事。本文将深入探讨如何通过数据合成生成高质量的训练数据，从而对小型语言模型（SLM）进行微调，以实现强大的函数调用能力。通过结合Azure Machine Learning (AML) pipeline，可以更高效地实现这一目标。为什么选择微调SLM来实现

Fine-tuning

1000万美元的教训：参数高效微调（PEFT）如何终结大模型“暴力”时代

llmtrend 2025年6月10日没有评论

彭博社斥资 1000 万美元打造金融大模型，却在 GPT-4 问世后黯然失色，这不仅是彭博社的失误，更映射出一种过时的思维模式：唯预算论、唯模型大小论。然而，当大公司们还在 GPU 军备竞赛中投入巨资时，一位爱沙尼亚的开发者却在厨房里用笔记本电脑，通过参数高效微调（PEFT），以 1400 美元的成本，实现了 90% 的性能。这并非天方夜谭，而是 PEFT 正在颠覆大模型领域的真实写照。它预示着，

Fine-tuning

险中求胜：金融大模型炼成记——30天挑战之两周逆袭之路

llmtrend 2025年6月10日没有评论

在金融大模型的训练竞赛中，时间就是生命。本文讲述了作者团队在30天内训练金融领域专属大模型的惊险历程。他们原本计划使用混合专家模型（MoE）架构，结合DeepSpeed优化器，打造一个在CDM、MOF和XBRL领域拥有专业知识的模型。然而，理想很丰满，现实很骨感，由于对DeepSpeed的复杂性理解不足、对专家网络存在误解以及受到硬件的限制，精心设计的方案彻底崩溃。面对困境，他们果断调整策略，最终

Fine-tuning

利用 DeepSpeed 微调 GPT-2：打造你的专属 AI 问答模型

llmtrend 2025年6月10日没有评论

微调语言模型已成为现代 AI 开发中的一项关键技能。本文将带你一步步了解如何使用强大的优化库 DeepSpeed 来微调 GPT-2，从而更高效、更便捷地训练大型模型。我们将详细解读每一行代码，解释相关概念，并展示如何创建你自己的问答模型。 1. 什么是微调？以及为什么要使用 DeepSpeed？微调，顾名思义，是对预训练模型进行精细调整，使其在特定任务或领域表现更出色。想象一下，你已经拥有了

Fine-tuning

四小时打造法律专属AI：使用LoRA微调Mistral大模型实战指南

llmtrend 2025年6月9日没有评论

你想为律师事务所、内部合规部门或法律研究机构构建一款智能聊天机器人吗？你是否已经厌倦了现有大语言模型（LLM）在法律领域“一本正经地胡说八道”，凭空捏造法规，错误解读条款？本文将分享如何利用 LoRA (Low-Rank Adaptation) 技术，在Colab Pro环境下，仅仅花费4小时，对开源 Mistral 大模型进行微调，打造一个高度专业、准确的法律助手。法律领域的需求：超越通用L

Fine-tuning

使用 TensorFlow 和 Hugging Face 微调语言模型：BERT 实战指南

llmtrend 2025年6月8日没有评论

大模型时代，如何让这些庞然大物更好地服务于特定任务？微调 (Fine-tuning) 技术应运而生，它允许我们利用预训练的语言模型，例如 BERT，并通过针对特定任务的数据集进行二次训练，使其在特定领域内表现更出色。本文将以 Kavach Dheer 的文章“How to Fine-Tune Language Models with TensorFlow and Hugging Face”为蓝本，

Fine-tuning

超越基础模型：ChatGPT 与 Claude 微调深度解析（增强版）

llmtrend 2025年6月8日没有评论

通用大语言模型（LLM）正迅速被针对特定用途、经过微调的模型所取代。在对准确性、语气和上下文要求极高的领域，例如医疗保健、金融、法律和政府部门，通用模型往往表现不足。微调弥合了这一差距，它将一个功能强大的基础模型转化为特定领域的专家助手。本文将深入探讨 ChatGPT 和 Claude 这两个最广泛使用的大语言模型，着重分析微调方法、实施技巧、部署注意事项、定价比较以及性能权衡。无论您是构建专业的

Fine-tuning

在小型硬件上微调 Mistral 模型：LoRA 与 Hugging Face 入门指南

llmtrend 2025年6月7日没有评论

曾经，微调一个开源大语言模型（LLM）象征着你拥有强大的算力：诸如 A100 这样的高端 GPU、无限的耐心以及充足的能量饮料。但现在，得益于 LoRA (Low-Rank Adaptation) 技术以及像 Mistral 这样高效的模型家族，即使是在配备了较好 GPU 的笔记本电脑上，你也可以微调自己的语言模型。如果你一直对为特定领域定制语言模型感兴趣 —— 无论是客户支持、法律文档还是小众迷

Fine-tuning

利用LoRA高效微调大型语言模型：一步步Kaggle教程详解

llmtrend 2025年6月3日没有评论

近年来，大型语言模型 (LLM)，如BERT、GPT及其变体，彻底改变了自然语言处理领域的可能性。然而，在特定任务上微调这些庞大的模型往往需要大量的计算资源，成本高昂，特别是当需要重新训练数百万（甚至数十亿）个参数时。幸运的是，LoRA (Low-Rank Adaptation，低秩适应) 技术的出现改变了这一现状。通过在每个Transformer层中注入小的、可训练的低秩分解矩阵，LoRA 能够

Fine-tuning

如何通过微调 OpenAI 模型构建个性化 Node.js 应用：求职面试助手实战

llmtrend 2025年6月2日没有评论

在大模型时代，OpenAI 已经彻底改变了人机交互的方式。想象一下，如果能创建一个像你一样说话，并且能够讨论你的专业经验和技能的个性化聊天机器人，岂不是非常棒？本文将带你一步步微调 OpenAI 模型，使其能够回答关于你的简历和专业背景的问题，并在 Node.js 应用中使用它。构建个性化聊天机器人的意义：效率提升与成本控制在求职过程中，经常会遇到招聘人员反复询问关于经验和技能的常见问题。为了

Fine-tuning

利用数据合成解锁函数调用能力：微调SLM的新思路

利用数据合成解锁函数调用能力：微调SLM的新思路

1000万美元的教训：参数高效微调（PEFT）如何终结大模型“暴力”时代

1000万美元的教训：参数高效微调（PEFT）如何终结大模型“暴力”时代

险中求胜：金融大模型炼成记——30天挑战之两周逆袭之路

险中求胜：金融大模型炼成记——30天挑战之两周逆袭之路

利用 DeepSpeed 微调 GPT-2：打造你的专属 AI 问答模型

利用 DeepSpeed 微调 GPT-2：打造你的专属 AI 问答模型

四小时打造法律专属AI：使用LoRA微调Mistral大模型实战指南

四小时打造法律专属AI：使用LoRA微调Mistral大模型实战指南

使用 TensorFlow 和 Hugging Face 微调语言模型：BERT 实战指南

使用 TensorFlow 和 Hugging Face 微调语言模型：BERT 实战指南

超越基础模型：ChatGPT 与 Claude 微调深度解析（增强版）

超越基础模型：ChatGPT 与 Claude 微调深度解析（增强版）

在小型硬件上微调 Mistral 模型：LoRA 与 Hugging Face 入门指南

在小型硬件上微调 Mistral 模型：LoRA 与 Hugging Face 入门指南

利用LoRA高效微调大型语言模型：一步步Kaggle教程详解

利用LoRA高效微调大型语言模型：一步步Kaggle教程详解

如何通过微调 OpenAI 模型构建个性化 Node.js 应用：求职面试助手实战

如何通过微调 OpenAI 模型构建个性化 Node.js 应用：求职面试助手实战

从预训练到策略优化：大型语言模型 (LLM) 如何实现与人类意图对齐

Spring AI赋能：利用工具调用（Tool Calling）构建更强大的大语言模型应用

2025年值得关注的五大 Agentic AI框架：迎接自主智能新时代

本地部署 DeepSeek-R1：使用 Ollama 轻松驾驭大模型

You Missed

从预训练到策略优化：大型语言模型 (LLM) 如何实现与人类意图对齐

从预训练到策略优化：大型语言模型 (LLM) 如何实现与人类意图对齐

Spring AI赋能：利用工具调用（Tool Calling）构建更强大的大语言模型应用

Spring AI赋能：利用工具调用（Tool Calling）构建更强大的大语言模型应用

AI 内容捷径：为什么过度依赖 AI 写作会损害你的 WordPress 网站 SEO？

2025年值得关注的五大 Agentic AI框架：迎接自主智能新时代

2025年值得关注的五大 Agentic AI框架：迎接自主智能新时代