6 月 2025

Charitra：基于轻量级大模型的教科书问答系统，赋能教育新可能

llmtrend 2025年6月27日没有评论

在教育领域，如何利用大模型技术为学生提供更个性化、更有效的学习辅助？Charitra 项目给出了一个引人注目的答案。该项目构建了一个轻量级的对话式问答系统，专门针对高中社会科学教科书，旨在解决学生在理解教材内容时缺乏个性化辅导和针对性学习工具的问题。Charitra 的核心优势在于其轻量化、本地可微调以及成本效益，本文将深入探讨 Charitra 的技术架构、实现过程以及其在教育领域的潜在价值。

LLM

心理智能：大语言模型真正理解人类的关键缺失层

llmtrend 2025年6月27日没有评论

大语言模型（LLM）在文本生成、代码编写甚至通过医学考试等领域展现出了惊人的能力，但它们仍然在理解人类情感、语气和提供个性化建议方面存在不足。本文将深入探讨心理智能这一关键概念，以及如何通过引入一个仅50字节的心理向量，利用Receptiviti API 生成的分数，从根本上提升LLM的用户理解能力，从而弥补这一缺失的环节，让AI模型真正理解我们。 LLM的理解瓶颈：不仅仅是算力尽管算力不断提升

LLM

AMD 显卡在 Linux 下的大模型奇迹：以 RX 6700XT 为例，ROCm 生态下的 Koboldcpp 性能实测

llmtrend 2025年6月27日没有评论

许多人认为 AMD 显卡，特别是较老的型号，在运行现代小型语言模型 (LLM) 时不如 Nvidia 显卡。这种误解主要源于 AMD 在 Windows 上的 ROCm 支持不足。然而，正如 CUDA 在 Linux 上表现更好一样，Windows 和 Linux 之间的性能差异对于 AMD 来说更加显著。本文将深入探讨如何在 Ubuntu 24.04 系统下，利用 AMD RX 6700XT 显

LLM

2025年，还在为LLM重复调用买单？用Redis和指纹技术构建LLM缓存，刻不容缓！

llmtrend 2025年6月27日没有评论

2025年，大模型（LLM）技术应用如火如荼，如果你的应用仍然没有采用 LLM 缓存策略，那么要么你拥有用不完的资金，要么很快就会因为token消耗殆尽而破产。这绝非危言耸听，而是对当下LLM应用现状的深刻洞察。本文将深入探讨LLM缓存的重要性，并以Redis和指纹技术为例，分享如何构建高效的LLM缓存系统，帮助你显著降低成本，提升效率。 LLM缓存：刻不容缓的成本控制利器想象一下：你一遍又一

LLM

利用 LangChain 构建生成式 AI 应用：链（Chains）与输出解析器（Output Parsers）深度解析

llmtrend 2025年6月27日没有评论

随着大模型技术的飞速发展，如何高效地利用它们构建实际应用成为了关键。本文将深入探讨利用 LangChain 框架构建生成式 AI 应用的核心概念：链（Chains）与输出解析器（Output Parsers）。我们将解析如何使用 LangChain 处理结构化输出，并探讨不同类型的输出解析器，以及如何在 LangChain 中构建链，从而打造更强大的 AI 应用。本文将基于英文文章 “

Prompt

信息的种子：思想模式能否跨越语言模型传递？

llmtrend 2025年6月27日没有评论

一个简单的提示语，可能承载的不仅仅是文字，更可能承载着一个想法的“DNA”。本文将探讨一种引人入胜的可能性：一个最小化的提示语，能否像一颗信息种子，将一个想法的核心传递到一个完全崭新的语境中，甚至在不同的语言模型之间生根发芽。核心概念：信息种子与DNA提示文章的核心在于“信息种子”这个概念，它并非传递完整的、具体的知识，而是传递一种潜力，一种像生物学中的DNA一样，能够在新的环境中展开、生长的

Agent

动态AI Agent编排：ChatGPT与Cloudflare Sandboxes重塑智能体架构

llmtrend 2025年6月27日没有评论

在快速发展的人工智能领域，构建AI基础设施如同追逐一个移动的靶标。许多团队花费数月精心打造的基于LangChain或MCP的连接器，往往在完全部署之前就已经过时。为了保持领先，关键不在于预测下一个重大创新，而是识别现有的模式，这些模式预示着未来的发展方向。目前，一种明显的趋势是构建能够动态创建所需工具的AI系统，而非仅仅使用现有工具，这便是动态AI Agent编排的核心概念。传统架构的局限性传

LLM

Mixture of Experts (MoE)：通往万亿参数模型的智能捷径

llmtrend 2025年6月27日没有评论

在人工智能的狂飙突进中，大模型的规模竞赛似乎永无止境。然而，随着GPT-3等巨型模型的出现，我们逐渐意识到“更大”并不总是“更好”。训练这些动辄拥有数千亿参数的稠密模型，需要天文级别的计算资源，消耗惊人的能源，并带来高昂的成本，已然触及了物理和经济的极限。面对AI模型扩展的危机，一种名为Mixture of Experts (MoE) 的架构应运而生，它以一种优雅且高效的方式，为通往万亿参数模型的

AI News

从“盲信”到“明智”：因果约束学习置换（C-L2D）重塑人机决策

llmtrend 2025年6月27日没有评论

在人工智能（AI）日益融入决策流程的当下，我们正面临一个复杂的问题：当AI与人类专家意见相左时，我们该如何抉择？尤其是在医疗、金融等高风险领域，错误决策可能导致严重后果。这种“人机决策困境”促使我们探索更智能的协作方式。本文将深入探讨学习置换（Learn-to-Defer, L2D）这一AI技术，并进一步提出一种基于因果发现的增强型方法——因果约束学习置换（Causal-Constrained L

AI News

AI赋能食品安全：大模型技术助力危险食品智能检测

llmtrend 2025年6月27日没有评论

每年，全球范围内都会发生数百万起食品召回和污染事件，直接威胁着公众健康。如果能够利用人工智能（AI）技术，在这些潜在的食品安全隐患到达消费者餐桌之前就将其识别出来，将会极大地改善食品安全状况。本文将深入探讨如何利用大模型技术和自然语言处理（NLP），对食品相关事件报告进行自动分析，从而更有效地检测潜在的食品安全风险。这正是Politecnico di Torino 和 JAKALA 的研究团队在

Charitra：基于轻量级大模型的教科书问答系统，赋能教育新可能

Charitra：基于轻量级大模型的教科书问答系统，赋能教育新可能

心理智能：大语言模型真正理解人类的关键缺失层

心理智能：大语言模型真正理解人类的关键缺失层

AMD 显卡在 Linux 下的大模型奇迹：以 RX 6700XT 为例，ROCm 生态下的 Koboldcpp 性能实测

AMD 显卡在 Linux 下的大模型奇迹：以 RX 6700XT 为例，ROCm 生态下的 Koboldcpp 性能实测

2025年，还在为LLM重复调用买单？用Redis和指纹技术构建LLM缓存，刻不容缓！

2025年，还在为LLM重复调用买单？用Redis和指纹技术构建LLM缓存，刻不容缓！

利用 LangChain 构建生成式 AI 应用：链（Chains）与输出解析器（Output Parsers）深度解析

利用 LangChain 构建生成式 AI 应用：链（Chains）与输出解析器（Output Parsers）深度解析

信息的种子：思想模式能否跨越语言模型传递？

信息的种子：思想模式能否跨越语言模型传递？

动态AI Agent编排：ChatGPT与Cloudflare Sandboxes重塑智能体架构

动态AI Agent编排：ChatGPT与Cloudflare Sandboxes重塑智能体架构

Mixture of Experts (MoE)：通往万亿参数模型的智能捷径

Mixture of Experts (MoE)：通往万亿参数模型的智能捷径

从“盲信”到“明智”：因果约束学习置换（C-L2D）重塑人机决策

从“盲信”到“明智”：因果约束学习置换（C-L2D）重塑人机决策

AI赋能食品安全：大模型技术助力危险食品智能检测

AI赋能食品安全：大模型技术助力危险食品智能检测

MatFormer：Gemma 3n背后的算力效率革命，嵌套Transformer引领模型部署新范式

MatFormer：Gemma 3n背后的模型压缩与高效推理利器

大模型：千亿美金背后的秘密，AI革命如何重塑世界

Ilari 协议：构建大模型时代的人机共生关系

Software 3.0：用自然语言重塑编程，人人皆可成为程序员

You Missed

MatFormer：Gemma 3n背后的算力效率革命，嵌套Transformer引领模型部署新范式

MatFormer：Gemma 3n背后的算力效率革命，嵌套Transformer引领模型部署新范式

MatFormer：Gemma 3n背后的模型压缩与高效推理利器

MatFormer：Gemma 3n背后的模型压缩与高效推理利器

大模型：千亿美金背后的秘密，AI革命如何重塑世界

大模型：千亿美金背后的秘密，AI革命如何重塑世界

Ilari 协议：构建大模型时代的人机共生关系

Ilari 协议：构建大模型时代的人机共生关系