LLM-as-a-Judge

利用 LLM-as-a-Judge 提升威胁情报质量：SentrySearch 的实践之路

llmtrend 2025年6月7日没有评论

大模型技术（LLM）的应用场景日益广泛，如何有效评估其输出质量成为关键。本文将深入探讨 SentrySearch 如何通过 LLM-as-a-Judge 评估体系，结合智能提示（Smart Prompting）和迭代评分（Iterative Scoring），显著提升其生成的威胁情报质量，使其从一个基础的生成器演变为一个能够自我改进的威胁情报平台。我们将着重分析 SentrySearch 的实践经

LLM Evaluation

构建和验证LLM作为裁判的实践指南

llmtrend 2025年2月28日没有评论

LLM-as-a-Judge系统的核心思想是利用一个LLM来评估另一个LLM的输出。这种方法的优势在于，它能够提供一个相对客观和一致的评价标准，从而帮助开发者和研究人员理解模型的性能，并指导他们进行改进。LLM-as-a-Judge系统为AI评估提供了一种新的视角

LLM-as-a-Judge

利用 LLM-as-a-Judge 提升威胁情报质量：SentrySearch 的实践之路

利用 LLM-as-a-Judge 提升威胁情报质量：SentrySearch 的实践之路

构建和验证LLM作为裁判的实践指南

从预训练到策略优化：大型语言模型 (LLM) 如何实现与人类意图对齐

Spring AI赋能：利用工具调用（Tool Calling）构建更强大的大语言模型应用

2025年值得关注的五大 Agentic AI框架：迎接自主智能新时代

本地部署 DeepSeek-R1：使用 Ollama 轻松驾驭大模型

You Missed

从预训练到策略优化：大型语言模型 (LLM) 如何实现与人类意图对齐

从预训练到策略优化：大型语言模型 (LLM) 如何实现与人类意图对齐

Spring AI赋能：利用工具调用（Tool Calling）构建更强大的大语言模型应用

Spring AI赋能：利用工具调用（Tool Calling）构建更强大的大语言模型应用

AI 内容捷径：为什么过度依赖 AI 写作会损害你的 WordPress 网站 SEO？

2025年值得关注的五大 Agentic AI框架：迎接自主智能新时代

2025年值得关注的五大 Agentic AI框架：迎接自主智能新时代