HumanEval

HumanEval：对大型语言模型代码生成能力的最严苛考验

llmtrend 2025年3月21日没有评论

HumanEval是OpenAI首次用于评估LLMs代码生成能力的基准之一。这个基准是在2021年由chen等人发表的论文《Evaluating Large Language Models Trained on Code》中引入。

大型语言模型 (LLM)：原理、应用与实践指南

2025年大模型前沿架构：量化创新深度解析

基于FastAPI与RAG的电商智能聊天机器人：从入门到实践

LLM赋能：一个Spring Boot应用如何替代五个微服务API？