LLMEval-Med:大模型时代医疗AI的进阶之路——构建更现实、更可靠的临床基准
前言 医疗人工智能(Medical AI)正迎来大模型(LLM)的黄金时代,但其应用也面临着严峻的挑战。医疗领域对精确性和可靠性有着极高的要求,任何细微的错误都可能危及患者的生命。IBM Watson for Oncology 曾推荐不安全的癌症治疗方案,而某些AI影像诊断系统则出现了过高的假阳性率,这些案例都突显了医疗AI在实际应用中的风险。因此,在医疗大模型(Medical LLM)被广泛部署