大模型“知之为知之,不知为不知”:KnowOrNot助力政府AI应用识别知识边界
在政府服务领域部署人工智能(AI)聊天机器人正变得日益普遍,但一个关键的挑战是幻觉问题,即AI系统自信地生成听起来合理但实际上不正确的信息。设想一下,一位市民使用政府AI聊天机器人查询新加坡保健储蓄(MediShield)的理赔额度上限。他们问道:“在新加坡,MediShield的每个保单年度的最高理赔额度是多少?”AI回答说:“$150,000。”但实际上,自2025年4月以来,MediShie