CMMLU— 一个综合性的大模型中文评估基准

aineuos
2025年5月27日
AI模型评测

CMMLU— 一个综合性的大模型中文评估基准

访问: 139

CMMLU是一个综合性的中文评估基准，专门用于评估语言模型在中文语境下的知识和推理能力，涵盖了从基础学科到高级专业水平的67个主题。它包括：需要计算和推理的自然科学，需要知识的人文科学和社会科学，以及需要生活常识的中国驾驶规则等。此外，CMMLU中的许多任务具有中国特定的答案，可能在其他地区或语言中并不普遍适用。因此是一个完全中国化的中文测试基准。

版权声明：本站所有文章版权均归AiNeuOS所有，任何个人、媒体、网站、团体等注明来源后均可以转载。但是不得在非我站的服务器上建立镜像，否则，我站将依法保留追究相关法律责任的权利。

关注公众号：

上一篇

MMBench—全方位的多模态大模型能力评测体系

下一篇

OpenCompass—大模型开放评测体系

aineuos

要发表评论，您必须先登录。