aineuos2025年5月27日AI模型评测 SuperCLUE—中文通用大模型综合性测评基准开始使用 SuperCLUE 是一个中文通用大模型综合性评测基准,从三个不同的维度评价模型的能力:基础能力、专 阅读更多
aineuos2025年5月27日AI模型评测 AGI-Eval—AI大模型评测社区开始使用 AGI-Eval是什么 AGI-Eval是上海交通大学、同济大学、华东师范大学、DataWhale等 阅读更多
aineuos2025年5月27日AI模型评测 OpenCompass—大模型开放评测体系开始使用 OpenCompass是由上海人工智能实验室(上海AI实验室)于2023年8月正式推出的大模型开放评 阅读更多
aineuos2025年5月27日AI模型评测 CMMLU— 一个综合性的大模型中文评估基准开始使用 CMMLU是一个综合性的中文评估基准,专门用于评估语言模型在中文语境下的知识和推理能力,涵盖了从基础 阅读更多
aineuos2025年5月27日AI模型评测 MMBench—全方位的多模态大模型能力评测体系开始使用 MMBench是一个多模态基准测试,由上海人工智能实验室、南洋理工大学、香港中文大学、新加坡国立大学 阅读更多
aineuos2025年5月27日AI模型评测 H2O EvalGPT—H2O.ai推出的基于Elo评级方法的大模型评估系统开始使用 H2O EvalGPT 是 H2O.ai 用于评估和比较 LLM 大模型的开放工具,它提供了一个平台 阅读更多
aineuos2025年5月26日AI办公工具, AI开源项目 微软开源Data Formulator,使用 AI 创建丰富的可视化使用 AI 迭代转换数据并创建丰富的可视化效果。立即试用 Data Formulator! Data Form 阅读更多