C-Eval榜单是由清华大学、上海交通大学和爱丁堡大学合作构建的面向中文语言模型的综合性考试评测集,涵盖52个不同学科,共有13948道多项选择题,是目前较为权威的中文AI大模型评测榜单。CMMLU数据集则是一个综合性的中文评估基准,由MBZUAI、上海交通大学、微软亚洲研究院共同推出,在评估语言模型在中文语境下的知识和推理能力方面极具权威性。
相关:
国际学生在上海体验中医药传统文化的魅力 中新网上海10月15日电 (记者 陈静)来自22个国家的50名国际中医药文化爱好者15日汇聚上海中医药大学校园,在有趣的游戏中探索中医药文化的美丽。这些学生中逾半数来自“一带一路”共建国家。 留学生体验中..
云南怒江老姆登茶从“云”中来香飘茶博会 中新网昆明10月15日电 (陈静)“与大部分海拔1000米左右的高山茶不同,老姆登茶的核心种植区海拔达1800米左右,最高达2400多米,书写了中国茶的‘新高度’。”15日,云南省怒江州政府副州长冯逆光在第十五届云..