CMMLU是面向中文语境的综合性评估基准,专注衡量语言模型的中文知识储备与推理能力,覆盖67个从基础学科到高级专业的主题。其任务范畴横跨三类领域:需计算推理的自然科学、需知识沉淀的人文与社会科学、需生活常识的中国驾驶规则等场景。
php语法 CMS网站 DeepSeek 栏目 调用 SEO优化 mysql语法 dedecms建站 AI开源项目 织梦