MMLU基准测试 - 芝麻派AI

Papers with Code平台上的MMLU基准测试页面，实时追踪大规模多任务语言理解领域的最新模型性能排名。页面展示GPT、LLaMA等模型在57个学科任务上的准确率，提供论文与代码链接，是研究人员和开发者跟踪AI语言理解前沿进展的核心工具。

2026年4月15日 489 0

正文

强调色