大模型评测 - 芝麻派AI

Ai-Ceping

Ai-Ceping是同济大学王昊奋教授发起的大语言模型评测平台，由多所高校教授指导，致力于提供权威、公正、透明的评测数据收集与分析服务。

Ai-Ceping 同济大学大模型评测王昊奋

2026年4月15日 394 0

C-Eval 排行榜

主要用于展示不同大语言模型（LLMs）在多层次、多学科中文任务中的综合能力排名。

大模型评测

2026年4月15日 446 0

MMBench

MMBench 的官方排行榜页面，由 OpenCompass 社区维护。

大模型评测

2026年4月15日 314 0

HELM

HELM是由斯坦福大学推出的大模型评测体系，该评测方法主要包括场景、适配、指标三个模块，每次评测的运行都需要指定一个场景，一个适配模型的提示，以及一个或多个指标。

大模型评测开源项目

2026年4月15日 472 0

正文

强调色