Ai-Ceping
Ai-Ceping是同济大学王昊奋教授发起的大语言模型评测平台,由多所高校教授指导,致力于提供权威、公正、透明的评测数据收集与分析服务。
Ai-Ceping是同济大学王昊奋教授发起的大语言模型评测平台,由多所高校教授指导,致力于提供权威、公正、透明的评测数据收集与分析服务。
主要用于展示不同大语言模型(LLMs)在多层次、多学科中文任务中的综合能力排名。
MMBench 的官方排行榜页面,由 OpenCompass 社区维护。
HELM是由斯坦福大学推出的大模型评测体系,该评测方法主要包括场景、适配、指标三个模块,每次评测的运行都需要指定一个场景,一个适配模型的提示,以及一个或多个指标。