性能排行榜 - 芝麻派AI

Open LLM Leaderboard

开源大模型性能排行榜

Open LLM Leaderboard 是 Hugging Face 上的一个标准化评估平台，用于跟踪、排名和比较各类开源大语言模型与聊天机器人的性能。它通过统一的基准测试（如MMLU、HellaSwag）提供透明、可重现的评估结果，服务于研究人员、开发者和社区用户。平台支持模型提交、数据公开访问与社区讨论，虽然已于2025年3月正式退役，但其历史数据与评估方法仍具参考价值。

大模型大模型评测 Hugging Face Open LLM Leaderboard

2026年4月15日 387 0

Open LLM Leaderboard直连不通，或需科学上网/代理

Open LLM Leaderboard