Open LLM Leaderboard
Open LLM Leaderboard 是 Hugging Face 上的一个标准化评估平台,用于跟踪、排名和比较各类开源大语言模型与聊天机器人的性能。它通过统一的基准测试(如MMLU、HellaSwag)提供透明、可重现的评估结果,服务于研究人员、开发者和社区用户。平台支持模型提交、数据公开访问与社区讨论,虽然已于2025年3月正式退役,但其历史数据与评估方法仍具参考价值。
Open LLM Leaderboard 是 Hugging Face 上的一个标准化评估平台,用于跟踪、排名和比较各类开源大语言模型与聊天机器人的性能。它通过统一的基准测试(如MMLU、HellaSwag)提供透明、可重现的评估结果,服务于研究人员、开发者和社区用户。平台支持模型提交、数据公开访问与社区讨论,虽然已于2025年3月正式退役,但其历史数据与评估方法仍具参考价值。
Meta Llama官网是获取开源大语言模型LLaMA系列的核心平台。网站提供LLaMA 1/2/3等各版本模型的技术文档、下载资源与API指南,涵盖文本生成、多模态理解、代码生成等多种应用场景,方便开发者和研究人员快速上手与部署。