AI模型竞技场,实时对比评测
LMArena是加州大学伯克利分校SkyLa…发现全世界 最前沿 的 AI 产品
大模型评测
按分类快速浏览 AI 资源,精选工具持续更新,支持关键词直达检索。
开源大模型性能排行榜
Open LLM Leaderboard 是…多任务语言理解基准评测
Papers with Code平台上的MM…分布式AI计算平台
Anyscale是由Ray框架开发者创建的A…多模态模型性能评估基准
MMBench 的官方排行榜页面,由 Ope…斯坦福大模型标准化评测平台
HELM是由斯坦福大学推出的大模型评测体系,…AGI模型能力公正评测平台
AGI-Eval是由上海交大、同济大学、华东…大模型性能权威评测榜单
OpenCompass LLM排行榜是一个开…智能提示词生成与优化工具
Prompt Llama是一个专注于文本到图…AI驱动的智能测评平台
Ai-Ceping是同济大学王昊奋教授发起的…评估中文AI模型能力排行榜
主要用于展示不同大语言模型(LLMs)在多层…
