基准测试 - 芝麻派AI

OpenCompass LLM排行榜是一个开源的大语言模型评估平台，提供超过100个数据集的基准测试，涵盖知识、逻辑、数学、代码等维度。榜单实时更新，展示GPT-4、Claude、Qwen等开源与商业模型的综合性能排名，为研究者和开发者提供客观的模型选择参考。

2026年4月15日 421 0

正文

强调色