C-Eval 排行榜
主要用于展示不同大语言模型(LLMs)在多层次、多学科中文任务中的综合能力排名。
主要用于展示不同大语言模型(LLMs)在多层次、多学科中文任务中的综合能力排名。
GPT-OSS AI平台基于OpenAI开源模型,提供GPT-OSS 120B和20B两种模型选择,分别侧重快速响应与深度推理。平台具备企业级安全标准、全球快速访问和无等待即时使用的特点,适合内容创作、编程、数据分析等多种专业场景。
DeepSeek Online免费开源的AI模型,拥有671亿参数,专为文本生成设计。https://www.deepseekv3.net
吐司TusiArt是一个专注于AI图像生成和模型分享的AIGC平台。它提供文生图、图生图、模型训练、图像编辑等功能,支持动漫、国风、现实等多种艺术风格。平台每日提供免费算力,无需本地显卡,适合创作者、设计师和爱好者快速生成高质量图像并参与社区互动。
MMBench 的官方排行榜页面,由 OpenCompass 社区维护。
言笔AI是一款在线智能写作平台,提供学术论文、商业计划书、营销文案等20多种场景的AI内容生成。支持多语言改写润色、语法检查与查重降重,内置170多个专业模板,帮助用户高效完成写作任务。
HELM是由斯坦福大学推出的大模型评测体系,该评测方法主要包括场景、适配、指标三个模块,每次评测的运行都需要指定一个场景,一个适配模型的提示,以及一个或多个指标。
元象XChat是基于自研XVERSE-65B-2大模型的AI助手,在中文处理上表现突出。它提供文本创作、多语言翻译、知识问答和代码生成等功能,适用于营销、办公、客服、编程及教育等多种场景。用户可通过网页免费试用,开发者也可获取开源资源进行集成。
OpenCompass LLM排行榜是一个开源的大语言模型评估平台,提供超过100个数据集的基准测试,涵盖知识、逻辑、数学、代码等维度。榜单实时更新,展示GPT-4、Claude、Qwen等开源与商业模型的综合性能排名,为研究者和开发者提供客观的模型选择参考。
万联摩尔是面向全产业的AI大模型平台,覆盖97个行业大类。平台提供产业知识问答、AI研报创作、价格预测和企业洞察等功能,帮助金融分析师、研究员和企业决策者基于可信数据高效工作,支持从数据查询到报告输出的全流程。