DeepSeek
DeepSeek(杭州深度求索)自2023年成立以来,快速推出DeepSeekCoder、DeepSeek-V3、DeepSeek-R1等开源大模型。其创新的MoE架构大幅降低推理成本,产品已登陆英伟达NIM平台并上线国家超算互联网。本文梳理公司发展时间线、技术突破与行业合作情况。
DeepSeek(杭州深度求索)自2023年成立以来,快速推出DeepSeekCoder、DeepSeek-V3、DeepSeek-R1等开源大模型。其创新的MoE架构大幅降低推理成本,产品已登陆英伟达NIM平台并上线国家超算互联网。本文梳理公司发展时间线、技术突破与行业合作情况。
腾讯混元是腾讯全链路自研的大模型平台,提供文本、图像、视频、3D资产生成及逻辑推理等AI服务。平台通过腾讯云API面向企业,支持内容创作、企业服务、智能助手等多场景应用,在中文语义理解和多模态交互方面表现突出。
Meta Llama官网是获取开源大语言模型LLaMA系列的核心平台。网站提供LLaMA 1/2/3等各版本模型的技术文档、下载资源与API指南,涵盖文本生成、多模态理解、代码生成等多种应用场景,方便开发者和研究人员快速上手与部署。
北京智源人工智能研究院(BAAI)是一家专注于人工智能基础研究的非营利机构。其官方网站是获取其前沿科研成果(如悟道、Tele-FLM等大模型)、开源工具(如BGE向量模型、FlagOpen平台)以及参与智源大会、智源社区等活动的核心平台。网站为研究者、开发者和产业界提供了丰富的资源与协作机会。
通义万相是阿里云推出的AI创意平台,提供文生图、图生视频、图像风格迁移等核心功能。平台支持多种画风与视频比例,内置结构化提示词库,并设有素材管理与项目集功能。用户每日可获免费灵感值,开发者也可通过API接入服务。
模力方舟(Gitee AI)是开源中国旗下的一站式AI模型服务平台。平台汇集DeepSeek、Qwen2.5、Kolors等主流模型,提供在线体验、推理训练、Serverless API部署及社区支持。面向开发者、研究人员和企业用户,旨在简化AI应用开发流程,降低算力使用门槛。
天壤小白是一个面向开发者和普通用户的大模型应用开发平台。它通过可视化界面和丰富组件,让用户无需编程即可配置提示词、调整引擎,快速创建个性化AI应用。平台内置自研大语言模型及多种参数模型,并提供精准的语义搜索引擎,支持对PDF、Word等文档进行高效检索,旨在提供基于事实的准确回答,减少大模型“幻觉”。
书生(InternLM)是由上海人工智能实验室运营的开源AI平台,提供大语言模型、云端开发环境、多模态工具及科研助手等系列产品。该网站整合了从模型训练、算法开发到实际应用的全流程工具与资源,适合开发者、研究人员及企业用户构建AI解决方案。
GPT-OSS AI平台基于OpenAI开源模型,提供GPT-OSS 120B和20B两种模型选择,分别侧重快速响应与深度推理。平台具备企业级安全标准、全球快速访问和无等待即时使用的特点,适合内容创作、编程、数据分析等多种专业场景。
K2是一个专为地球科学设计的开源大语言模型。它基于LLaMA架构,首先在大量地球科学文献(包括开放获取论文和维基百科)上进行领域预训练,再使用知识密集型指令数据GeoSignal进行微调。在由NPEE和AP地质、地理、环境科学测试组成的GeoBench基准评估中,K2在多项客观与主观任务上表现优于同类参数规模的基线模型。该项目将开源相关代码与数据。