今日AI领域迎来两项重磅进展:深度求索公司正式发布DeepSeek-V3大模型,在多项基准测试中展现强劲实力;Meta则开源了Llama 3.2系列模型,进一步推动开源生态发展。这两项进展标志着大模型竞争进入新阶段,开源与闭源路线并行发展。
DeepSeek-V3发布,性能对标行业领先者
据深度求索官方公告,DeepSeek-V3今日正式发布。该模型在MMLU、GPQA、MATH等多项学术基准测试中表现优异,部分指标接近或达到GPT-4o水平。DeepSeek-V3采用混合专家架构,支持128K上下文长度,在代码生成、数学推理和中文理解方面有显著提升。公司同时宣布将通过API和开源方式提供模型访问,继续坚持“技术普惠”理念。
Meta开源Llama 3.2系列,包含多尺寸版本

据Meta AI官方博客报道,公司今日开源了Llama 3.2系列模型,包含3B、7B、70B和405B四种参数规模版本。其中405B版本在多项评测中表现突出,特别是在推理和代码任务上。Meta表示,所有模型均采用宽松许可证发布,允许商业使用,并提供了详细的训练数据和流程文档。这一举措将进一步降低企业使用大模型的门槛,推动AI应用创新。
行业观察:开源与商业化并行发展
今日的两项发布反映了当前AI行业的两个重要趋势:一方面是闭源模型在性能上持续突破,通过API服务实现商业化;另一方面是开源生态不断壮大,降低技术使用门槛。DeepSeek-V3的发布显示中国AI公司在基础模型研发上已具备国际竞争力,而Meta的开源策略则继续推动着全球AI民主化进程。未来,我们可能会看到更多公司在性能与开放性之间寻找平衡,推动AI技术更广泛地赋能各行各业。