跳到内容

夜深了,注意休息,愿你今夜好梦。

K2-上海交通大学

K2-上海交通大学

K2是一个专为地球科学设计的开源大语言模型。它基于LLaMA架构,首先在大量地球科学文献(包括开放获取论文和维基百科)上进行领域预训练,再使用知识密集型指令数据GeoSignal进行微调。在由NPEE和AP地质、地理、环境科学测试组成的GeoBench基准评估中,K2在多项客观与主观任务上表现优于同类参数规模的基线模型。该项目将开源相关代码与数据。

浏览 511 收藏 0 外链点击 0 更新 2026年4月15日
适用地区
全球
适用平台
以官网说明为准
是否免费
以官网与标签为准

什么是K2地球科学大模型?

K2是一个专门为地球科学领域打造的开源大语言模型。它的目标很明确:让AI更懂地质、地理和环境科学。

K2是如何炼成的?

它的训练分两步走。第一步是“打基础”:研究人员收集并清理了大量地球科学文献,包括专业的开放获取论文和维基百科相关页面,用这些资料对通用的LLaMA模型进行了深入的领域预训练。第二步是“精加工”:使用一个名为GeoSignal的知识密集型指令数据集对模型进行微调,让它不仅能理解知识,还能更好地遵循指令、回答问题。

K2表现如何?

为了检验成果,团队用GeoBench作为评测基准。这个基准包含了全国研究生地球科学入学考试(NPEE)和美国大学预修课程(AP)中关于地质学、地理学和环境科学的测试题目。在与参数规模相近的几个基线模型对比中,K2在客观题和需要主观评判的任务上都取得了更好的成绩。

简单说,这个为地球科学“特训”过的模型,在专业领域表现出了更强的能力。目前,K2(7B参数版本)的相关代码和数据正在开源共享中。

发表评论

正文
强调色