什么是K2地球科学大模型？

K2是一个专门为地球科学领域打造的开源大语言模型。它的目标很明确：让AI更懂地质、地理和环境科学。

K2是如何炼成的？

它的训练分两步走。第一步是“打基础”：研究人员收集并清理了大量地球科学文献，包括专业的开放获取论文和维基百科相关页面，用这些资料对通用的LLaMA模型进行了深入的领域预训练。第二步是“精加工”：使用一个名为GeoSignal的知识密集型指令数据集对模型进行微调，让它不仅能理解知识，还能更好地遵循指令、回答问题。

K2表现如何？

为了检验成果，团队用GeoBench作为评测基准。这个基准包含了全国研究生地球科学入学考试（NPEE）和美国大学预修课程（AP）中关于地质学、地理学和环境科学的测试题目。在与参数规模相近的几个基线模型对比中，K2在客观题和需要主观评判的任务上都取得了更好的成绩。

简单说，这个为地球科学“特训”过的模型，在专业领域表现出了更强的能力。目前，K2（7B参数版本）的相关代码和数据正在开源共享中。

K2-上海交通大学

什么是K2地球科学大模型？

K2是如何炼成的？

K2表现如何？

发表评论取消回复

K2-上海交通大学

什么是K2地球科学大模型？

K2是如何炼成的？

K2表现如何？

相关资源

tensor.art

Monica

DeepSeek

文心一言

LMArena

arize.com

发表评论 取消回复

发表评论取消回复