TigerBot是什么

TigerBot是一个能处理多种语言和任务的大规模语言模型。根据公开评测，TigerBot-7B这个版本的表现，达到了OpenAI同规模模型综合性能的96%。这还只是他们的第一个公开版本。

这次开源了哪些内容

他们把一系列探索成果都开放了出来：

模型: 包括TigerBot-7B、TigerBot-7B基础版，以及用于研究的TigerBot-180B版本。
代码: 提供了基本的训练和推理代码。甚至包含用两张显卡就能推理180B大模型的量化和推理方案。
数据: 开源了100G的预训练数据，这些是从2TB原始数据里清洗、去噪、去重后得到的精华。还有1G（约100万条）的监督微调数据，覆盖了用户指令中常见的10个大类、120个小类任务。
API: 提供了聊天、插件、微调等接口，目标是让用户不用写代码，在半小时内就能训练和使用属于自己的大模型。
领域数据: 特别包含了金融、法律、百科等领域的资料，邀请开发者一起打造专业级的应用。

团队在BLOOM模型的基础上，从架构到算法都进行了改进：